Le modèle DeepSeek-V3.2-Exp est officiellement publié et open source.
ChainCatcher rapporte que le modèle DeepSeek-V3.2-Exp a été officiellement lancé et open source aujourd'hui. Le modèle introduit une architecture Attention clairsemée, qui permet de réduire efficacement la consommation de ressources informatiques et d'améliorer l'efficacité de l'inférence du modèle. Actuellement, ce modèle est officiellement disponible sur la plateforme MaaS (Model as a Service) de Huawei Cloud. Pour le modèle DeepSeek-V3.2-Exp, Huawei Cloud continue d'utiliser la solution de déploiement EP parallèle à grande échelle, en superposant une stratégie de parallélisme contextuel adaptée aux longues séquences basée sur la structure Attention clairsemée, tout en équilibrant la latence du modèle et les performances de débit.
Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.
Vous pourriez également aimer
Le token BIO de Bio Protocol est désormais disponible sur BNB Chain
Stable dévoile son modèle économique de jeton : offre totale de 100 milliards de tokens, avec 10 % alloués à la genèse
Kalshi a officiellement terminé un tour de financement de série E de 1,1 milliard de dollars, mené par Paradigm.
