Модель DeepSeek-V3.2-Exp офіційно випущена та стала з відкритим кодом
ChainCatcher повідомляє, що модель DeepSeek-V3.2-Exp сьогодні офіційно випущена та стала відкритим кодом. Модель впроваджує архітектуру розрідженого Attention, яка дозволяє ефективно знизити споживання обчислювальних ресурсів і підвищити ефективність інференсу моделі. Наразі ця модель вже офіційно доступна на платформі Huawei Cloud MaaS (Model as a Service). Для моделі DeepSeek-V3.2-Exp Huawei Cloud продовжує використовувати велику EP паралельну схему розгортання, базуючись на структурі розрідженого Attention, що дозволяє реалізувати стратегію контекстної паралельності для довгих послідовностей, одночасно забезпечуючи низьку затримку та високу пропускну здатність моделі.
Відмова від відповідальності: зміст цієї статті відображає виключно думку автора і не представляє платформу в будь-якій якості. Ця стаття не повинна бути орієнтиром під час прийняття інвестиційних рішень.
Вас також може зацікавити
Jupiter: Публічний продаж WET буде відкладено на 10 хвилин і розпочнеться о 23:10
Bitget запустив USDT-маржинальні STABLE безстрокові контракти з кредитним плечем від 1 до 25 разів
