Bitget App
Trade smarter
Kup kryptoRynkiHandelFuturesEarnWeb3CentrumWięcej
Handel
Spot
Kupuj i sprzedawaj krypto
Margin
Zwiększ swój kapitał i wydajność środków
Onchain
Korzyści Onchain bez wchodzenia na blockchain
Konwersja i handel blokowy
Konwertuj kryptowaluty jednym kliknięciem i bez opłat
Odkryj
Launchhub
Zdobądź przewagę na wczesnym etapie i zacznij wygrywać
Kopiuj
Kopiuj wybitnego tradera jednym kliknięciem
Boty
Prosty, szybki i niezawodny bot handlowy AI
Handel
Kontrakty futures zabezpieczone USDT
Kontrakty futures rozliczane w USDT
Kontrakty futures zabezpieczone USDC
Kontrakty futures rozliczane w USDC
Kontrakty futures zabezpieczone monetami
Kontrakty futures rozliczane w kryptowalutach
Odkryj
Przewodnik po kontraktach futures
Podróż po handlu kontraktami futures – od początkującego do zaawansowanego
Promocje kontraktów futures
Czekają na Ciebie wysokie nagrody
Bitget Earn
Najróżniejsze produkty do pomnażania Twoich aktywów
Simple Earn
Dokonuj wpłat i wypłat w dowolnej chwili, aby uzyskać elastyczne zyski przy zerowym ryzyku
On-chain Earn
Codzienne zyski bez ryzykowania kapitału
Strukturyzowane produkty Earn
Solidna innowacja finansowa pomagająca poruszać się po wahaniach rynkowych
VIP i Wealth Management
Usługi premium do inteligentnego zarządzania majątkiem
Pożyczki
Elastyczne pożyczanie z wysokim bezpieczeństwem środków
Alibaba wprowadza bardziej wydajny model sztucznej inteligencji Qwen3-Next

Alibaba wprowadza bardziej wydajny model sztucznej inteligencji Qwen3-Next

金色财经金色财经2025/09/11 22:32
Pokaż oryginał

Jinse Finance poinformowało, że Tongyi Qianwen, należący do Alibaba, opublikował nową generację architektury modelu bazowego Qwen3-Next oraz udostępnił open source serię modeli Qwen3-Next-80B-A3B opartych na tej architekturze. W porównaniu do architektury MoE modelu Qwen3, wprowadzono następujące kluczowe ulepszenia: hybrydowy mechanizm uwagi, wysoko rzadką strukturę MoE, szereg optymalizacji przyjaznych dla stabilności treningu oraz mechanizm przewidywania wielu tokenów zwiększający wydajność wnioskowania. Na bazie architektury Qwen3-Next, Alibaba wytrenowała model Qwen3-Next-80B-A3B-Base, który posiada 80 miliardów parametrów, z czego aktywowanych jest jedynie 3 miliardy. Model bazowy osiąga wydajność zbliżoną lub nawet nieco lepszą niż gęsty model Qwen3-32B, przy czym koszt treningu (GPU hours) stanowi mniej niż jedną dziesiątą kosztu Qwen3-32B, a przepustowość wnioskowania przy kontekście powyżej 32k jest ponad dziesięciokrotnie wyższa niż w przypadku Qwen3-32B, osiągając wyjątkową efektywność kosztową zarówno w treningu, jak i wnioskowaniu.

0

Zastrzeżenie: Treść tego artykułu odzwierciedla wyłącznie opinię autora i nie reprezentuje platformy w żadnym charakterze. Niniejszy artykuł nie ma służyć jako punkt odniesienia przy podejmowaniu decyzji inwestycyjnych.

PoolX: Stakuj, aby zarabiać
Nawet ponad 10% APR. Zarabiaj więcej, stakując więcej.
Stakuj teraz!