Selon les dernières nouvelles de Yi Jing AI, le 16 février, Alibaba Qianwen a officiellement lancé Qwen3.5, ainsi que la version de poids ouverte du premier modèle de la série Qwen3.5, Qwen3.5-397B-A17B. Ce modèle utilise une architecture hybride innovante, combinant l’attention linéaire (Gated Delta Networks) et les experts mixtes creux (MoE), pour une efficacité de raisonnement exceptionnelle : un total de 3970 milliards de paramètres, avec seulement 170 milliards de paramètres activés à chaque propagation avant, optimisant ainsi la vitesse et le coût tout en conservant la capacité.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Alibaba a officiellement lancé la nouvelle génération de grand modèle Qwen3.5
Selon les dernières nouvelles de Yi Jing AI, le 16 février, Alibaba Qianwen a officiellement lancé Qwen3.5, ainsi que la version de poids ouverte du premier modèle de la série Qwen3.5, Qwen3.5-397B-A17B. Ce modèle utilise une architecture hybride innovante, combinant l’attention linéaire (Gated Delta Networks) et les experts mixtes creux (MoE), pour une efficacité de raisonnement exceptionnelle : un total de 3970 milliards de paramètres, avec seulement 170 milliards de paramètres activés à chaque propagation avant, optimisant ainsi la vitesse et le coût tout en conservant la capacité.