Cada notícia rápida do AI de Hoje, em 16 de fevereiro, a Alibaba Qianwen lançou oficialmente o Qwen3.5 e lançou a versão de peso aberto do primeiro modelo da série Qwen3.5, Qwen3.5-397B-A17B. Este modelo utiliza uma arquitetura híbrida inovadora, combinando atenção linear (Gated Delta Networks) com especialistas esparsos mistos (MoE), alcançando uma eficiência de raciocínio excelente: um total de 397 bilhões de parâmetros, ativando apenas 17 bilhões de parâmetros por passagem direta, mantendo a capacidade enquanto otimiza velocidade e custo.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Alibaba lança oficialmente a nova geração de grandes modelos Qwen3.5
Cada notícia rápida do AI de Hoje, em 16 de fevereiro, a Alibaba Qianwen lançou oficialmente o Qwen3.5 e lançou a versão de peso aberto do primeiro modelo da série Qwen3.5, Qwen3.5-397B-A17B. Este modelo utiliza uma arquitetura híbrida inovadora, combinando atenção linear (Gated Delta Networks) com especialistas esparsos mistos (MoE), alcançando uma eficiência de raciocínio excelente: um total de 397 bilhões de parâmetros, ativando apenas 17 bilhões de parâmetros por passagem direta, mantendo a capacidade enquanto otimiza velocidade e custo.