Cada día AI noticias rápidas, el 16 de febrero, Alibaba Qianwen lanzó oficialmente Qwen3.5 y presentó la versión de peso abierto del primer modelo de la serie Qwen3.5, Qwen3.5-397B-A17B. Este modelo utiliza una arquitectura híbrida innovadora que combina atención lineal (Redes Delta con compuerta) y expertos híbridos dispersos (MoE), logrando una eficiencia de razonamiento sobresaliente: un total de 397 mil millones de parámetros, activando solo 17 mil millones de parámetros en cada pasada hacia adelante, manteniendo la capacidad mientras optimiza la velocidad y el costo.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Ali lanza oficialmente la nueva generación de grandes modelos Qwen3.5
Cada día AI noticias rápidas, el 16 de febrero, Alibaba Qianwen lanzó oficialmente Qwen3.5 y presentó la versión de peso abierto del primer modelo de la serie Qwen3.5, Qwen3.5-397B-A17B. Este modelo utiliza una arquitectura híbrida innovadora que combina atención lineal (Redes Delta con compuerta) y expertos híbridos dispersos (MoE), logrando una eficiencia de razonamiento sobresaliente: un total de 397 mil millones de parámetros, activando solo 17 mil millones de parámetros en cada pasada hacia adelante, manteniendo la capacidad mientras optimiza la velocidad y el costo.