Alibaba выпустила новое поколение базовой модели QianWen 3.5, заняв вершину в рейтинге самых мощных открытых моделей в мире

16 февраля, в день китайского Нового года, Alibaba открыла исходный код нового поколения большой модели Qwen3.5-Plus, чья производительность сопоставима с Gemini 3 Pro, и которая заняла первое место среди самых мощных открытых моделей в мире.

Сообщается, что Qwen3.5 реализовал полную революцию в архитектуре базовой модели. Версия Qwen3.5-Plus, выпущенная недавно, содержит 397 миллиардов параметров, активных — всего 17 миллиардов, при этом превосходит по производительности модель Qwen3-Max с триллионами параметров. Объем памяти для развертывания снижен на 60 %, значительно увеличена эффективность вывода, максимальная пропускная способность при выводе увеличена до 19 раз. Цена API для Qwen3.5-Plus составляет всего 0,8 юаня за миллион токенов, что в 18 раз дешевле Gemini 3 Pro.

В отличие от предыдущих поколений больших языковых моделей Qwen, Qwen3.5 осуществил переход от чисто текстовой модели к нативной мультимодальной модели. Предварительное обучение Qwen3 было проведено на чистых текстовых токенах, тогда как Qwen3.5 обучался на смешанных визуальных и текстовых токенах, а также значительно расширил набор данных на китайском, английском и других языках, включая STEM и логические задачи. Это позволило модели с меньшим количеством параметров — менее 40 % от параметров Qwen3-Max — достигнуть выдающихся результатов в области вывода, программирования и интеллектуальных агентов, демонстрируя превосходные показатели во всех тестах.

15 января приложение Qwen выпустило первый в мире потребительский AI-агент для покупок. В период праздников, за 6 дней, AI-помощник Qwen помог пользователям выполнить 120 миллионов заказов, впервые в мире реализовав масштабное выполнение реальных задач и коммерческую проверку. Усиленные возможности агента в Qwen3.5 расширяют возможности приложения Qwen для помощи в работе и повседневной жизни.

С момента открытия исходного кода в 2023 году Alibaba выпустила более 400 моделей Qwen, охватывающих все размеры и мультимодальные форматы. Общее число загрузок Qwen по всему миру превысило 1 миллиард, а месячный показатель загрузок превышает сумму загрузок DeepSeek, Meta, OpenAI, ZhizhiPu, Kimi и MiniMax, составляя от 2 до 8 раз больше. Более 200 тысяч моделей, созданных разработчиками на базе Qwen, признаны крупнейшими в мире открытыми моделями и являются самыми дружественными к разработчикам. В ответ на потребности разработчиков и предприятий из разных стран, модели Qwen продолжают развиваться: Qwen3.5 поддерживает 201 язык, расширил словарь с 150 тысяч до 250 тысяч слов, что повышает эффективность кодирования для малых языков до 60 %.

Сообщается, что приложения Qwen и версии для ПК уже первыми получили доступ к модели Qwen3.5-Plus. Разработчики могут скачать новую модель на платформах Moka Community и HuggingFace или получить API через Alibaba Cloud Balian. В ближайшее время Alibaba продолжит открывать исходный код моделей серии Qwen3.5 разных размеров и функций. Также скоро будет выпущена флагманская модель Qwen3.5-Max с еще более высокой производительностью.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить