Алі випустила нове покоління базової моделі QianWen 3.5, піднявшись на вершину світового рейтингу найпотужніших відкритих великих моделей

robot
Генерація анотацій у процесі

16 лютого, у день зустрічі Нового року за місячним календарем, Alibaba відкрила вихідний код новітньої генерації великої моделі Qwen3.5-Plus, яка за продуктивністю конкурує з Gemini 3 Pro і посідає перше місце у світі серед відкритих моделей.

За інформацією, Qwen3.5 здійснив повну революцію у базовій архітектурі моделі. Версія Qwen3.5-Plus, яка була випущена, має 3970 мільярдів параметрів, активовано лише 170 мільярдів, її продуктивність перевищує модель Qwen3-Max з трильйонами параметрів, використання відеопам’яті при розгортанні зменшено на 60%, швидкість обчислень значно підвищена, а максимальна пропускна здатність для обчислень зросла до 19 разів. Ціна API для Qwen3.5-Plus становить всього 0,8 юаня за мільйон токенів, що в 18 разів дешевше за Gemini 3 Pro.

На відміну від попередніх поколінь великих мовних моделей Qwen, Qwen3.5 здійснив перехід від чисто текстової моделі до нативної мультимодальної моделі. Qwen3 був попередньо натренований на чистих текстових токенах, тоді як Qwen3.5 базується на попередньому навчанні з використанням візуальних і текстових змішаних токенів, а також значно додано даних китайською, англійською, багатомовних, STEM та для логічних висновків. Це дозволило великій моделі з “відкритими очима” засвоїти більш глибокі знання про світ і логіку висновків, досягти високої продуктивності з менш ніж 40% параметрів у порівнянні з базовою моделлю Qwen3-Max з трильйонами параметрів, і показати відмінні результати у всіх основних бенчмарках, таких як висновки, програмування та агентські системи.

15 січня додаток Qwen був випущений як перший у світі комерційний AI-агент для покупок. Під час святкового періоду, за 6 днів, AI-покупець Qwen допоміг користувачам оформити 120 мільйонів замовлень, що стало першим у світі масштабним виконанням реальних завдань і комерційною перевіркою. Завдяки значному покращенню можливостей агента, Qwen3.5 відкриє нові горизонти для застосування додатку Qwen у роботі та житті.

З моменту відкриття коду у 2023 році, Alibaba випустила понад 400 моделей Qwen різних розмірів і модальностей. Загальна кількість завантажень Qwen у світі перевищила 1 мільярд, а місячний обсяг завантажень у 2-8 разів перевищує суму завантажень DeepSeek, Meta, OpenAI, Zhitu, Kimi, MiniMax та інших. Похідні моделі, створені розробниками на базі Qwen, налічують понад 200 000, що робить її найпопулярнішою у світі відкритою моделлю та найзручнішою для розробників. Враховуючи потреби AI-розробників і компаній у різних країнах, модель Qwen постійно удосконалюється: Qwen3.5 підтримує 201 мову, розмір словника збільшено з 150 000 до 250 000, що дозволяє підвищити ефективність кодування для малих мов до 60%.

Зазначається, що додатки Qwen та ПК-версія вже першими отримали доступ до моделі Qwen3.5-Plus. Розробники можуть завантажити нову модель у спільноті Modao та HuggingFace або отримати API через Alibaba Cloud Bailing. Незабаром Alibaba продовжить відкривати моделі серії Qwen3.5 різних розмірів і функцій. Також незабаром буде випущена флагманська модель Qwen3.5-Max з ще більш високою продуктивністю.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити