16 лютого, у день китайського Нового року, Alibaba відкрила вихідний код новітньої генерації великої моделі Qwen3.5-Plus, яка за продуктивністю конкурує з Gemini 3 Pro і посідає перше місце серед найпотужніших відкритих моделей у світі.
За інформацією, Qwen3.5 здійснив повну революцію у базовій архітектурі моделі. Версія Qwen3.5-Plus, яка була випущена, має загалом 3970 мільярдів параметрів, активовано лише 170 мільярдів, її продуктивність перевищує модель Qwen3-Max з понад трильйоном параметрів, а обсяг пам’яті для розгортання зменшено на 60%, що значно підвищує швидкість обчислень, а максимальна пропускна здатність для розрахунків може бути збільшена до 19 разів. Ціна API для Qwen3.5-Plus становить всього 0,8 юаня за мільйон токенів, що в 18 разів дешевше, ніж Gemini 3 Pro.
На відміну від попередніх поколінь великих мовних моделей Qwen, Qwen3.5 здійснив перехід від чисто текстової моделі до нативної мультимодальної моделі. Qwen3 був попередньо натренований на чистих текстових токенах, тоді як Qwen3.5 базується на попередньому навчанні з використанням візуальних і текстових змішаних токенів, а також значно додано даних китайською, англійською, багатомовних, STEM та логічних задач, що дозволило великій моделі з «відкритими очима» засвоїти більш глибокі знання світу та логіку розуміння. За менш ніж 40% параметрів вона досягає високих показників у понад трильйон Qwen3-Max, демонструючи відмінну продуктивність у всіх тестах — від розуміння, програмування до агентів штучного інтелекту.
15 січня додаток Qwen був випущений з першим у світі споживчим AI-агентом для покупок. Під час святкового періоду цей агент допоміг користувачам виконати 120 мільйонів замовлень за 6 днів, що стало першим у світі масштабним застосуванням реальних завдань і комерційною перевіркою. Завдяки значному покращенню можливостей агентів, Qwen3.5 відкриває нові горизонти для застосування додатку Qwen у роботі та житті.
З моменту відкриття коду у 2023 році Alibaba випустила понад 400 моделей Qwen, що охоплюють усі розміри та модальності. Загальна кількість завантажень Qwen у світі перевищила 1 мільярд, а місячний обсяг завантажень у 2-8 разів перевищує суму завантажень DeepSeek, Meta, OpenAI, Zhitu, Kimi, MiniMax та інших. Більше 200 000 моделей, створених на базі Qwen, розроблено розробниками, що робить її найпопулярнішою та найзручнішою відкритою моделлю у світі. Враховуючи потреби AI-розробників та підприємств у різних країнах, модель Qwen постійно удосконалюється: Qwen3.5 підтримує 201 мову, розмір словника збільшено з 150 000 до 250 000, що дозволяє підвищити ефективність кодування для малих мов до 60%.
Зазначається, що додаток Qwen та ПК-версія вже одразу інтегрували модель Qwen3.5-Plus. Розробники можуть завантажити нову модель у спільноті Модіа або на HuggingFace, або отримати API-сервіс безпосередньо через Alibaba Cloud Bailing. Незабаром Alibaba продовжить відкривати код моделей серії Qwen3.5 різних розмірів і функцій. Також незабаром буде випущена флагманська модель Qwen3.5-Max з ще більшою продуктивністю.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Алі випустила нове покоління базової моделі QianWen 3.5, піднявшись на вершину світового рейтингу найпотужніших відкритих великих моделей
16 лютого, у день китайського Нового року, Alibaba відкрила вихідний код новітньої генерації великої моделі Qwen3.5-Plus, яка за продуктивністю конкурує з Gemini 3 Pro і посідає перше місце серед найпотужніших відкритих моделей у світі.
За інформацією, Qwen3.5 здійснив повну революцію у базовій архітектурі моделі. Версія Qwen3.5-Plus, яка була випущена, має загалом 3970 мільярдів параметрів, активовано лише 170 мільярдів, її продуктивність перевищує модель Qwen3-Max з понад трильйоном параметрів, а обсяг пам’яті для розгортання зменшено на 60%, що значно підвищує швидкість обчислень, а максимальна пропускна здатність для розрахунків може бути збільшена до 19 разів. Ціна API для Qwen3.5-Plus становить всього 0,8 юаня за мільйон токенів, що в 18 разів дешевше, ніж Gemini 3 Pro.
На відміну від попередніх поколінь великих мовних моделей Qwen, Qwen3.5 здійснив перехід від чисто текстової моделі до нативної мультимодальної моделі. Qwen3 був попередньо натренований на чистих текстових токенах, тоді як Qwen3.5 базується на попередньому навчанні з використанням візуальних і текстових змішаних токенів, а також значно додано даних китайською, англійською, багатомовних, STEM та логічних задач, що дозволило великій моделі з «відкритими очима» засвоїти більш глибокі знання світу та логіку розуміння. За менш ніж 40% параметрів вона досягає високих показників у понад трильйон Qwen3-Max, демонструючи відмінну продуктивність у всіх тестах — від розуміння, програмування до агентів штучного інтелекту.
15 січня додаток Qwen був випущений з першим у світі споживчим AI-агентом для покупок. Під час святкового періоду цей агент допоміг користувачам виконати 120 мільйонів замовлень за 6 днів, що стало першим у світі масштабним застосуванням реальних завдань і комерційною перевіркою. Завдяки значному покращенню можливостей агентів, Qwen3.5 відкриває нові горизонти для застосування додатку Qwen у роботі та житті.
З моменту відкриття коду у 2023 році Alibaba випустила понад 400 моделей Qwen, що охоплюють усі розміри та модальності. Загальна кількість завантажень Qwen у світі перевищила 1 мільярд, а місячний обсяг завантажень у 2-8 разів перевищує суму завантажень DeepSeek, Meta, OpenAI, Zhitu, Kimi, MiniMax та інших. Більше 200 000 моделей, створених на базі Qwen, розроблено розробниками, що робить її найпопулярнішою та найзручнішою відкритою моделлю у світі. Враховуючи потреби AI-розробників та підприємств у різних країнах, модель Qwen постійно удосконалюється: Qwen3.5 підтримує 201 мову, розмір словника збільшено з 150 000 до 250 000, що дозволяє підвищити ефективність кодування для малих мов до 60%.
Зазначається, що додаток Qwen та ПК-версія вже одразу інтегрували модель Qwen3.5-Plus. Розробники можуть завантажити нову модель у спільноті Модіа або на HuggingFace, або отримати API-сервіс безпосередньо через Alibaba Cloud Bailing. Незабаром Alibaba продовжить відкривати код моделей серії Qwen3.5 різних розмірів і функцій. Також незабаром буде випущена флагманська модель Qwen3.5-Max з ще більшою продуктивністю.