Алі випустила нове покоління базової моделі QianWen 3.5, піднявшись на вершину світового рейтингу найпотужніших відкритих великих моделей

16 лютого, у день зустрічі Нового року за місячним календарем, Alibaba відкрила вихідний код нове покоління великої моделі Qwen3.5-Plus, яка за характеристиками не поступається Gemini 3 Pro і посідає перше місце у світі серед відкритих моделей.

Зазначається, що Qwen3.5 реалізувала повну революцію у базовій архітектурі моделі. У випущеній версії Qwen3.5-Plus загальна кількість параметрів становить 397 мільярдів, активних — лише 17 мільярдів, що дозволяє досягти переваги над великими моделями, перевищуючи за продуктивністю Qwen3-Max з трильйонами параметрів. Витрати пам’яті для розгортання зменшилися на 60%, продуктивність інференсу значно зросла, максимальна пропускна здатність для інференсу може бути збільшена до 19 разів. Ціна API для Qwen3.5-Plus становить всього 0,8 юаня за мільйон токенів, що в 18 разів дешевше за Gemini 3 Pro.

На відміну від попередніх поколінь великих мовних моделей Qwen, Qwen3.5 здійснила перехід від чисто текстової моделі до нативної мультимодальної моделі. Pretraining Qwen3 базується на чисто текстових токенах, тоді як Qwen3.5 тренується на поєднаних візуальних і текстових токенах, значно додавши даних китайською, англійською, багатомовних, STEM та для логічних висновків. Це дозволило великій моделі «відкрити очі» і навчитися більш глибоким знанням світу та логіці висновків, досягаючи понад трильйонної продуктивності на базовій моделі Qwen3-Max з меншим ніж 40% параметрів. У всіх основних бенчмарках, таких як інференс, програмування, агентські системи, модель показує високі результати. Наприклад, у тесті MMLU-Pro з логічних знань Qwen3.5 набрала 87,8 балів, перевищуючи GPT-5.2; у складних завданнях рівня доктора наук GPQA — 88,4 балів, вище за Claude 4.5; у тесті на дотримання інструкцій IFBench — 76,5 балів, встановлюючи новий рекорд серед усіх моделей; у загальних агентських тестах BFCL-V4, Browsecomp тощо Qwen3.5 перевершує Gemini 3 Pro і GPT-5.2.

Нативне мультимодальне навчання також сприяло прориву у візуальних можливостях Qwen3.5: у таких авторитетних тестах, як MathVison для мультимодального логічного мислення, VQA (RealWorldQA) для загального візуального питань і відповідей, розпізнаванні тексту та розумінні документів (CC_OCR), просторовій інтелектуальності (RefCOCO-avg), відеоаналізі (MLVU), Qwen3.5 демонструє найкращі результати. У завданнях з розв’язання задач, планування та фізичного простору, Qwen3.5 показує кращі результати порівняно з моделлю Qwen3-VL, значно покращивши здатність до просторової орієнтації та аналізу зображень, а також точність і деталізацію висновків. У відеоаналізі модель підтримує обробку відео довжиною до 2 годин (1 мільйон токенів контексту), що підходить для аналізу довгих відео та створення коротких резюме. Крім того, Qwen3.5 поєднує візуальне розуміння з можливостями кодування, використовуючи інструменти пошуку зображень і генерації зображень, що дозволяє перетворювати рукописні ескізи у робочий фронтенд-код, а один скріншот — знаходити і виправляти UI-помилки, роблячи візуальне програмування справжнім інструментом продуктивності.

Нативне мультимодальне навчання Qwen3.5 було ефективно реалізовано на інфраструктурі Alibaba Cloud AI. Завдяки низці інновацій у базових технологіях, продуктивність тренування моделей з поєднаними даними (текст, зображення, відео) майже дорівнює тренуванню чисто текстових моделей, що значно знижує бар’єр для розвитку мультимодальних моделей. Використання стратегій точності FP8 і FP32 дозволяє при масштабуванні до сотень трильйонів токенів зменшити використання пам’яті приблизно на 50%, а швидкість тренування — підвищити на 10%, що знижує вартість тренування і підвищує його ефективність.

Qwen3.5 також зробила новий прорив у сфері агентських систем. Вона може самостійно керувати смартфонами і комп’ютерами, ефективно виконуючи щоденні завдання, підтримуючи більшість популярних додатків і команд на мобільних пристроях, а на ПК — виконувати складні багатоступінчасті операції, такі як обробка даних між додатками і автоматизація процесів. Це суттєво підвищує продуктивність роботи. Команда Alibaba створила масштабовану асинхронну систему навчання агентів, яка прискорює роботу в 3–5 разів і дозволяє розширювати підтримку плагінів до мільйонів агентів.

Зазначається, що додатки Qwen3.5 для мобільних і ПК вже доступні для користувачів. Розробники можуть завантажити нову модель у спільноті Модіа та HuggingFace або отримати API через Alibaba Cloud Balian. Незабаром Alibaba планує відкрити вихідний код моделей Qwen3.5 різних розмірів і функціональності. Також незабаром буде представлено флагманську модель Qwen3.5-Max з ще більш високими характеристиками.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити