Алі випустила нове покоління базової моделі QianWen 3.5, піднявшись на вершину світового рейтингу найпотужніших відкритих великих моделей

16 лютого, у день зустрічі Нового року за місячним календарем, Alibaba відкрила вихідний код новітньої генерації великої моделі Qwen3.5-Plus, яка за характеристиками не поступається Gemini 3 Pro і посідає перше місце у світі серед відкритих моделей.

Зазначається, що Qwen3.5 реалізувала повну революцію у базовій архітектурі моделі. У випущеній версії Qwen3.5-Plus загальна кількість параметрів становить 3970 мільярдів, активних — лише 17 мільярдів, що дозволяє малим моделям перевершувати великі, а її продуктивність перевищує модель Qwen3-Max з понад трильйоном параметрів. Витрати пам’яті для розгортання зменшилися на 60%, продуктивність при обчисленнях значно зросла, а максимальна пропускна здатність для обчислень може бути збільшена до 19 разів. Ціна API для Qwen3.5-Plus становить всього 0,8 юаня за мільйон токенів, що в 18 разів дешевше за Gemini 3 Pro.

На відміну від попередніх поколінь великих мовних моделей Qwen, Qwen3.5 здійснила перехід від чисто текстової моделі до нативної мультимодальної. Pretraining для Qwen3 був проведений на чистих текстових токенах, тоді як Qwen3.5 базується на попередньому навчанні з використанням візуальних і текстових змішаних токенів, а також значно додано даних китайською, англійською, багатомовними, STEM та логічними задачами. Це дозволило великій моделі «розплющити очі» і засвоїти більш глибокі знання про світ і логіку міркувань, досягаючи понад трильйонної продуктивності на базі Qwen3-Max з меншою кількістю параметрів — менше ніж 40%. У всіх основних бенчмарках, таких як оцінка здатності до логічних висновків, програмування та агентів, Qwen3.5 демонструє високі результати. Наприклад, у тесті MMLU-Pro з логічних знань він набрав 87,8 балів, перевищуючи GPT-5.2; у складних завданнях для докторського рівня GPQA — 88,4 бали, вище за Claude 4.5; у тесті на дотримання інструкцій IFBench — 76,5 балів, встановлюючи новий рекорд серед усіх моделей; а у таких бенчмарках, як BFCL-V4 для агентів та Browsecomp для пошукових агентів, Qwen3.5 перевершує Gemini 3 Pro і GPT-5.2.

Нативне мультимодальне навчання також сприяло прориву у візуальних можливостях Qwen3.5: у таких авторитетних тестах, як MathVison для мультимодальних міркувань, VQA (RealWorldQA) для універсальних візуальних відповідей, розпізнаванні тексту та розумінні документів (CC_OCR), просторовій інтелектуальності (RefCOCO-avg), відеоаналізі (MLVU), Qwen3.5 показала найкращі результати. У задачах розв’язання предметних задач, планування та фізичного простору, Qwen3.5 перевершує спеціалізовану модель Qwen3-VL, значно покращуючи здатність до просторової орієнтації та аналізу зображень, а також точність і деталізацію міркувань. У відеоаналізі модель підтримує обробку відео тривалістю до 2 годин (1 мільйон токенів контексту), що підходить для аналізу довгих відео та створення коротких резюме. Крім того, Qwen3.5 поєднує візуальне розуміння з можливостями кодування, використовуючи інструменти пошуку зображень і генерації зображень, що дозволяє перетворювати рукописні ескізи у робочий фронтенд-код, а скріншоти — швидко знаходити і виправляти UI-помилки, роблячи візуальне програмування справжнім інструментом підвищення продуктивності.

Нативне мультимодальне навчання Qwen3.5 було ефективно реалізовано на інфраструктурі Alibaba Cloud AI. Завдяки низці інновацій у базових технологіях, обсяг обробки змішаних даних (текст, зображення, відео) у тренуванні Qwen3.5 майже зрівнявся з тренуванням базових моделей на чистому тексті, значно знизивши бар’єри для нативного мультимодального навчання. Також за допомогою розроблених стратегій застосування точності FP8 і FP32, при масштабуванні тренування до сотень трильйонів токенів, обсяг активної пам’яті зменшився приблизно на 50%, а швидкість тренування зросла на 10%, що додатково знижує вартість тренування і підвищує його ефективність.

Qwen3.5 також зробила новий прорив у сфері агентних систем. Вона може самостійно керувати смартфонами і комп’ютерами, ефективно виконуючи щоденні завдання, підтримуючи більшість популярних додатків і команд на мобільних пристроях, а на ПК — виконувати складні багатоступінчасті операції, такі як обробка даних між додатками і автоматизація процесів. Це суттєво підвищує продуктивність роботи. Команда Qwen створила розширювану архітектуру агентів з асинхронним підкріпленням, що дозволяє прискорити роботу в 3–5 разів і масштабувати підтримку плагінів до мільйонів агентів.

Зазначається, що додатки Qwen для мобільних і ПК вже першими інтегрували модель Qwen3.5-Plus. Розробники можуть завантажити нову модель у спільноті Модак і HuggingFace або отримати API-сервіс безпосередньо через Alibaba Cloud Balian. Незабаром Alibaba планує відкрити вихідний код моделей серії Qwen3.5 різних розмірів і функціональності. Також незабаром буде представлено флагманську модель Qwen3.5-Max з ще більш високими характеристиками.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити