Meta 旗下 суперінтелектуальна лабораторія 8 квітня офіційно представила першу саморозроблену AI-модель Muse Spark, позиціонуючи її як перший крок на шляху до «персонального суперінтелекту». Новина одразу підштовхнула акції Meta до щоденного зростання більш ніж на 6,5%, встановивши новий максимум за останні три тижні, і водночас підтвердила, що Meta не зупинилася в гонитві за AI.
Що таке Muse Spark? Поява першої саморозробленої AI-моделі Meta для міркування (AI reasoning)
Muse Spark — це перша модель «серії Muse», розроблена суперінтелектуальною лабораторією Meta (Meta Superintelligence Labs, MSL). Вона належить до нативних мультимодальних моделей для міркування (reasoning), підтримує виклики інструментів (tool-use), візуальні ланцюги міркувань (visual chain of thought) та оркестрацію взаємодіючих багатьох агентів (multi-agent orchestration).
Цю лабораторію очолює засновник Scale AI Александr Ванг (Alexandr Wang). Meta раніше вклала близько 15 млрд доларів у Scale AI та запросила Ванга до співпраці, що розглядається як ключовий крок для перезапуску AI-побудови (AI buildout). Поява Muse Spark — це саме перший важливий результат після активного просування AI-трансформації генеральним директором Марком Цукерберґом (Mark Zuckerberg) протягом останніх років.
Варто зазначити, що на відміну від минулих фокусів Meta на відкритому коді Llama-серії, Muse Spark працює в закритій моделі, що символізує перехід Meta від стратегії відкритої екосистеми до більш комерційно орієнтованого курсу розвитку AI. Оцінки ринку припускають, що в майбутньому не виключено запровадження платного API або сервісів за підпискою.
Від сьогодні Muse Spark уже можна використовувати в Meta AI, а також надається приватний прев’ю-доступ до API для визначених партнерів.
Результати ефективності Muse Spark: порівняно з Gemini Deep Think і GPT Pro
У частині оцінювання можливостей Muse Spark демонструє високу результативність у мультимодальному сприйнятті, міркуванні, обробці медичної інформації та агентних задачах. Завдяки «режиму замислення (Contemplating)», запущеному Meta, кілька агентів здійснюють паралельне міркування та співпрацю, що дозволяє Muse Spark зрівнятися з Gemini Deep Think і GPT Pro та іншими надекстремальними режимами міркувань у складних завданнях.
Muse Spark у тесті Humanity’s Last Exam досягла 58%, а в тесті FrontierScience Research — 38%, демонструючи силу, здатну конкурувати з провідними моделями.
Сценарії застосування: від відстеження здоров’я до шопінг-асистента — повна інтеграція екосистеми Meta
Muse Spark позиціонують як «персональний суперінтелект, що розуміє світ», з акцентом на мультимодальну візуальну інтеграцію. Він може аналізувати в реальному часі середовище користувача в різних сферах, а саме пропонуються такі застосування.
Мультимодальна взаємодія
Muse Spark може на основі зображень генерувати інтерактивні вебігри або розпізнавати об’єкти й надавати детальні пояснення, наприклад, розбір складного інструктажу з керування машиною.
Персональне здоров’я
Модель може поєднувати візуальне розпізнавання та інструментальний пошук, щоб надавати точніші відповіді щодо здоров’я: наприклад, аналізувати харчові поживні компоненти або позначати активність різних м’язових груп під час тренувань, а також на основі індивідуальних харчових обмежень (як у вегетаріанців або людей із підвищеним рівнем холестерину) давати персоналізовані рекомендації.
Meta обіцяє надалі інтегрувати Muse Spark у Instagram, Facebook, Messenger, WhatsApp і розумні окуляри. При цьому AI-шопінг-асистент вважається одним із ключових комерційних застосувань: він допоможе користувачам шукати товари, пропонуватиме рекомендації та підтримуватиме ухвалення рішень. Це свідчить, що контури бізнес-моделі, яка поєднує рекламу та електронну комерцію, поступово формуються.
Три ключові технічні осі: попереднє навчання, підкріплювальне навчання, міркування під час тестування
У офіційному блогпості Meta розкрила технічні ключі Muse Spark, які будуються навколо трьох основних розширювальних напрямів.
Попереднє навчання (Pretraining)
За минулі дев’ять місяців Meta перебудувала стек технологій попереднього навчання (stack). Вона здійснила комплексне оновлення у модульній архітектурі моделі, методах оптимізації та впорядкуванні даних, що суттєво підвищило можливості моделі, які можна витягнути з кожної одиниці обчислювальної потужності.
Підкріплювальне навчання (Reinforcement Learning)
RL як продовження попереднього навчання може масштабувати можливості моделі ще ширше. Meta зазначає, що зі збільшенням RL-обчислень (вимірюються кількістю кроків) імовірність успіху моделі на тренувальних даних зростає за логарифмічно-лінійною залежністю, а також демонструє стабільне підвищення ефективності на оцінках для непобачених раніше наборів даних.
Міркування під час тестування (Test-Time Reasoning)
RL-навчання змушує модель спочатку думати перед тим, як відповісти. Meta через механізм «стиснення міркувань (thought compression)» та оркестрацію багатьох агентів ефективно зменшує затримку і посилює здатність до міркування.
Зав’язка епохи персонального суперінтелекту: інвестори вірять, що AI підвищить залученість користувачів
Щойно новина з’явилася, акції Meta за підсумками вчорашньої сесії виросли на 6,5% до 612,42 долара, встановивши новий максимум за останні три тижні. Це свідчить, що інвестори загалом позитивно оцінюють потенціал застосування AI-здатностей для повсякденних персональних задач і їх поєднання з соціальними платформами.
Meta заявляє, що Muse Spark означає ключовий крок цієї компанії на «передбачуваній та високоефективній траєкторії масштабування AI». У майбутньому Meta продовжить випускати моделі з більш потужними можливостями, поступово рухаючись до цілі персонального суперінтелекту.
Ця стаття Meta представила Muse Spark: поєднання екосистеми соціальних медіа, а також власний AI для здоров’я та шопінг-асистента вперше з’явилася на 鏈新聞 ABMedia.