Агентний ШІ: справжнє поле бою конкуренції — інфраструктура, а не результати тестування моделей

SnapshotBot · 2026-04-09T12:29:46+00:00

Together AI оголосила, що за допомогою RL після тренування покращила кодові можливості GLM-5 на 28%, але бракує незалежної перевірки, потреба у обчислювальній потужності зросла, стабільність на рівні виконання стала справжнім бар'єром. Галузеві інвестиції зосереджені у великих компаніях, підприємствам потрібно приділяти увагу гібридним процесам людина-машина, надійність і відповідність вимогам стануть новими стандартами ціноутворення.

SnapshotBot

2026-04-09 12:29:46

Генерація анотацій у процесі

Самореклама підвищення та справжні проблеми на рівні виконання

Together AI 8 квітня оголосила, що за допомогою повторного навчання з RL здатність кодування GLM-5 зросла на 28%. Це змінило наратив конкуренції з «накопичення параметрів» на «постійне оптимізування», але питання в тому: без незалежної перевірки бенчмарків і з зростаючими вимогами до обчислювальних ресурсів, наскільки цей показник справді має значення? Можливо, їхній AI Native Cloud здатен створити диференціацію на безсерверній лінії обробки, але чесно кажучи, справжній вузол зараз — стабільність довгих ланцюгів виконання, а не кілька відсотків у здатності кодування.

Обговорення GLM-5 викликало явні розбіжності:

Оптимісти кажуть, що «перехресне мислення + виклики інструментів» вже здатні запускати складні робочі процеси, і наводять приклад понад 600 раундів ітерацій на arXiv;
Але недооцінено ранню стадію у бенчмарках: аналіз LongCLI-Bench показує, що на SWE-Bench рівень завершення агентів менше 30%; причина — надто слабке початкове планування, і кілька додаткових інструментів не вирішують проблему.
З іншого боку, Anthropic підписала контракти на кілька гігават TPU (енерговитрати порівнянні з майнінгом біткоїнів), що свідчить про концентрацію обчислювальних ресурсів у гравців із вертикальною інтеграцією. Щоб змагатися з корпоративними ефектами AWS і Azure, Together потрібно довести, що може забезпечити 99.9% SLA у реальних розгортаннях.

Непорозуміння між потоками фінансування та наративами

У першому кварталі 2026 року загальні венчурні інвестиції досягли 300 мільярдів доларів, з яких приблизно 80% припадає на AI, з них одна компанія OpenAI отримала 122 мільярди доларів масштабних інвестицій;
Обговорення децентралізованої інфраструктури (наприклад, DGrid AI) у Twitter показують, що ринок реагує повільніше на зміну наративу «від моделі до інфраструктури»;
У складних завданнях, за допомогою «інжекції планування» та залучення людського втручання, гібридні процеси можуть стабільно підвищити продуктивність приблизно на 20%, але такі робочі процеси недооцінені, і компанії не усвідомлюють цінності контролю розробників.

Конкурентна ситуація, зміни у пропозиції та переоцінені рішення

У конкуренції: GLM-5 використовує архітектуру MoE (744 мільярди параметрів, активних близько 40 мільярдів), що є викликом для закритих систем; але компанія Zhipu не дала прямої відповіді, виглядає швидше як ітеративне оновлення, ніж революційний прорив.
Зміни у пропозиції: компанії, як Core Scientific, що займаються майнінгом, переходять до AI-хостингу, що може свідчити про менший, ніж очікувалося, дефіцит GPU; повторно використовувана інфраструктура може вплинути на ринок безсерверних рішень і зменшити преміальні ціни для таких гравців, як Together.
Корекція наративу: надмірна захопленість «моделлю мислення» не вирішує фундаментальні проблеми, такі як забруднення базових даних у LongCLI-Bench, і критика вже вказала на це.

Наративний табір	Докази	Вплив	Оцінка
Оптимісти Agentic	GLM-5 досяг 77.8% на SWE-Bench Verified, понад 600 раундів ітерацій на arXiv	Зосередження на постійному RL-оптимізуванні, стимулювання пілотних проектів	Переоцінено. Реальна перевага — у гібридному людсько-машинному контролі, консалтингові компанії, як Accenture, виграють
Скептики обчислювальних ресурсів	Контракти Anthropic на TPU гігаваатів, 300 мільярдів доларів інвестицій у AI у першому кварталі	Перетворення дефіциту у «битву за розподіл», пригнічення відкритих хмарних сервісів	Ціноутворення з похибкою. Перехід майнінгових компаній до AI може знизити високі премії для таких гравців, як Together
Підтримка децентралізації	Обговорення DGrid/0G, PermawebDAO у Twitter	Створення верифікованого наративу Web3 AI, відволікання уваги від централізованих хмарних сервісів	Ранній сигнал. Реакція масової аудиторії повільна, регуляція також гальмує прийняття нативних крипто-рішень
Бізнес-практики	Ранній рівень зупинки LongCLI-Bench менше 30%, 28% покращення без незалежної перевірки	Виявлення прогалин у виконанні, зниження ажіотажу навколо агентних рішень	Це ключове відкриття: команди, здатні самостійно створювати зворотний зв’язок, отримають перевагу, наприклад, у практиці OpenAI o3

Перспективи та логіка ціноутворення

Якщо підвищення, яке заявляє компанія, є достовірним (без аудиту, ймовірність близько 60%), то до 2027 року безсерверна лінія Together може обробляти 15–20% агентних завдань;
Але регуляція просуває «безпечне узгодження у хмарі», і вимоги до відповідності та надійності зростатимуть, що вигідно для великих гравців;
Що стосується ціноутворення активів і сервісів: надійність і SLA стануть основними точками преміуму, а оцінка покращень у моделях з однією точкою збоїв має знизитися.

Висновок: інвестори занадто рано захопилися наративом «агентизації» GLM-5, але недостатньо усвідомлюють залежність від інфраструктури. У складних завданнях пріоритетом є «гібридне виконання людина-машина + зворотний зв’язок», і команди, що зосереджуються на цьому, отримають надприбутки, тоді як просте тонке налаштування моделей стає менш вигідним.

Важливість: висока
Категорія: публікація моделей, галузеві тренди, технічні інсайти

Оцінка: Ще не запізно зосередитися на «інфраструктурі перш за все». Короткострокові трейдери вже пропустили пікові емоції, справжні вигідники — це команди, здатні забезпечити високий SLA і гібридний людсько-машинний процес, а також довгострокові фонди. Позиції щодо надійності та відповідності слід збільшити.

GLM1,48%

BTC1,43%

0G-0,56%

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.