Агентний ШІ: справжнє поле бою конкуренції — інфраструктура, а не результати тестування моделей

robot
Генерація анотацій у процесі

Самореклама підвищення та справжні проблеми на рівні виконання

Together AI 8 квітня оголосила, що за допомогою повторного навчання з RL здатність кодування GLM-5 зросла на 28%. Це змінило наратив конкуренції з «накопичення параметрів» на «постійне оптимізування», але питання в тому: без незалежної перевірки бенчмарків і з зростаючими вимогами до обчислювальних ресурсів, наскільки цей показник справді має значення? Можливо, їхній AI Native Cloud здатен створити диференціацію на безсерверній лінії обробки, але чесно кажучи, справжній вузол зараз — стабільність довгих ланцюгів виконання, а не кілька відсотків у здатності кодування.

Обговорення GLM-5 викликало явні розбіжності:

  • Оптимісти кажуть, що «перехресне мислення + виклики інструментів» вже здатні запускати складні робочі процеси, і наводять приклад понад 600 раундів ітерацій на arXiv;
  • Але недооцінено ранню стадію у бенчмарках: аналіз LongCLI-Bench показує, що на SWE-Bench рівень завершення агентів менше 30%; причина — надто слабке початкове планування, і кілька додаткових інструментів не вирішують проблему.
  • З іншого боку, Anthropic підписала контракти на кілька гігават TPU (енерговитрати порівнянні з майнінгом біткоїнів), що свідчить про концентрацію обчислювальних ресурсів у гравців із вертикальною інтеграцією. Щоб змагатися з корпоративними ефектами AWS і Azure, Together потрібно довести, що може забезпечити 99.9% SLA у реальних розгортаннях.

Непорозуміння між потоками фінансування та наративами

  • У першому кварталі 2026 року загальні венчурні інвестиції досягли 300 мільярдів доларів, з яких приблизно 80% припадає на AI, з них одна компанія OpenAI отримала 122 мільярди доларів масштабних інвестицій;
  • Обговорення децентралізованої інфраструктури (наприклад, DGrid AI) у Twitter показують, що ринок реагує повільніше на зміну наративу «від моделі до інфраструктури»;
  • У складних завданнях, за допомогою «інжекції планування» та залучення людського втручання, гібридні процеси можуть стабільно підвищити продуктивність приблизно на 20%, але такі робочі процеси недооцінені, і компанії не усвідомлюють цінності контролю розробників.

Конкурентна ситуація, зміни у пропозиції та переоцінені рішення

  • У конкуренції: GLM-5 використовує архітектуру MoE (744 мільярди параметрів, активних близько 40 мільярдів), що є викликом для закритих систем; але компанія Zhipu не дала прямої відповіді, виглядає швидше як ітеративне оновлення, ніж революційний прорив.
  • Зміни у пропозиції: компанії, як Core Scientific, що займаються майнінгом, переходять до AI-хостингу, що може свідчити про менший, ніж очікувалося, дефіцит GPU; повторно використовувана інфраструктура може вплинути на ринок безсерверних рішень і зменшити преміальні ціни для таких гравців, як Together.
  • Корекція наративу: надмірна захопленість «моделлю мислення» не вирішує фундаментальні проблеми, такі як забруднення базових даних у LongCLI-Bench, і критика вже вказала на це.
Наративний табір Докази Вплив Оцінка
Оптимісти Agentic GLM-5 досяг 77.8% на SWE-Bench Verified, понад 600 раундів ітерацій на arXiv Зосередження на постійному RL-оптимізуванні, стимулювання пілотних проектів Переоцінено. Реальна перевага — у гібридному людсько-машинному контролі, консалтингові компанії, як Accenture, виграють
Скептики обчислювальних ресурсів Контракти Anthropic на TPU гігаваатів, 300 мільярдів доларів інвестицій у AI у першому кварталі Перетворення дефіциту у «битву за розподіл», пригнічення відкритих хмарних сервісів Ціноутворення з похибкою. Перехід майнінгових компаній до AI може знизити високі премії для таких гравців, як Together
Підтримка децентралізації Обговорення DGrid/0G, PermawebDAO у Twitter Створення верифікованого наративу Web3 AI, відволікання уваги від централізованих хмарних сервісів Ранній сигнал. Реакція масової аудиторії повільна, регуляція також гальмує прийняття нативних крипто-рішень
Бізнес-практики Ранній рівень зупинки LongCLI-Bench менше 30%, 28% покращення без незалежної перевірки Виявлення прогалин у виконанні, зниження ажіотажу навколо агентних рішень Це ключове відкриття: команди, здатні самостійно створювати зворотний зв’язок, отримають перевагу, наприклад, у практиці OpenAI o3

Перспективи та логіка ціноутворення

  • Якщо підвищення, яке заявляє компанія, є достовірним (без аудиту, ймовірність близько 60%), то до 2027 року безсерверна лінія Together може обробляти 15–20% агентних завдань;
  • Але регуляція просуває «безпечне узгодження у хмарі», і вимоги до відповідності та надійності зростатимуть, що вигідно для великих гравців;
  • Що стосується ціноутворення активів і сервісів: надійність і SLA стануть основними точками преміуму, а оцінка покращень у моделях з однією точкою збоїв має знизитися.

Висновок: інвестори занадто рано захопилися наративом «агентизації» GLM-5, але недостатньо усвідомлюють залежність від інфраструктури. У складних завданнях пріоритетом є «гібридне виконання людина-машина + зворотний зв’язок», і команди, що зосереджуються на цьому, отримають надприбутки, тоді як просте тонке налаштування моделей стає менш вигідним.

Важливість: висока
Категорія: публікація моделей, галузеві тренди, технічні інсайти

Оцінка: Ще не запізно зосередитися на «інфраструктурі перш за все». Короткострокові трейдери вже пропустили пікові емоції, справжні вигідники — це команди, здатні забезпечити високий SLA і гібридний людсько-машинний процес, а також довгострокові фонди. Позиції щодо надійності та відповідності слід збільшити.

GLM1,48%
BTC1,43%
0G-0,56%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити