2025-12-18 06:21:55

Останній голосовий агент Grok лише що справив справжній фурор — він тепер є найкращим у бенчмарку Big Bench Audio, обігнавши як Gemini 2.5 Flash Native Audio, так і GPT Realtime у прямому порівнянні. Можливості перетворення мови у мову дійсно вражають. Це суттєво змінює дискусію навколо моделей голосового ШІ. Для тих, хто слідкує за розвитком інфраструктури ШІ та їхнім впливом на застосунки на основі агентів, це варто врахувати. Результати бенчмарку показують значущі розриви у продуктивності між провідними реалізаціями. Оскільки голосовий ШІ стає все більш центральним у автономних агентах та шарах взаємодії у реальному часі, ці технічні досягнення можуть сформувати спосіб, яким наступне покоління протоколів і застосунків оброблятиме людсько-машинну комунікацію у Web3-середовищах.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

21 лайків

Нагородити
21
5
Репост
Поділіться

Прокоментувати

0/400

GasFeeSurvivor

· 2025-12-21 05:56

grok знову починає творити? Бенчмарк тестування ця річ занадто глибока, давайте все ж дочекаємося, поки ми реально її використаємо, перш ніж хвалитися.