Останній голосовий агент Grok лише що справив справжній фурор — він тепер є найкращим у бенчмарку Big Bench Audio, обігнавши як Gemini 2.5 Flash Native Audio, так і GPT Realtime у прямому порівнянні. Можливості перетворення мови у мову дійсно вражають. Це суттєво змінює дискусію навколо моделей голосового ШІ. Для тих, хто слідкує за розвитком інфраструктури ШІ та їхнім впливом на застосунки на основі агентів, це варто врахувати. Результати бенчмарку показують значущі розриви у продуктивності між провідними реалізаціями. Оскільки голосовий ШІ стає все більш центральним у автономних агентах та шарах взаємодії у реальному часі, ці технічні досягнення можуть сформувати спосіб, яким наступне покоління протоколів і застосунків оброблятиме людсько-машинну комунікацію у Web3-середовищах.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
21 лайків
Нагородити
21
5
Репост
Поділіться
Прокоментувати
0/400
GasFeeSurvivor
· 2025-12-21 05:56
grok знову починає творити? Бенчмарк тестування ця річ занадто глибока, давайте все ж дочекаємося, поки ми реально її використаємо, перш ніж хвалитися.
Переглянути оригіналвідповісти на0
DeFiCaffeinator
· 2025-12-21 05:43
Grok цього разу справді вдарив по повній, прямо ліквідував Gemini та GPT, мовні можливості такі потужні?
Переглянути оригіналвідповісти на0
DeadTrades_Walking
· 2025-12-18 06:49
Grok знову починає показуватися, але чи справді бенчмарки можуть щось пояснити?
Переглянути оригіналвідповісти на0
ZenChainWalker
· 2025-12-18 06:37
grok ця хвиля дійсно неймовірна, безпосередньо переважає gemini і gpt... почекайте, чи цей бенчмарк знову буде тим, що виглядає круто, але насправді має обмежене застосування
Переглянути оригіналвідповісти на0
GasFeeBeggar
· 2025-12-18 06:24
grok ця хвиля дійсно не витримує, одразу знищив Gemini і GPT... Чи дійсно досвід голосового спілкування з голосовим зв’язком є надзвичайно плавним?
Останній голосовий агент Grok лише що справив справжній фурор — він тепер є найкращим у бенчмарку Big Bench Audio, обігнавши як Gemini 2.5 Flash Native Audio, так і GPT Realtime у прямому порівнянні. Можливості перетворення мови у мову дійсно вражають. Це суттєво змінює дискусію навколо моделей голосового ШІ. Для тих, хто слідкує за розвитком інфраструктури ШІ та їхнім впливом на застосунки на основі агентів, це варто врахувати. Результати бенчмарку показують значущі розриви у продуктивності між провідними реалізаціями. Оскільки голосовий ШІ стає все більш центральним у автономних агентах та шарах взаємодії у реальному часі, ці технічні досягнення можуть сформувати спосіб, яким наступне покоління протоколів і застосунків оброблятиме людсько-машинну комунікацію у Web3-середовищах.