2025-12-18 06:21:55

El último agente de voz de Grok acaba de causar sensación: ahora es el mejor en el benchmark Big Bench Audio, superando tanto a Gemini 2.5 Flash Native Audio como a GPT Realtime en comparación directa. Las capacidades de conversión de voz a voz son realmente impresionantes. Esto cambia bastante la conversación en torno a los modelos de IA de voz. Para quienes siguen los avances en infraestructura de IA y su impacto en aplicaciones basadas en agentes, esto es algo a tener en cuenta. Los resultados del benchmark muestran diferencias de rendimiento significativas entre las implementaciones líderes. A medida que la IA de voz se vuelve cada vez más central en agentes autónomos y capas de interacción en tiempo real, estos avances técnicos podrían influir en cómo los protocolos y aplicaciones de próxima generación manejan la comunicación humano-máquina en entornos Web3.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

21 me gusta

Recompensa
21
5
Republicar
Compartir

Comentar

0/400

GasFeeSurvivor

· 2025-12-21 05:56

¿Grok ha empezado a fabricar de nuevo? El indicador de referencia de esto es demasiado profundo, mejor esperemos a que se use realmente antes de alardear.

Ver originalesResponder0

DeFiCaffeinator

· 2025-12-21 05:43

Grok esta vez realmente ha ido a lo grande, directamente ser liquidado a Gemini y GPT, ¿tiene una capacidad de voz tan impresionante?

Ver originalesResponder0

DeadTrades_Walking

· 2025-12-18 06:49

Grok vuelve a presumir, pero ¿realmente puede una prueba de referencia demostrar el problema?

Ver originalesResponder0

ZenChainWalker

· 2025-12-18 06:37

grok esta vez ha sido impresionante, aplastando directamente a Gemini y GPT... Espera, ¿esta prueba de rendimiento no será otra de esas cosas que parecen increíbles pero en realidad tienen un uso limitado?

Ver originalesResponder0

GasFeeBeggar

· 2025-12-18 06:24

grok esta vez realmente no puede más, y ha dejado a Gemini y GPT en el suelo... ¿La experiencia de voz a voz es realmente suave?

Ver originalesResponder0