El último agente de voz de Grok acaba de causar sensación: ahora es el mejor en el benchmark Big Bench Audio, superando tanto a Gemini 2.5 Flash Native Audio como a GPT Realtime en comparación directa. Las capacidades de conversión de voz a voz son realmente impresionantes. Esto cambia bastante la conversación en torno a los modelos de IA de voz. Para quienes siguen los avances en infraestructura de IA y su impacto en aplicaciones basadas en agentes, esto es algo a tener en cuenta. Los resultados del benchmark muestran diferencias de rendimiento significativas entre las implementaciones líderes. A medida que la IA de voz se vuelve cada vez más central en agentes autónomos y capas de interacción en tiempo real, estos avances técnicos podrían influir en cómo los protocolos y aplicaciones de próxima generación manejan la comunicación humano-máquina en entornos Web3.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
21 me gusta
Recompensa
21
5
Republicar
Compartir
Comentar
0/400
GasFeeSurvivor
· 2025-12-21 05:56
¿Grok ha empezado a fabricar de nuevo? El indicador de referencia de esto es demasiado profundo, mejor esperemos a que se use realmente antes de alardear.
Ver originalesResponder0
DeFiCaffeinator
· 2025-12-21 05:43
Grok esta vez realmente ha ido a lo grande, directamente ser liquidado a Gemini y GPT, ¿tiene una capacidad de voz tan impresionante?
Ver originalesResponder0
DeadTrades_Walking
· 2025-12-18 06:49
Grok vuelve a presumir, pero ¿realmente puede una prueba de referencia demostrar el problema?
Ver originalesResponder0
ZenChainWalker
· 2025-12-18 06:37
grok esta vez ha sido impresionante, aplastando directamente a Gemini y GPT... Espera, ¿esta prueba de rendimiento no será otra de esas cosas que parecen increíbles pero en realidad tienen un uso limitado?
Ver originalesResponder0
GasFeeBeggar
· 2025-12-18 06:24
grok esta vez realmente no puede más, y ha dejado a Gemini y GPT en el suelo... ¿La experiencia de voz a voz es realmente suave?
El último agente de voz de Grok acaba de causar sensación: ahora es el mejor en el benchmark Big Bench Audio, superando tanto a Gemini 2.5 Flash Native Audio como a GPT Realtime en comparación directa. Las capacidades de conversión de voz a voz son realmente impresionantes. Esto cambia bastante la conversación en torno a los modelos de IA de voz. Para quienes siguen los avances en infraestructura de IA y su impacto en aplicaciones basadas en agentes, esto es algo a tener en cuenta. Los resultados del benchmark muestran diferencias de rendimiento significativas entre las implementaciones líderes. A medida que la IA de voz se vuelve cada vez más central en agentes autónomos y capas de interacción en tiempo real, estos avances técnicos podrían influir en cómo los protocolos y aplicaciones de próxima generación manejan la comunicación humano-máquina en entornos Web3.