El último agente de voz de Grok acaba de causar sensación: ahora es el mejor en el benchmark Big Bench Audio, superando tanto a Gemini 2.5 Flash Native Audio como a GPT Realtime en comparación directa. Las capacidades de conversión de voz a voz son realmente impresionantes. Esto cambia bastante la conversación en torno a los modelos de IA de voz. Para quienes siguen los avances en infraestructura de IA y su impacto en aplicaciones basadas en agentes, esto es algo a tener en cuenta. Los resultados del benchmark muestran diferencias de rendimiento significativas entre las implementaciones líderes. A medida que la IA de voz se vuelve cada vez más central en agentes autónomos y capas de interacción en tiempo real, estos avances técnicos podrían influir en cómo los protocolos y aplicaciones de próxima generación manejan la comunicación humano-máquina en entornos Web3.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • Republicar
  • Compartir
Comentar
0/400
GasFeeSurvivorvip
· 2025-12-21 05:56
¿Grok ha empezado a fabricar de nuevo? El indicador de referencia de esto es demasiado profundo, mejor esperemos a que se use realmente antes de alardear.
Ver originalesResponder0
DeFiCaffeinatorvip
· 2025-12-21 05:43
Grok esta vez realmente ha ido a lo grande, directamente ser liquidado a Gemini y GPT, ¿tiene una capacidad de voz tan impresionante?
Ver originalesResponder0
DeadTrades_Walkingvip
· 2025-12-18 06:49
Grok vuelve a presumir, pero ¿realmente puede una prueba de referencia demostrar el problema?
Ver originalesResponder0
ZenChainWalkervip
· 2025-12-18 06:37
grok esta vez ha sido impresionante, aplastando directamente a Gemini y GPT... Espera, ¿esta prueba de rendimiento no será otra de esas cosas que parecen increíbles pero en realidad tienen un uso limitado?
Ver originalesResponder0
GasFeeBeggarvip
· 2025-12-18 06:24
grok esta vez realmente no puede más, y ha dejado a Gemini y GPT en el suelo... ¿La experiencia de voz a voz es realmente suave?
Ver originalesResponder0
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt