Grok 4.2 acaba de alcanzar el 60% en el benchmark ARC AGI 2. Rendimiento bastante sólido allí. Parece que estamos presenciando un nuevo momento de vanguardia en las capacidades de IA. El progreso en estos benchmarks estandarizados sigue empujando los límites de lo que estos modelos pueden manejar.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • Republicar
  • Compartir
Comentar
0/400
LiquidationHuntervip
· hace3h
¿El 60%? Esto todavía está lejos, ¡aún hay que seguir esforzándose!
Ver originalesResponder0
SnapshotLaborervip
· hace13h
¡60%! Este número parece bueno, pero tampoco es tan exagerado... De todos modos, estos benchmarks no significan mucho; lo que realmente importa es cómo funciona en la práctica.
Ver originalesResponder0
ForkInTheRoadvip
· hace13h
¿El 60%? Siento que no es tan espectacular como pensaba... Pensé que podría superar el 70.
Ver originalesResponder0
MEV_Whisperervip
· hace13h
ngl arc benchmark también ha sido actualizado, pero ¿realmente el 60% puede indicar algo? Parece que estas listas no reflejan mucho las aplicaciones reales...
Ver originalesResponder0
NeonCollectorvip
· hace13h
¡El 60%! ¿Qué tan grande es la diferencia en ese benchmark? La verdadera AGI todavía está muy lejos.
Ver originalesResponder0
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)