Grok 4.2 vient d'atteindre 60% sur le benchmark ARC AGI 2. Performance plutôt solide. On dirait que nous assistons à un nouveau moment de pointe dans les capacités de l'IA. Les progrès sur ces benchmarks standardisés continuent de repousser les limites de ce que ces modèles peuvent gérer.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 5
  • Reposter
  • Partager
Commentaire
0/400
LiquidationHuntervip
· Il y a 1h
60 % ? C'est encore loin, il faut continuer à se battre.
Voir l'originalRépondre0
SnapshotLaborervip
· Il y a 10h
60% ouais, ce chiffre semble pas mal mais pas si démentiel... De toute façon, ces benchmarks ne veulent rien dire, c'est l'utilisation réelle qui compte vraiment
Voir l'originalRépondre0
ForkInTheRoadvip
· Il y a 10h
60 % ? J'ai l'impression que ce n'est pas aussi explosif que je l'avais imaginé... Je pensais pouvoir dépasser 70.
Voir l'originalRépondre0
MEV_Whisperervip
· Il y a 10h
ngl arc benchmark a été à nouveau mis à jour, mais ces 60 % peuvent-ils vraiment signifier quelque chose ? J'ai l'impression que ces classements sont encore loin de la réalité des applications...
Voir l'originalRépondre0
NeonCollectorvip
· Il y a 10h
60% ah, quelle est la marge d'erreur de ce benchmark... le véritable AGI est encore loin
Voir l'originalRépondre0
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)