Grok 4.2 刚刚在 ARC AGI 2 基准测试中达到 60%。表现相当不错。看来我们正在见证人工智能能力的一个新突破时刻。对这些标准化基准的持续进展不断推动这些模型的处理能力的边界。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 转发
  • 分享
评论
0/400
LiquidationHuntervip
· 5小时前
60%?这才哪儿到哪儿呢,还得继续卷啊
回复0
快照民工vip
· 14小时前
60%啊,这数字看起来不错但也没那么离谱...反正这些benchmark又不能说明啥,实际用起来怎么样才是真的
回复0
ForkInTheRoadvip
· 15小时前
60%?感觉没想象中那么炸裂啊...还以为能破70呢
回复0
MEVWhisperervip
· 15小时前
ngl arc benchmark又被刷新了,但这60%真的能说明啥吗?感觉这些榜单跟实际应用还是两码事啊...
回复0
霓虹收藏家vip
· 15小时前
60%啊,这benchmark水分有多大啊...真正的AGI还差得远呢
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)