2026-01-01 18:26:36

Grok 4.2 刚刚在 ARC AGI 2 基准测试中达到 60%。表现相当不错。看来我们正在见证人工智能能力的一个新突破时刻。对这些标准化基准的持续进展不断推动这些模型的处理能力的边界。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

15人点赞了这条动态

0/400

LiquidationHunter

· 5小时前

60%？这才哪儿到哪儿呢，还得继续卷啊

快照民工

· 14小时前

60%啊，这数字看起来不错但也没那么离谱...反正这些benchmark又不能说明啥，实际用起来怎么样才是真的

ForkInTheRoad

· 15小时前

60%？感觉没想象中那么炸裂啊...还以为能破70呢

MEVWhisperer

· 15小时前

ngl arc benchmark又被刷新了，但这60%真的能说明啥吗？感觉这些榜单跟实际应用还是两码事啊...

霓虹收藏家

· 15小时前

60%啊，这benchmark水分有多大啊...真正的AGI还差得远呢

热门话题