OpenAI員工公開指責Grok3的基準測試結果具有誤導性

摘要生成中

金十數據2月23日訊，近日，OpenAI的一名員工公開指責埃隆・馬斯克旗下的xAI公司，稱其發佈的最新AI模型Grok3的基準測試結果具有誤導性。對此，xAI的聯合創始人伊戈爾・巴布什金（Igor Babushkin）則堅稱公司並無不當。xAI的圖表顯示，Grok3的兩個版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表現超過了OpenAI當前最強的可用模型o3-mini-high。然而，OpenAI的員工很快在X平臺上指出，xAI的圖表並未包含o3-mini-high在“cons@64”條件下的AIME 2025得分。巴布什金在X平臺上辯稱，OpenAI過去也曾發佈過類似的誤導性基準測試圖表。儘管這些圖表是用於比較其自身模型的表現。

GROK1.38%

XAI4.42%

查看原文

本頁面內容僅供參考，非招攬或要約，也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。

3人點讚了這條動態

讚賞
3
2
分享

留言

0/400

暫無留言

話題
#BTC#
194k 帖子
#ETH#
121k 帖子
#PI#
105k 帖子
4#GateioInto11#
77k 帖子
5#ContentStar#
64k 帖子
6#BOME#
60k 帖子
7#GT#
57k 帖子
8#DOGE#
53k 帖子
9#MAGA#
52k 帖子
10#SLERF#
51k 帖子