OpenAIの従業員は、Grok3のベンチマークテスト結果が誤解を招くと公然と非難しています

robot
概要作成中

金十データ2月23日、最近、OpenAIの1人の従業員が、イーロン・マスクの傘下のXAI社が公開した最新のAIモデルGrok3のベンチマークテスト結果が誤解を招くと非難しました。これに対し、XAIの共同創設者イゴール・バブシュキン(Igor Babushkin)氏は、会社に不正がないと主張しています。XAIの図によると、Grok3には2つのバージョンがあり、Grok3 Reasoning BetaとGrok3 mini Reasoningは、AIME 2025でOpenAIの現在利用可能な最強モデルo3-mini-highを上回っています。しかし、OpenAIの従業員はすぐにXプラットフォーム上で指摘しました、XAIの図にはo3-mini-highの“cons@64”条件でのAIME 2025スコアが含まれていないと。バブシュキン氏はXプラットフォーム上で反論し、OpenAIも過去に同様の誤解を招くベンチマークテスト図を公開したことがあると述べました。これらの図は、自社のモデルのパフォーマンスを比較するために使用されていましたが。

原文表示
内容は参考用であり、勧誘やオファーではありません。 投資、税務、または法律に関するアドバイスは提供されません。 リスク開示の詳細については、免責事項 を参照してください。
  • 報酬
  • 2
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGate.ioアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)