ChainCatcher 情報によると、金十による報道によると、OpenAIの従業員が、マスク氏が所有するxAI社が公開した最新のAIモデルGrok3のベンチマークテスト結果が誤解を招くと公然と非難している。これに対し、xAIの共同創設者イゴール・バブシュキン(Igor Babushkin)は、会社には何の不正もないと強く主張している。XAIのチャートによると、Grok3の2つのバージョン、Grok3 Reasoning BetaとGrok3 mini Reasoningは、AIME 2025でOpenAIの現在の最強モデルo3-mini-highを上回っています。しかし、OpenAIのスタッフはすぐにXプラットフォームで指摘しましたが、xAIのチャートにはo3-mini-highの「cons@64」条件下でのAIME 2025のスコアが含まれていませんでした。バブシュキンは、Xプラットフォーム上で、OpenAIが過去にも同様の誤解を招くベンチマークテストチャートを公開したことを主張しています。これらのチャートは、自社のモデルのパフォーマンスを比較するために使用されていたにも関わらず。
OpenAIの従業員は、xAIの最新のAIモデルであるGrok3が誤解を招くと公に非難しています
ChainCatcher 情報によると、金十による報道によると、OpenAIの従業員が、マスク氏が所有するxAI社が公開した最新のAIモデルGrok3のベンチマークテスト結果が誤解を招くと公然と非難している。これに対し、xAIの共同創設者イゴール・バブシュキン(Igor Babushkin)は、会社には何の不正もないと強く主張している。 XAIのチャートによると、Grok3の2つのバージョン、Grok3 Reasoning BetaとGrok3 mini Reasoningは、AIME 2025でOpenAIの現在の最強モデルo3-mini-highを上回っています。しかし、OpenAIのスタッフはすぐにXプラットフォームで指摘しましたが、xAIのチャートにはo3-mini-highの「cons@64」条件下でのAIME 2025のスコアが含まれていませんでした。 バブシュキンは、Xプラットフォーム上で、OpenAIが過去にも同様の誤解を招くベンチマークテストチャートを公開したことを主張しています。これらのチャートは、自社のモデルのパフォーマンスを比較するために使用されていたにも関わらず。