ข้อมูล Gold Ten ข่าววันที่ 23 กุมภาพันธ์ พบว่า ชาว OpenAI บุคลากรคนหนึ่งอ้างว่า บริษัท xAI ภายใต้ Elon Musk ได้เผยแพร่ผลการทดสอบประสิทธิภาพเกณฑ์เปรียบเทียบสมรรถนะของโมเดล AI ล่าสุดของตนชื่อ Grok3 ซึ่งมีลักษณะการล่วงลอย ในขณะเดียวกัน ผู้ร่วมก่อตั้ง xAI Igor Babushkin ยืนยันว่า บริษัทไม่ได้กระทำผิด ตามที่ผลแสดงว่า Grok3 มีผลลัพธ์ที่ดีกว่าโมเดล o3-mini-high ที่แข็งแกร่งที่สุดของ OpenAI ใน AIME 2025 อย่างไรก็ตาม บุคลากรของ OpenAI ได้ชี้แจงเร็วๆนี้ในแพลตฟอร์ม X ว่า ผลแสดงของ xAI ไม่ได้รวมถึงคะแนน AIME 2025 ของ o3-mini-high ในเงื่อนไข "cons@64" บาบุชกิน ได้ขัดสนในแพลตฟอร์ม X ว่า OpenAI ก่อนหน้านี้ก็เคยเผยแพร่ผลการทดสอบเกณฑ์เปรียบเทียบสมรรถนะที่เป็นการล่วงหลอม ถึงแม้ว่าผลแสดงเหล่านั้นเป็นเพื่อเปรียบเทียบประสิทธิภาพของโมเดลของตนเอง
พนักงาน OpenAI ติดตาม Grok3 ให้ผลการทดสอบเกณฑ์เปรียบเทียบสมรรถนะที่เปิดเผยมีความเข้าใจผิด
ข้อมูล Gold Ten ข่าววันที่ 23 กุมภาพันธ์ พบว่า ชาว OpenAI บุคลากรคนหนึ่งอ้างว่า บริษัท xAI ภายใต้ Elon Musk ได้เผยแพร่ผลการทดสอบประสิทธิภาพเกณฑ์เปรียบเทียบสมรรถนะของโมเดล AI ล่าสุดของตนชื่อ Grok3 ซึ่งมีลักษณะการล่วงลอย ในขณะเดียวกัน ผู้ร่วมก่อตั้ง xAI Igor Babushkin ยืนยันว่า บริษัทไม่ได้กระทำผิด ตามที่ผลแสดงว่า Grok3 มีผลลัพธ์ที่ดีกว่าโมเดล o3-mini-high ที่แข็งแกร่งที่สุดของ OpenAI ใน AIME 2025 อย่างไรก็ตาม บุคลากรของ OpenAI ได้ชี้แจงเร็วๆนี้ในแพลตฟอร์ม X ว่า ผลแสดงของ xAI ไม่ได้รวมถึงคะแนน AIME 2025 ของ o3-mini-high ในเงื่อนไข "cons@64" บาบุชกิน ได้ขัดสนในแพลตฟอร์ม X ว่า OpenAI ก่อนหน้านี้ก็เคยเผยแพร่ผลการทดสอบเกณฑ์เปรียบเทียบสมรรถนะที่เป็นการล่วงหลอม ถึงแม้ว่าผลแสดงเหล่านั้นเป็นเพื่อเปรียบเทียบประสิทธิภาพของโมเดลของตนเอง