พนักงาน OpenAI ติดตาม Grok3 ให้ผลการทดสอบเกณฑ์เปรียบเทียบสมรรถนะที่เปิดเผยมีความเข้าใจผิด

robot
ดำเนินการเจนเนเรชั่นบทคัดย่อ

ข้อมูล Gold Ten ข่าววันที่ 23 กุมภาพันธ์ พบว่า ชาว OpenAI บุคลากรคนหนึ่งอ้างว่า บริษัท xAI ภายใต้ Elon Musk ได้เผยแพร่ผลการทดสอบประสิทธิภาพเกณฑ์เปรียบเทียบสมรรถนะของโมเดล AI ล่าสุดของตนชื่อ Grok3 ซึ่งมีลักษณะการล่วงลอย ในขณะเดียวกัน ผู้ร่วมก่อตั้ง xAI Igor Babushkin ยืนยันว่า บริษัทไม่ได้กระทำผิด ตามที่ผลแสดงว่า Grok3 มีผลลัพธ์ที่ดีกว่าโมเดล o3-mini-high ที่แข็งแกร่งที่สุดของ OpenAI ใน AIME 2025 อย่างไรก็ตาม บุคลากรของ OpenAI ได้ชี้แจงเร็วๆนี้ในแพลตฟอร์ม X ว่า ผลแสดงของ xAI ไม่ได้รวมถึงคะแนน AIME 2025 ของ o3-mini-high ในเงื่อนไข "cons@64" บาบุชกิน ได้ขัดสนในแพลตฟอร์ม X ว่า OpenAI ก่อนหน้านี้ก็เคยเผยแพร่ผลการทดสอบเกณฑ์เปรียบเทียบสมรรถนะที่เป็นการล่วงหลอม ถึงแม้ว่าผลแสดงเหล่านั้นเป็นเพื่อเปรียบเทียบประสิทธิภาพของโมเดลของตนเอง

ดูต้นฉบับ
เนื้อหานี้มีสำหรับการอ้างอิงเท่านั้น ไม่ใช่การชักชวนหรือข้อเสนอ ไม่มีคำแนะนำด้านการลงทุน ภาษี หรือกฎหมาย ดูข้อจำกัดความรับผิดชอบสำหรับการเปิดเผยความเสี่ยงเพิ่มเติม
  • รางวัล
  • 2
  • แชร์
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น
  • ปักหมุด