في 20 فبراير، أطلقت جوجل CEX 3.1 Pro. بناءً على سلسلة CEX 3، حققت 3.1 Pro قفزة نوعية في مجال الاستدلال الأساسي. تعتبر 3.1 Pro نموذج معيار لحل المشكلات المعقدة أكثر ذكاءً وقوة، وحققت تقدمًا ملحوظًا في الاختبارات الصارمة. في تقييم قدرة النموذج على حل أنماط منطقية جديدة باستخدام اختبار المعيار ARC-AGI-2، بلغت درجة التحقق من 3.1 Pro 77.1٪، متفوقة بأكثر من ضعف على أداء الاستدلال لـ CEX 3 Pro.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
جوجل تطلق CEX 3.1 Pro، مع تحسين أداء الاستنتاج بأكثر من ضعف مقارنة بـ CEX 3 Pro
في 20 فبراير، أطلقت جوجل CEX 3.1 Pro. بناءً على سلسلة CEX 3، حققت 3.1 Pro قفزة نوعية في مجال الاستدلال الأساسي. تعتبر 3.1 Pro نموذج معيار لحل المشكلات المعقدة أكثر ذكاءً وقوة، وحققت تقدمًا ملحوظًا في الاختبارات الصارمة. في تقييم قدرة النموذج على حل أنماط منطقية جديدة باستخدام اختبار المعيار ARC-AGI-2، بلغت درجة التحقق من 3.1 Pro 77.1٪، متفوقة بأكثر من ضعف على أداء الاستدلال لـ CEX 3 Pro.