أعلنت OpenAI في اليوم الثاني عن ميزة جديدة لتعديل التعلم التعزيزي تعزز دقة تعلم المجالات المهنية للذكاء الاصطناعي

2024-12-07 09:56:10

إنشاء الملخص قيد التقدم

في اليوم الثاني من إطلاق منتجات OpenAI ، تم إطلاق وظيفة "تعديل التعزيز" (Reinforcement Fine-Tuning ، RFT) ، مما يتيح للمستخدمين تحسين قدرة الاستدلال للنموذج المخصص في مجالات مختلفة وبالتالي زيادة دقة النموذج. يمكن استخدام هذه الوظيفة في مجالات متعددة بما في ذلك البحث العلمي والقانون والمالية والتأمين والهندسة وغيرها. (ملخص سابق: OpenAI تطلق نسخة كاملة من النموذج o1 وخطة الاشتراك الجديدة ChatGPT Pro ، هل تستحق 200 دولار شهريًا؟) (ملحق: أعلنت OpenAI أنها ستبث مباشرة لمدة 12 يومًا: هل يمكن التجسس على العملة الرقمية في الكمين؟) في اليوم الثاني من فعالية المنتج ، أطلق OpenAI ميزة جديدة "تعديل التعزيز" (Reinforcement Fine-Tuning ، RFT) ، مما يتيح للمستخدمين استخدام مجموعة البيانات الخاصة بهم لتدريب النموذج o1 باستخدام خوارزميات التعلم التعزيزي المخصصة. بالإضافة إلى ذلك ، أشار مضيف الفعالية إلى أن تحسين التعزيز يتطلب عددًا قليلاً من الأمثلة عالية الجودة لتحسين قدرة الاستدلال للنموذج في المجال المحدد. يجدر بالذكر أن هذه الميزة يمكن استخدامها في مجالات متعددة بما في ذلك البحث العلمي والقانون والمالية والتأمين والهندسة وغيرها. بالإضافة إلى ذلك ، شارك جاستن ريس ، عالم الحوسبة الحيوية في مختبر بيركلي الوطني ، في عرض النموذج المباشر وشارك كيف يساعد "تعديل التعزيز" في تشخيص الأمراض النادرة. في الصور التي قدمها Reese ، يمكن رؤية أن دقة التعرف الأصلية للنموذج o1 هي 25٪ ، ودقة التعرف الأصلية للنموذج o1 mini هي 17٪ ، وبعد تعديل التعزيز ، ارتفعت دقة النموذج o1 mini إلى 31٪ ، وزيادة الدقة بلغت 82٪. على الرغم من أن وظيفة "تعديل التعزيز" تحسن بشكل كبير دقة النموذج في المجال المحدد والاحترافية ، إلا أن المضيف أوضح أن وظيفة تعديل التعزيز لا تزال في مرحلة المعاينة ومن المخطط إطلاقها للجمهور في العام المقبل. بالإضافة إلى ذلك ، قامت OpenaAI بتشغيل برنامج RFT alpha حاليًا ، حثت الجامعات والمؤسسات البحثية والشركات على المشاركة في اختبار هذه الوظيفة. تقارير ذات صلة تكشف أن ChatGPT يرفض الرد على أسماء شخصية مثل "David Mayer" ، ويشتبه في أن OpenAI يقوم بحجب المعلومات. أعلنت OpenAI أنها ستبث مباشرة لمدة 12 يومًا: هل يمكن التجسس على العملة الرقمية في الكمين؟ تم إطلاق نسخة كاملة من النموذج o1 وخطة الاشتراك الجديدة ChatGPT Pro ، هل تستحق 200 دولار شهريًا؟ (مقال OpenAI يكشف عن وظيفة "تعديل التعزيز" الرائعة لزيادة دقة تعلم المجالات الاحترافية للذكاء الاصطناعي)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

0/400

لا توجد تعليقات

الموضوع
#Show My Alpha Points
106k درجة الشعبية
#ETH Breaks $4,600
10k درجة الشعبية
#CPI Data Coming
22k درجة الشعبية
#TOKEN OF LOVE IS BACK
24k درجة الشعبية
#Circle Launches ARC
2k درجة الشعبية

تثبيت

خريطة الموقع