في اليوم الثاني من إطلاق منتجات OpenAI ، تم إطلاق وظيفة "تعديل التعزيز" (Reinforcement Fine-Tuning ، RFT) ، مما يتيح للمستخدمين تحسين قدرة الاستدلال للنموذج المخصص في مجالات مختلفة وبالتالي زيادة دقة النموذج. يمكن استخدام هذه الوظيفة في مجالات متعددة بما في ذلك البحث العلمي والقانون والمالية والتأمين والهندسة وغيرها. (ملخص سابق: OpenAI تطلق نسخة كاملة من النموذج o1 وخطة الاشتراك الجديدة ChatGPT Pro ، هل تستحق 200 دولار شهريًا؟) (ملحق: أعلنت OpenAI أنها ستبث مباشرة لمدة 12 يومًا: هل يمكن التجسس على العملة الرقمية في الكمين؟) في اليوم الثاني من فعالية المنتج ، أطلق OpenAI ميزة جديدة "تعديل التعزيز" (Reinforcement Fine-Tuning ، RFT) ، مما يتيح للمستخدمين استخدام مجموعة البيانات الخاصة بهم لتدريب النموذج o1 باستخدام خوارزميات التعلم التعزيزي المخصصة. بالإضافة إلى ذلك ، أشار مضيف الفعالية إلى أن تحسين التعزيز يتطلب عددًا قليلاً من الأمثلة عالية الجودة لتحسين قدرة الاستدلال للنموذج في المجال المحدد. يجدر بالذكر أن هذه الميزة يمكن استخدامها في مجالات متعددة بما في ذلك البحث العلمي والقانون والمالية والتأمين والهندسة وغيرها. بالإضافة إلى ذلك ، شارك جاستن ريس ، عالم الحوسبة الحيوية في مختبر بيركلي الوطني ، في عرض النموذج المباشر وشارك كيف يساعد "تعديل التعزيز" في تشخيص الأمراض النادرة. في الصور التي قدمها Reese ، يمكن رؤية أن دقة التعرف الأصلية للنموذج o1 هي 25٪ ، ودقة التعرف الأصلية للنموذج o1 mini هي 17٪ ، وبعد تعديل التعزيز ، ارتفعت دقة النموذج o1 mini إلى 31٪ ، وزيادة الدقة بلغت 82٪. على الرغم من أن وظيفة "تعديل التعزيز" تحسن بشكل كبير دقة النموذج في المجال المحدد والاحترافية ، إلا أن المضيف أوضح أن وظيفة تعديل التعزيز لا تزال في مرحلة المعاينة ومن المخطط إطلاقها للجمهور في العام المقبل. بالإضافة إلى ذلك ، قامت OpenaAI بتشغيل برنامج RFT alpha حاليًا ، حثت الجامعات والمؤسسات البحثية والشركات على المشاركة في اختبار هذه الوظيفة. تقارير ذات صلة تكشف أن ChatGPT يرفض الرد على أسماء شخصية مثل "David Mayer" ، ويشتبه في أن OpenAI يقوم بحجب المعلومات. أعلنت OpenAI أنها ستبث مباشرة لمدة 12 يومًا: هل يمكن التجسس على العملة الرقمية في الكمين؟ تم إطلاق نسخة كاملة من النموذج o1 وخطة الاشتراك الجديدة ChatGPT Pro ، هل تستحق 200 دولار شهريًا؟ (مقال OpenAI يكشف عن وظيفة "تعديل التعزيز" الرائعة لزيادة دقة تعلم المجالات الاحترافية للذكاء الاصطناعي)
شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
أعلنت OpenAI في اليوم الثاني عن ميزة جديدة لتعديل التعلم التعزيزي تعزز دقة تعلم المجالات المهنية للذكاء الاصطناعي
في اليوم الثاني من إطلاق منتجات OpenAI ، تم إطلاق وظيفة "تعديل التعزيز" (Reinforcement Fine-Tuning ، RFT) ، مما يتيح للمستخدمين تحسين قدرة الاستدلال للنموذج المخصص في مجالات مختلفة وبالتالي زيادة دقة النموذج. يمكن استخدام هذه الوظيفة في مجالات متعددة بما في ذلك البحث العلمي والقانون والمالية والتأمين والهندسة وغيرها. (ملخص سابق: OpenAI تطلق نسخة كاملة من النموذج o1 وخطة الاشتراك الجديدة ChatGPT Pro ، هل تستحق 200 دولار شهريًا؟) (ملحق: أعلنت OpenAI أنها ستبث مباشرة لمدة 12 يومًا: هل يمكن التجسس على العملة الرقمية في الكمين؟) في اليوم الثاني من فعالية المنتج ، أطلق OpenAI ميزة جديدة "تعديل التعزيز" (Reinforcement Fine-Tuning ، RFT) ، مما يتيح للمستخدمين استخدام مجموعة البيانات الخاصة بهم لتدريب النموذج o1 باستخدام خوارزميات التعلم التعزيزي المخصصة. بالإضافة إلى ذلك ، أشار مضيف الفعالية إلى أن تحسين التعزيز يتطلب عددًا قليلاً من الأمثلة عالية الجودة لتحسين قدرة الاستدلال للنموذج في المجال المحدد. يجدر بالذكر أن هذه الميزة يمكن استخدامها في مجالات متعددة بما في ذلك البحث العلمي والقانون والمالية والتأمين والهندسة وغيرها. بالإضافة إلى ذلك ، شارك جاستن ريس ، عالم الحوسبة الحيوية في مختبر بيركلي الوطني ، في عرض النموذج المباشر وشارك كيف يساعد "تعديل التعزيز" في تشخيص الأمراض النادرة. في الصور التي قدمها Reese ، يمكن رؤية أن دقة التعرف الأصلية للنموذج o1 هي 25٪ ، ودقة التعرف الأصلية للنموذج o1 mini هي 17٪ ، وبعد تعديل التعزيز ، ارتفعت دقة النموذج o1 mini إلى 31٪ ، وزيادة الدقة بلغت 82٪. على الرغم من أن وظيفة "تعديل التعزيز" تحسن بشكل كبير دقة النموذج في المجال المحدد والاحترافية ، إلا أن المضيف أوضح أن وظيفة تعديل التعزيز لا تزال في مرحلة المعاينة ومن المخطط إطلاقها للجمهور في العام المقبل. بالإضافة إلى ذلك ، قامت OpenaAI بتشغيل برنامج RFT alpha حاليًا ، حثت الجامعات والمؤسسات البحثية والشركات على المشاركة في اختبار هذه الوظيفة. تقارير ذات صلة تكشف أن ChatGPT يرفض الرد على أسماء شخصية مثل "David Mayer" ، ويشتبه في أن OpenAI يقوم بحجب المعلومات. أعلنت OpenAI أنها ستبث مباشرة لمدة 12 يومًا: هل يمكن التجسس على العملة الرقمية في الكمين؟ تم إطلاق نسخة كاملة من النموذج o1 وخطة الاشتراك الجديدة ChatGPT Pro ، هل تستحق 200 دولار شهريًا؟ (مقال OpenAI يكشف عن وظيفة "تعديل التعزيز" الرائعة لزيادة دقة تعلم المجالات الاحترافية للذكاء الاصطناعي)