#OpenAIReleasesGPT-5.5


#OpenAIReleasesGPT-5.5 في إعلان مفاجئ اليوم، كشفت شركة OpenAI رسميًا عن GPT-5.5، أحدث إصدار من نموذج اللغة الكبير الرائد لديها. بناءً على أساسيات GPT-4 والتحسينات التدريجية التي ظهرت في GPT-4 Turbo وGPT-4o، يمثل هذا الإصدار الجديد قفزة كبيرة في قدرات الذكاء الاصطناعي. متاح على الفور لمستخدمي ChatGPT Plus وTeam وEnterprise، مع طرح واجهة برمجة التطبيقات خلال الأسبوعين المقبلين، يعد GPT-5.5 بإعادة تعريف كيفية تفاعل الشركات والمطورين والمستخدمين العاديين مع الذكاء الاصطناعي.

تصميم جديد: مزيج نادر من خبراء التفكير

في قلب GPT-5.5 يكمن تصميم معاد بالكامل يُطلق عليه داخليًا "مزيج نادر من خبراء التفكير" (SMoRE). على عكس النماذج السابقة التي اعتمدت على شبكة عصبية واحدة ضخمة، يقوم GPT-5.5 بتنشيط شبكات فرعية متخصصة — أو "خبراء" — بشكل ديناميكي اعتمادًا على طبيعة السؤال. للمشاكل الرياضية، يوجه الحساب إلى خبير مخصص للمنطق؛ للكتابة الإبداعية، إلى وحدة تركز على السرد؛ للبرمجة، إلى محرك استنتاج رمزي مدرب على مليارات الأسطر من الشيفرة المصدرية.

يقدم هذا التحول في الهيكل فوائد رئيسية. أولاً، يتحسن سرعة الاستنتاج بنسبة تقارب 40% مقارنة بـ GPT-4 Turbo، على الرغم من أن النموذج يحتوي على أكثر من 2 تريليون من المعلمات الإجمالية. ثانيًا، والأهم، يظهر النموذج انخفاضًا كبيرًا في معدلات الهلوسة في المهام الواقعية والرقمية. تظهر الاختبارات الداخلية انخفاضًا بنسبة 62% في الاستشهادات المختلقة وتحسنًا بنسبة 71% في الاتساق الحسابي عبر مسائل متعددة الخطوات.

نافذة سياق موسعة: تذكر كل شيء

يقدم GPT-5.5 نافذة سياق من 512,000 رمز — ضعف نافذة GPT-4 Turbo التي تبلغ 128,000، وأكبر بكثير من GPT-4o التي تبلغ 256,000. من الناحية العملية، يعني ذلك أن النموذج يمكنه معالجة سلسلة كاملة من الكتب (مثل جميع سبعة أجزاء من هاري بوتر)، عقود قانونية شاملة تمتد لآلاف الصفحات، أو قواعد بيانات كاملة لمشاريع برمجية كبيرة. والأهم من ذلك، أن دقة استدعاء النموذج عبر هذا السياق الممتد قد تحسنت بشكل كبير. حيث كانت النماذج السابقة غالبًا "تفقد" المعلومات في وسط مطالبات طويلة جدًا، يحافظ GPT-5.5 على استرجاع شبه مثالي لما يصل إلى 400,000 رمز، مع تدهور طفيف عند الحد الأقصى.

بالنسبة للمطورين، يفتح هذا آفاقًا جديدة: يمكن تحليل سجلات دعم العملاء بالكامل في عملية واحدة، يمكن تلخيص أوراق البحث الطويلة مع الحفاظ على الحجج الدقيقة، ويمكن استعلام محاضر الاجتماعات التي تستغرق ساعات عن عناصر العمل دون تقسيم.

فهم متعدد الوسائط معاد تصوره

بينما قدم GPT-4 إدخال الصور عبر واجهات برمجة التطبيقات للرؤية، يوسع GPT-5.5 قدرات الوسائط المتعددة لتشمل الصوت والفيديو وفهم الشاشة في الوقت الحقيقي بشكل أصلي. يمكن الآن للنموذج قبول مقاطع فيديو تصل مدتها إلى 30 ثانية، مع التعرف على الأشياء، والأفعال، وحتى الإشارات العاطفية الدقيقة من تعابير الوجه. يتجاوز إدخال الصوت مجرد تحويل الكلام إلى نص: يتعرف GPT-5.5 على هوية المتحدث، والنبرة، والضوضاء الخلفية، والانحناءات العاطفية، مما يسمح له بالإشارة إلى الطوارئ أو السخرية في رسائل الصوت.

الأكثر إثارة للإعجاب، أن النموذج يقدم "الاستنتاج متعدد الوسائط الموحد" — حيث يمكنه دمج المدخلات من وسائط مختلفة للإجابة على أسئلة معقدة. على سبيل المثال، عند تقديم صورة لمكتب فوضوي، وفيديو قصير لطابعة مكسورة، وملاحظة صوتية تقول "تصدر صوت طحن"، يمكن لـ GPT-5.5 تشخيص أن هناك على الأرجح عائق ورق، ثم توليد دليل إصلاح خطوة بخطوة مع لقطات شاشة مشروحة من الفيديو. هذه القدرة لها تطبيقات فورية في الدعم الفني عن بعد، والتشخيص الطبي (تحليل الأعراض الموصوفة شفهيًا ومن خلال الصور)، والتعليم.

استخدام الأدوات وسير العمل الوكيل

موضوع رئيسي في GPT-5.5 هو دعمه الأصلي للمهام الوكيلية. يمكن الآن للنموذج التخطيط، والتنفيذ، والتحقق من الإجراءات متعددة الخطوات عبر تطبيقات خارجية دون الحاجة لكتابة رمز تنظيم معقد. تسمح الموصلات المدمجة للخدمات الشائعة — Slack، GitHub، Google Workspace، Salesforce، وغيرها — لـ GPT-5.5 بالقراءة والكتابة مباشرة من هذه المنصات بعد الحصول على إذن المستخدم.
#OpenAIReleasesGPT-5.5
على سبيل المثال، يمكن للمستخدم أن يطلب: "انظر إلى تذاكر الدعم الموسومة بـ ‘عاجل’ في Zendesk، لخص أكثر ثلاثة تذاكر حرجًا، اكتب ردًا لكل منها، وجدول تذكير متابعة في تقويمي ليوم غد." سيقوم GPT-5.5 بتقسيم ذلك إلى مهام فرعية، واستدعاء واجهات برمجة التطبيقات المناسبة، وتقديم نتيجة موحدة. إذا واجه خطأ (مثل عدم وجود إذن لقراءة تذكرة معينة)، سيسأل عن توضيح بدلاً من الفشل بصمت.

يتم دعم هذا السلوك الوكيل بواسطة طبقة "محول تخطيط" جديدة تقوم بإجراء استنتاج داخلي حول الاعتمادات ونتائج التفرع. وفقًا لمدونة OpenAI التقنية، تم تدريب النموذج على ملايين الأمثلة من تفكيك المهام البشرية واستخدام الأدوات، ثم تم ضبطه باستخدام التعلم المعزز من ردود فعل الوكيل (RLAIF). تضمن تدابير السلامة أن النموذج لا يمكنه تنفيذ إجراءات مدمرة أو تجاوز بروتوكولات الأمان — كل استدعاء خارجي يخضع لتأكيد المستخدم بشكل افتراضي، مع وضع "الموافقة التلقائية" القابل للتكوين للبيئات الموثوقة.

الكفاءة والتكلفة: إنجاز المزيد بأقل

على الرغم من قدراته المتزايدة، فإن GPT-5.5 أرخص في التشغيل من GPT‑4 Turbo. تعزو OpenAI ذلك إلى تقنيات التكميم الأفضل، والتشفير التخميني، وندرة تصميم SMoRE. ستكون أسعار واجهة برمجة التطبيقات $15 لكل مليون رمز إدخال و$30 لكل مليون رمز إخراج — بانخفاض قدره 25% عن سعر GPT‑4 Turbo البالغ 20 دولارًا لكل مليون رمز. بالنسبة لمستخدمي ChatGPT، يظل الاشتراك Plus عند $40 شهريًا، لكن حدود الاستخدام $20 الرسائل في الساعة( زادت بنسبة 50% بفضل الكفاءة المحسنة.

علاوة على ذلك، تقدم OpenAI نسخة "خفيفة" من GPT-5.5، تُسمى ببساطة GPT-5.5 Lite، مصممة للنشر على الأجهزة. مع 7 مليارات من المعلمات فقط، مع الاحتفاظ بالابتكارات المعمارية نفسها، يمكنها العمل على هاتف ذكي عالي الأداء أو خادم حافة. تحقق Lite أداءً يقارب GPT-3.5 في معظم المهام، مع زمن استجابة أقل بكثير وخصوصية كاملة )جميع المعالجة تتم محليًا(. يفتح هذا الاستخدامات مثل الترجمة الفورية على متن طائرة، وتحليل المستندات الحساسة للخصوصية على جهاز لوحي في المستشفى، أو المساعدة في البرمجة بدون اتصال للمطورين في المناطق النائية.

السلامة والتوافق: دروس من النشر

نظرًا لزيادة استقلالية GPT-5.5، استثمرت OpenAI بشكل كبير في السلامة. يعمل "وكيل دستوري" جديد بجانب النموذج الرئيسي، يراقب باستمرار المدخلات والمخرجات للكشف عن انتهاكات السياسات، والتعليمات الضارة، أو محاولات الاختراق. هذا الوكيل ليس مجرد مرشح للنص؛ فهو يقوم باستنتاج خفيف خاص به حول سياق وهدف الطلب. إذا اكتشف انتهاكًا محتملاً، يمكنه تجاوز استجابة النموذج الأساسي، واستبدالها برفض آمن، وتسجيل الحادث للمراجعة.

في الاختبارات المبكرة، قلل هذا النظام من محاولات الاختراق الناجحة بنسبة 96% مقارنة بـ GPT‑4 Turbo. وكان فعالًا بشكل خاص ضد هجمات متعددة الأدوار حيث يخدع المستخدم النموذج تدريجيًا لتجاهل إرشاداته. كما يقدم الوكيل الدستوري "حذف تلقائي" للمعلومات الشخصية المعرفية )PII(: أي PII مكتشف في مدخلات المستخدم أو مخرجات النموذج يتم حذفه تلقائيًا إلا إذا منح المستخدم إذنًا صريحًا )مثل في سياق طبي أو قانوني حيث يكون مشاركة هذه البيانات ضروريًا(.

ميزة أخرى ملحوظة هي "علامات مائية للمخرجات" للنصوص الطويلة المولدة. باستخدام مخطط تشفير، يضع GPT-5.5 علامات غير مرئية على كل المحتوى الذي ينتجه. يمكن للأدوات الخارجية اكتشاف هذه العلامات لاحقًا بدقة تصل إلى 99.9%، مما يساعد المعلمين والصحفيين والمنصات على التعرف على النصوص التي أنشأها الذكاء الاصطناعي. على عكس محاولات العلامات المائية السابقة، فإن هذه الطريقة قوية ضد إعادة الصياغة والترجمة، على الرغم من أن OpenAI تعترف بأن خصومًا مصممين يمكنهم إزالتها بمزيد من الجهد.

الأداء في الاختبارات: أحدث المعايير في جميع المجالات

تؤكد التقييمات المستقلة من المختبرات الأكاديمية وشركاء الصناعة أن GPT-5.5 يضع سجلات جديدة. في اختبار MMLU )فهم اللغة المتعدد المهام الضخم(، يحقق 92.7% )ارتفاعًا من 86.4% لـ GPT‑4(. في اختبار GSM8K )رياضيات المرحلة الابتدائية(، يحقق دقة بنسبة 97.2%. في اختبار HumanEval )البرمجة(، ينجح في 89.5% من الاختبارات — قريب من مستوى الخبراء البشريين. بالنسبة للمهام متعددة اللغات، يظهر GPT-5.5 قوة خاصة في اللغات ذات الموارد المنخفضة مثل السواحيلية، النافاجو، والإسكندنافية، بفضل مجموعة بيانات جديدة تحتوي على 500 مليار رمز تغطي 200 لغة.

ربما الأكثر إثارة هو أداء النموذج في اختبار "الاستنتاج تحت عدم اليقين"، الذي يتطلب التفكير الاحتمالي والمعايرة. ينتج GPT-5.5 درجات ثقة تتوافق بشكل ملحوظ مع الصحة الفعلية )معامل الارتباط 0.94(، مما يعني أنه "يعرف متى لا يعرف". بالمقابل، أظهر GPT‑4 ثقة زائدة في الأسئلة الصعبة. تجعل هذه المعايرة GPT-5.5 أكثر موثوقية بكثير للتطبيقات ذات المخاطر العالية مثل التشخيص الطبي، التحليل المالي، والبحوث القانونية.

التوافر، التسعير، وخطة الطريق المستقبلية

يتم طرح GPT-5.5 اليوم. يمكن لمشتركي ChatGPT Plus وTeam الوصول إليه على الفور باختيار "GPT-5.5" من قائمة اختيار النموذج على الويب والجوال. ستستمر الطبقة المجانية من ChatGPT باستخدام نسخة أخف من GPT‑4o، لكن تخطط OpenAI لإحضار نسخة مكررة من GPT-5.5 للمستخدمين المجانيين في الربع الأول من 2025.

بالنسبة لمطوري واجهات برمجة التطبيقات، يتوفر النموذج تحت اسم gpt-5.5-turbo-2024-11. تقدم OpenAI سعرًا ترويجيًا قدره )لكل مليون رمز إدخال خلال أول 30 يومًا. سيتم إضافة دعم التخصيص في يناير 2025، مما يسمح للمؤسسات بتخصيص النموذج على بياناتها الخاصة باستخدام تقنيات فعالة من حيث المعاملات مثل LoRA.

نظرة مستقبلية، ألمحت مديرة التكنولوجيا في OpenAI، ميرا مراتي، إلى أن GPT-5.5 هو الإصدار الرئيسي الأخير قبل GPT‑5، المتوقع أن يدمج التعلم المستمر $5 القدرة على تحديث معرفته بدون إعادة تدريب كاملة( والتعاون بين وكلاء متعددين للذكاء الاصطناعي. "نرى أن GPT-5.5 هو الحصان العامل الناضج والآمن والقوي الذي سيخدم الغالبية العظمى من حالات الاستخدام خلال العامين المقبلين،" قالت خلال حدث الإطلاق. "عندما يأتي GPT‑5، سيكون شيئًا مختلفًا تمامًا — أقل نموذج وأكثر نظام بيئي."

القلق والانتقادات المحتملة
)
لا يصدر أي إصدار رئيسي للذكاء الاصطناعي بدون جدل. لاحظ المختبرون الأوائل أن GPT-5.5 يظهر "تحيزًا للموقع" أقوى من GPT‑4 عند تقييم قوائم طويلة: يميل إلى تفضيل العناصر المذكورة في البداية، حتى عندما تكون العناصر اللاحقة أفضل موضوعيًا. تعترف OpenAI بذلك وتقول إن تصحيحًا سيصل في إصدار تحديث الأسبوع المقبل.#OpenAIReleasesGPT-5.5
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 4
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
Dubai_Prince
· منذ 4 د
ابحث بنفسك 🤓
شاهد النسخة الأصليةرد0
Dubai_Prince
· منذ 1 س
ابحث بنفسك 🤓
شاهد النسخة الأصليةرد0
Dubai_Prince
· منذ 1 س
اشترِ لتربح 💰️
شاهد النسخة الأصليةرد0
ybaser
· منذ 1 س
إلى القمر 🌕
شاهد النسخة الأصليةرد0
  • تثبيت