أعلنت علي عن الجيل الجديد من نموذج القالب الذكي 3.5، متصدرًا قائمة أقوى النماذج المفتوحة المصدر على مستوى العالم

في يوم عيد الربيع في 16 فبراير، أطلقت شركة علي بابا نموذجها الكبير الجديد من الجيل التالي، Qwen3.5-Plus، وهو نموذج مفتوح المصدر يضاهي أداؤه Gemini 3 Pro، ويتصدر قائمة أقوى النماذج المفتوحة المصدر على مستوى العالم.

وفقًا للمعلومات، حقق Qwen3.5 ثورة شاملة في بنية النموذج الأساسية، حيث يبلغ إجمالي المعلمات في إصدار Qwen3.5-Plus المُطلق 397 مليار، مع تفعيل فقط 17 مليار، مما يمنحه ميزة صغيرة على الكبير، ويتفوق على نموذج Qwen3-Max الذي يضم تريليونات المعلمات، مع تقليل استهلاك الذاكرة المخصصة للنشر بنسبة 60%، وزيادة كفاءة الاستنتاج بشكل كبير، حيث يمكن أن يصل أقصى معدل استنتاج إلى 19 ضعفًا. سعر واجهة برمجة التطبيقات الخاصة بـ Qwen3.5-Plus منخفض جدًا، حيث يبلغ 0.8 يوان لكل مليون رمز، وهو فقط 1/18 من سعر Gemini 3 Pro.

وبخلاف الأجيال السابقة من نماذج اللغة الكبيرة، حقق Qwen3.5 قفزة نوعية من نموذج يعتمد على النصوص فقط إلى نموذج متعدد الوسائط أصلي. حيث تم تدريب Qwen3 على رموز النصوص فقط، بينما تم تدريب Qwen3.5 على رموز مختلطة من الصور والنصوص، مع إضافة كمية كبيرة من البيانات باللغتين الصينية والإنجليزية، واللغات المتعددة، وبيانات STEM، وبيانات الاستنتاج، مما مكن النموذج من تعلم معرفة العالم بشكل أكثر كثافة ومنطق استنتاج أكثر تطورًا. ونتيجة لذلك، حقق أداءً فائقًا بأقل من 40% من حجم المعلمات مقارنة بنموذج Qwen3-Max الذي يضم تريليونات من المعلمات، في مجالات الاستنتاج، والبرمجة، ووكيل الذكاء الاصطناعي، وغيرها من التقييمات الشاملة، حيث حصل على 87.8 نقطة في اختبار المعرفة والاستنتاج MMLU-Pro، متفوقًا على GPT-5.2؛ وحقق 88.4 نقطة في اختبار المشكلات الصعبة على مستوى الدكتوراه GPQA، متفوقًا على Claude 4.5؛ وحقق رقمًا قياسيًا في اختبار الالتزام بالتعليمات IFBench بمعدل 76.5 نقطة؛ وفي تقييمات الوكيل العام مثل BFCL-V4، وتقييم وكيل البحث Browsecomp، تفوق Qwen3.5 على Gemini 3 Pro وGPT-5.2.

كما أدى التدريب متعدد الوسائط الأصلي إلى قفزة نوعية في قدرات الرؤية لدى Qwen3.5: ففي العديد من التقييمات المرموقة مثل الاستنتاج متعدد الوسائط MathVison، والأسئلة والأجوبة البصرية العامة VQA (RealWorldQA)، والتعرف على النصوص وفهم الملفات (CC_OCR)، والذكاء المكاني (RefCOCO-avg)، وفهم الفيديو (MLVU)، حقق Qwen3.5 أفضل أداء. وفي مهام حل المسائل العلمية، وتخطيط المهام، والاستنتاج في الفضاء الفيزيائي، تفوق Qwen3.5 على النموذج الخاص Qwen3-VL، مع تعزيز قدرات تحديد المواقع والاستنتاج باستخدام الصور بشكل كبير، مع تحليل استنتاجي أكثر دقة وتفصيلًا. وفي مجال فهم الفيديو، يدعم Qwen3.5 إدخال فيديوهات طويلة تصل إلى ساعتين (محتوى 1 مليون رمز في السياق)، مما يجعله مناسبًا لتحليل المحتوى الطويل وتوليد الملخصات. كما حقق Qwen3.5 دمجًا أصليًا بين فهم الصور والقدرة على البرمجة، مع أدوات البحث بالصور وإنشاء الصور، حيث يمكنه تحويل رسومات الواجهات اليدوية مباشرة إلى رموز أمامية قابلة للاستخدام، ويمكنه تحديد وإصلاح مشكلات واجهة المستخدم من خلال لقطة شاشة واحدة، مما يجعل البرمجة البصرية أداة إنتاجية حقيقية.

تم تنفيذ التدريب متعدد الوسائط الأصلي لـ Qwen3.5 بكفاءة عالية على بنية تحتية للذكاء الاصطناعي من علي بابا سحابة. من خلال سلسلة من الابتكارات التقنية الأساسية، اقترب معدل إنتاجية التدريب على البيانات المختلطة من النصوص والصور والفيديو من مستوى تدريب نماذج النصوص الصافية، مما يقلل بشكل كبير من عتبة صعوبة التدريب متعدد الوسائط الأصلي؛ بالإضافة إلى ذلك، من خلال استراتيجيات تطبيق دقة FP8 وFP32 المصممة بشكل متقن، عند توسيع التدريب ليشمل مئات التريليونات من الرموز، انخفض استهلاك الذاكرة النشطة بنسبة حوالي 50%، وزادت سرعة التدريب بنسبة 10%، مما يوفر تكاليف تدريب النموذج ويزيد من كفاءته.

كما حقق Qwen3.5 تقدمًا جديدًا من إطار عمل الوكيل إلى تطبيق الوكيل. حيث يمكن لـ Qwen3.5 التحكم بشكل مستقل في الهواتف الذكية وأجهزة الكمبيوتر، وأداء المهام اليومية بكفاءة، ودعم المزيد من التطبيقات والأوامر على الأجهزة المحمولة، ومعالجة عمليات أكثر تعقيدًا على الحواسيب، مثل تنظيم البيانات عبر التطبيقات، وتنفيذ العمليات الآلية، مما يعزز بشكل كبير من كفاءة العمليات. بالإضافة إلى ذلك، أنشأ فريق Qwen إطار عمل للتعلم المعزز غير المتزامن للوكيل يمكن توسيعه، بحيث يمكن تسريع العمليات من 3 إلى 5 مرات، ودعم توسيع الوكيل الذكي القابل للإضافة إلى ملايين الوكلاء.

وفقًا للمعلومات، تم دمج نموذج Qwen3.5-Plus في تطبيقات Qwen على الهاتف المحمول والكمبيوتر الشخصي بشكل فوري. يمكن للمطورين تنزيل النموذج الجديد من مجتمع 魔搭 وHuggingFace، أو الحصول على خدمات API مباشرة عبر Alibaba Cloud Balian. وسيسرع علي بابا من إصدار نماذج Qwen3.5 بأحجام ووظائف مختلفة في المستقبل القريب. كما سيتم إصدار النموذج الرائد Qwen3.5-Max، الذي يتمتع بأداء أقوى، قريبًا.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.48Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.58Kعدد الحائزين:2
    0.80%
  • القيمة السوقية:$2.5Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.54Kعدد الحائزين:2
    0.13%
  • القيمة السوقية:$2.51Kعدد الحائزين:2
    0.00%
  • تثبيت