في يوم عيد الربيع في 16 فبراير، أطلقت شركة علي بابا نموذجها الكبير الجديد من الجيل التالي، Qwen3.5-Plus، وهو نموذج مفتوح المصدر يضاهي أداؤه Gemini 3 Pro، ويتصدر قائمة أقوى النماذج المفتوحة المصدر على مستوى العالم.
وفقًا للمعلومات، حقق Qwen3.5 ثورة شاملة في بنية النموذج الأساسية، حيث يبلغ إجمالي المعلمات في إصدار Qwen3.5-Plus 397 مليارًا، مع تفعيل فقط 17 مليارًا، مما يمنحه تفوقًا على النماذج ذات المعلمات الأكبر، حيث يتفوق أداؤه على نموذج Qwen3-Max الذي يضم تريليونات من المعلمات، مع تقليل استهلاك الذاكرة المخصصة للنشر بنسبة 60%، وزيادة كفاءة الاستنتاج بشكل كبير، حيث يمكن أن يصل أقصى معدل استنتاج إلى 19 ضعفًا. سعر واجهة برمجة التطبيقات (API) لـ Qwen3.5-Plus منخفض جدًا، حيث يبلغ 0.8 يوان لكل مليون رمز، وهو فقط 1/18 من سعر Gemini 3 Pro.
على عكس الأجيال السابقة من نماذج اللغة الكبيرة، حقق Qwen3.5 قفزة نوعية من نموذج يعتمد على النصوص فقط إلى نموذج متعدد الوسائط أصلي. حيث تم تدريب Qwen3 على رموز النصوص فقط، بينما تم تدريب Qwen3.5 على رموز مختلطة من الصور والنصوص، مع إضافة كمية كبيرة من البيانات باللغتين الصينية والإنجليزية، واللغات المتعددة، وبيانات STEM، وبيانات الاستنتاج، مما مكن النموذج من تعلم معرفة العالم بشكل أكثر كثافة ومنطق استنتاج أكثر دقة، مع تحقيق أداء يفوق تريليونات المعلمات لنموذج Qwen3-Max، وذلك بأقل من 40% من حجم المعلمات، مع أداء ممتاز في مجالات الاستنتاج، والبرمجة، ووكيل الذكاء الاصطناعي، وغيرها من التقييمات الشاملة. على سبيل المثال، حقق Qwen3.5 في اختبار المعرفة والاستنتاج MMLU-Pro درجة 87.8، متفوقًا على GPT-5.2؛ وفي اختبار المشكلات الصعبة على مستوى الدكتوراه GPQA حصل على 88.4، متفوقًا على Claude 4.5؛ وفي اختبار الالتزام بالتعليمات IFBench سجل 76.5، محطماً جميع الأرقام القياسية؛ وفي تقييمات الوكيل العام مثل BFCL-V4 وتقييم وكيل البحث Browsecomp، تفوق Qwen3.5 على Gemini 3 Pro وGPT-5.2.
كما أدى التدريب متعدد الوسائط الأصلي إلى قفزة نوعية في قدرات الرؤية لدى Qwen3.5: ففي العديد من التقييمات المرموقة مثل الاستنتاج متعدد الوسائط MathVison، والأسئلة والأجوبة البصرية العامة VQA (RealWorldQA)، والتعرف على النصوص وفهم الملفات (CC_OCR)، والذكاء المكاني (RefCOCO-avg)، وفهم الفيديو (MLVU)، حقق Qwen3.5 أفضل أداء. وفي مهام حل المسائل، وتخطيط المهام، والاستنتاج في الفضاء الفيزيائي، تفوق Qwen3.5 على نموذج Qwen3-VL الخاص، مع تعزيز قدرات تحديد المواقع والاستنتاج باستخدام الصور بشكل كبير، مع تحليل أكثر دقة وتفصيلًا؛ وفي مجال فهم الفيديو، يدعم Qwen3.5 إدخال الفيديوهات التي تصل مدتها إلى ساعتين (بما يعادل مليون رمز في السياق)، مما يجعله مناسبًا لتحليل المحتوى الطويل وتوليد الملخصات؛ بالإضافة إلى ذلك، حقق Qwen3.5 دمجًا أصليًا بين فهم الصور والقدرة على البرمجة، مع أدوات البحث عن الصور وإنشاء الصور، بحيث يمكنه تحويل رسومات الواجهات اليدوية مباشرة إلى رموز أمامية قابلة للاستخدام، ويمكنه تحديد وإصلاح مشكلات واجهة المستخدم من خلال لقطة شاشة واحدة، مما يجعل البرمجة البصرية أداة إنتاجية حقيقية.
تم إنجاز التدريب متعدد الوسائط الأصلي لـ Qwen3.5 بكفاءة عالية على بنية تحتية للذكاء الاصطناعي من علي بابا سحابة. من خلال سلسلة من الابتكارات التقنية الأساسية، اقترب معدل معالجة البيانات في تدريب Qwen3.5 على البيانات المختلطة من مستوى تدريب نماذج النصوص فقط، مما يقلل بشكل كبير من عتبة صعوبة التدريب متعدد الوسائط الأصلي؛ بالإضافة إلى ذلك، من خلال استراتيجيات تطبيق دقة FP8 وFP32 المصممة بشكل متقن، عند توسيع التدريب ليشمل مئات التريليونات من الرموز، انخفض استهلاك الذاكرة النشطة بنسبة حوالي 50%، وزادت سرعة التدريب بنسبة 10%، مما أدى إلى تقليل تكاليف تدريب النموذج وزيادة كفاءته.
كما حقق Qwen3.5 تقدمًا جديدًا من إطار عمل الوكيل (Agent) إلى تطبيقات الوكيل. حيث يمكن لـ Qwen3.5 التحكم بشكل مستقل في الهواتف الذكية وأجهزة الكمبيوتر، وأداء المهام اليومية بكفاءة، مع دعم المزيد من التطبيقات والأوامر على الأجهزة المحمولة، ومعالجة عمليات أكثر تعقيدًا على الحواسيب، مثل تنظيم البيانات عبر التطبيقات، وتنفيذ العمليات الآلية، مما يعزز بشكل كبير من كفاءة التشغيل. بالإضافة إلى ذلك، أنشأ فريق Qwen إطار عمل للتعلم المعزز غير المتزامن للوكيل يمكن توسيعه بشكل مرن، مع تسريع العمليات من 3 إلى 5 مرات، ودعم توسيع الوكيل الذكي القابل للإضافة إلى ملايين الوكلاء.
وفقًا للمعلومات، تم دمج نموذج Qwen3.5-Plus في تطبيقات Qwen على الهاتف المحمول والكمبيوتر الشخصي بشكل فوري. يمكن للمطورين تحميل النموذج الجديد من خلال مجتمع 魔搭 وHuggingFace، أو الحصول على خدمات API مباشرة عبر Alibaba Cloud Balian. وستواصل علي بابا إصدار نماذج سلسلة Qwen3.5 بأحجام ووظائف مختلفة، وسيتم قريبًا إصدار النموذج الرائد Qwen3.5-Max الذي يتمتع بأداء أقوى.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
أعلنت علي عن الجيل الجديد من نموذج القالب الذكي 3.5، متصدرًا قائمة أقوى النماذج المفتوحة المصدر على مستوى العالم
في يوم عيد الربيع في 16 فبراير، أطلقت شركة علي بابا نموذجها الكبير الجديد من الجيل التالي، Qwen3.5-Plus، وهو نموذج مفتوح المصدر يضاهي أداؤه Gemini 3 Pro، ويتصدر قائمة أقوى النماذج المفتوحة المصدر على مستوى العالم.
وفقًا للمعلومات، حقق Qwen3.5 ثورة شاملة في بنية النموذج الأساسية، حيث يبلغ إجمالي المعلمات في إصدار Qwen3.5-Plus 397 مليارًا، مع تفعيل فقط 17 مليارًا، مما يمنحه تفوقًا على النماذج ذات المعلمات الأكبر، حيث يتفوق أداؤه على نموذج Qwen3-Max الذي يضم تريليونات من المعلمات، مع تقليل استهلاك الذاكرة المخصصة للنشر بنسبة 60%، وزيادة كفاءة الاستنتاج بشكل كبير، حيث يمكن أن يصل أقصى معدل استنتاج إلى 19 ضعفًا. سعر واجهة برمجة التطبيقات (API) لـ Qwen3.5-Plus منخفض جدًا، حيث يبلغ 0.8 يوان لكل مليون رمز، وهو فقط 1/18 من سعر Gemini 3 Pro.
على عكس الأجيال السابقة من نماذج اللغة الكبيرة، حقق Qwen3.5 قفزة نوعية من نموذج يعتمد على النصوص فقط إلى نموذج متعدد الوسائط أصلي. حيث تم تدريب Qwen3 على رموز النصوص فقط، بينما تم تدريب Qwen3.5 على رموز مختلطة من الصور والنصوص، مع إضافة كمية كبيرة من البيانات باللغتين الصينية والإنجليزية، واللغات المتعددة، وبيانات STEM، وبيانات الاستنتاج، مما مكن النموذج من تعلم معرفة العالم بشكل أكثر كثافة ومنطق استنتاج أكثر دقة، مع تحقيق أداء يفوق تريليونات المعلمات لنموذج Qwen3-Max، وذلك بأقل من 40% من حجم المعلمات، مع أداء ممتاز في مجالات الاستنتاج، والبرمجة، ووكيل الذكاء الاصطناعي، وغيرها من التقييمات الشاملة. على سبيل المثال، حقق Qwen3.5 في اختبار المعرفة والاستنتاج MMLU-Pro درجة 87.8، متفوقًا على GPT-5.2؛ وفي اختبار المشكلات الصعبة على مستوى الدكتوراه GPQA حصل على 88.4، متفوقًا على Claude 4.5؛ وفي اختبار الالتزام بالتعليمات IFBench سجل 76.5، محطماً جميع الأرقام القياسية؛ وفي تقييمات الوكيل العام مثل BFCL-V4 وتقييم وكيل البحث Browsecomp، تفوق Qwen3.5 على Gemini 3 Pro وGPT-5.2.
كما أدى التدريب متعدد الوسائط الأصلي إلى قفزة نوعية في قدرات الرؤية لدى Qwen3.5: ففي العديد من التقييمات المرموقة مثل الاستنتاج متعدد الوسائط MathVison، والأسئلة والأجوبة البصرية العامة VQA (RealWorldQA)، والتعرف على النصوص وفهم الملفات (CC_OCR)، والذكاء المكاني (RefCOCO-avg)، وفهم الفيديو (MLVU)، حقق Qwen3.5 أفضل أداء. وفي مهام حل المسائل، وتخطيط المهام، والاستنتاج في الفضاء الفيزيائي، تفوق Qwen3.5 على نموذج Qwen3-VL الخاص، مع تعزيز قدرات تحديد المواقع والاستنتاج باستخدام الصور بشكل كبير، مع تحليل أكثر دقة وتفصيلًا؛ وفي مجال فهم الفيديو، يدعم Qwen3.5 إدخال الفيديوهات التي تصل مدتها إلى ساعتين (بما يعادل مليون رمز في السياق)، مما يجعله مناسبًا لتحليل المحتوى الطويل وتوليد الملخصات؛ بالإضافة إلى ذلك، حقق Qwen3.5 دمجًا أصليًا بين فهم الصور والقدرة على البرمجة، مع أدوات البحث عن الصور وإنشاء الصور، بحيث يمكنه تحويل رسومات الواجهات اليدوية مباشرة إلى رموز أمامية قابلة للاستخدام، ويمكنه تحديد وإصلاح مشكلات واجهة المستخدم من خلال لقطة شاشة واحدة، مما يجعل البرمجة البصرية أداة إنتاجية حقيقية.
تم إنجاز التدريب متعدد الوسائط الأصلي لـ Qwen3.5 بكفاءة عالية على بنية تحتية للذكاء الاصطناعي من علي بابا سحابة. من خلال سلسلة من الابتكارات التقنية الأساسية، اقترب معدل معالجة البيانات في تدريب Qwen3.5 على البيانات المختلطة من مستوى تدريب نماذج النصوص فقط، مما يقلل بشكل كبير من عتبة صعوبة التدريب متعدد الوسائط الأصلي؛ بالإضافة إلى ذلك، من خلال استراتيجيات تطبيق دقة FP8 وFP32 المصممة بشكل متقن، عند توسيع التدريب ليشمل مئات التريليونات من الرموز، انخفض استهلاك الذاكرة النشطة بنسبة حوالي 50%، وزادت سرعة التدريب بنسبة 10%، مما أدى إلى تقليل تكاليف تدريب النموذج وزيادة كفاءته.
كما حقق Qwen3.5 تقدمًا جديدًا من إطار عمل الوكيل (Agent) إلى تطبيقات الوكيل. حيث يمكن لـ Qwen3.5 التحكم بشكل مستقل في الهواتف الذكية وأجهزة الكمبيوتر، وأداء المهام اليومية بكفاءة، مع دعم المزيد من التطبيقات والأوامر على الأجهزة المحمولة، ومعالجة عمليات أكثر تعقيدًا على الحواسيب، مثل تنظيم البيانات عبر التطبيقات، وتنفيذ العمليات الآلية، مما يعزز بشكل كبير من كفاءة التشغيل. بالإضافة إلى ذلك، أنشأ فريق Qwen إطار عمل للتعلم المعزز غير المتزامن للوكيل يمكن توسيعه بشكل مرن، مع تسريع العمليات من 3 إلى 5 مرات، ودعم توسيع الوكيل الذكي القابل للإضافة إلى ملايين الوكلاء.
وفقًا للمعلومات، تم دمج نموذج Qwen3.5-Plus في تطبيقات Qwen على الهاتف المحمول والكمبيوتر الشخصي بشكل فوري. يمكن للمطورين تحميل النموذج الجديد من خلال مجتمع 魔搭 وHuggingFace، أو الحصول على خدمات API مباشرة عبر Alibaba Cloud Balian. وستواصل علي بابا إصدار نماذج سلسلة Qwen3.5 بأحجام ووظائف مختلفة، وسيتم قريبًا إصدار النموذج الرائد Qwen3.5-Max الذي يتمتع بأداء أقوى.