سوف تستضيف مدينة شانغهاي مؤتمر مطوري GDC العالمي 2025 (Global Developer Conference) من 21 إلى 23 فبراير. وقد أفادت لجنة الاقتصاد والمعلومات في شانغهاي أن 100 مجتمع للمطورين محليين ودوليين سيشاركون في هذا الحدث، بما في ذلك Hugging Face، مجتمع مطوري مايكروسوفت، CSDN، مجتمع ألي مودا، Linux Foundation، ARPA Foundation، مجتمع هواوي، وغيرها؛ مع التركيز على التقنيات الأساسية مثل النماذج الكبيرة، قوة الحوسبة، المعلومات النصية، الأدوات، منصات البرمجيات، حيث تشمل مجموعة المطورين المشاركين مجالات تطوير الأجهزة، والحوسبة السحابية، والبيانات الكبيرة، وانترنت الأشياء، والذكاء الاصطناعي، والروبوتات، والبلوكشين، وMetaverse.
شنغهاي Coopas التكنولوجيا المحدودة هي واحدة من الشركات المشاركة في المؤتمر. يتم وضع الشركة كمنصة تشغيل خدمة وظيفية مهنية ، وهي ملتزمة بتوفير خدمات بيانات مجموعة منخفضة التكلفة وعالية الجودة للنماذج الأساسية والنماذج الرأسية وأصحاب المشاريع المبتكرين الصغار والمتوسطين.
"لم يسترح فريقنا بأكمله منذ بداية السنة القمرية الجديدة الكبيرة، حيث كانوا جميعًا يبحثون ويتابعون الابتكارات في DeepSeek." قال الرئيس التنفيذي لـ كوباسي CEO هوانغ هايتشينغ لوسائل الإعلام. ظهور DeepSeek جعل صناعة الذكاء الاصطناعي ككل متحمسة وقلقة في الوقت نفسه. القلق يأتي أساسًا من حقيقة أن النماذج الكبيرة الحالية استثمرت الكثير من الأموال، ولكنها لم تحقق النتائج التي حققتها DeepSeek."
وقال انه يعتقد أن نجاح DeepSeek يكمن في الابتكار في خوارزمية الأصلية بالإضافة إلى استخدام مجموعة بيانات اللغة عالية الجودة، مما يمكن توفير قوة الحوسبة والبيانات بشكل كبير، وهو ما يوفر أفكارًا لصناعة النماذج الضخمة في الصين. وأوضح هوانغ هايتشينغ أنه وفقًا للوضع الحالي للنماذج الضخمة، ستحدد مجموعة البيانات اللغوية عالية الجودة الحد الأقصى لقدرة النماذج الضخمة، ويمكن أن يقلل توفير مجموعة البيانات اللغوية عالية الجودة بشكل كبير من تكلفة تدريب شركات النماذج الضخمة.
وأشار إلى أن كوباس قد بدأت بالفعل في بناء قاعدة بيانات صناعية شاملة في مجالات الذكاء البشري والمالية والتصنيع والتعليم والرعاية الصحية والترفيه وحوكمة المدن، حيث تم تشغيل منصة التشغيل 1.0 لقاعدة البيانات وتسريع تنفيذ تصميم المنصة 2.0 من العالم الحقيقي إلى المحاكاة إلى توليف البيانات. حاليًا، تم ربط هذه الشركة بأكثر من 50 شريكًا في البيئة المعرفية، وذلك عن طريق توفير مجموعات بيانات فعالة عالية الجودة للشركاء لتقليل تكلفة النماذج الكبيرة.
تعمل قانون التكبير لا يزال يعمل، لكن السرعة قد تباطأت بالفعل، حسب تقدير Huang Haiqing. ويعتقد أنه في المستقبل، ستبدأ تطبيقات النماذج الكبيرة متعددة الوضع في التفجير، وستصبح نماذج الأعمال ToB (الشركات) و ToG (الحكومة) اتجاها رئيسيا للشركات الكبيرة النموذجية، وفي الوقت الحالي، تتجه الكثير من الشركات النموذجية الأساسية نحو الصناعات العمودية، وستكون هناك أقل من عشرة نماذج أساسية كبيرة يمكن البقاء على قيد الحياة في السوق الصينية في المستقبل.
في الصناعة الفعلية، ويعتقد أن في الوقت الحالي، تحظى الصناعات المالية والتعليمية والطبية والصناعية بالأولوية في اعتناق النماذج الكبيرة. وفي المجالات الرئيسية، مثل القيادة الآلية والذكاء الجسدي والذكاء العلمي وغيرها، يتم تطبيق النماذج الكبيرة بنشاط. مع تقدم الوقت، ستستخدم صناعة النقل وصناعة التجزئة في المستقبل النماذج الكبيرة. وهذا يتطلب أيضًا طلبات أكبر وجودة أعلى لبيانات الصناعات العمودية. بالنسبة للنماذج الاستدلالية، يتعين أيضًا بناء عملية استدلالية على البيانات الأصلية، وهذا يضع متطلبات جديدة على إنتاج اللغة.
في جمع البيانات وإنتاجها ، يوصي هوانغ هايتشينغ أيضًا بتحديث قانون حقوق الطبع والنشر بما يتماشى مع العصر ، وتحديد نطاق مناسب لبيانات تدريب الذكاء الاصطناعي والنماذج الكبيرة.
"هذا ليس تغييرًا للماضي، بل إضافة وتحديث، أعتقد أن هذا هو مسار مناسب وقابل للتنفيذ." قال هوانغ هايتشينغ "في مجال الذكاء الاصطناعي والنماذج الكبيرة وبيانات اللغة، كانت قوانين حقوق الطبع والنشر السابقة موجهة نحو البشر، وعند تدريب النماذج الكبيرة على بيانات اللغة، إذا تم استخدام معايير سابقة لقياس معايير التعلم الآلي، فقد لا تكون مناسبة تمامًا. وبالإضافة إلى ذلك، هذه المشكلة أثرت بالفعل على تكاليف شراء بيانات اللغة الخاصة بالشركات المتخصصة في النماذج الكبيرة وعلى المخاطر القانونية."
واقترح أن يتم تسريع تحديد قواعد استخدام البيانات اللغوية الكبيرة بشكل معقول، وتعزيز تطبيق "النصوص واستخراج البيانات" في مجال التدريب المسبق؛ تعزيز استخدام البيانات المعقول للتعلم الآلي في السوق المحلية، وتحقيق توازن بين حقوق أصحاب حقوق النشر واحتياجات التطور التكنولوجي، وحل مشكلة الصعوبة في الترخيص؛ يجب على الحكومة إصدار سياسات تحفيزية، ودعم شركات بيانات اللغة في تعزيز تطوير سلسلة أدوات الأتمتة، وخفض تكلفة بيانات اللغة؛ وإنشاء منصة سلسلة أدوات تنظيف ووسم الذكاء الاصطناعي، وخفض تكلفة البيانات اللغوية؛ وتسريع الأبحاث القانونية حول نطاق حماية مولدات الذكاء الاصطناعي، ووضع قواعد واضحة لملكية مولدات الذكاء الاصطناعي والمسؤولية.
وأشار Huang Haiqing إلى أن الذكاء الاصطناعي سيكون السائد في تسمية البيانات وتنظيفها في المستقبل، حيث ستتحول تسمية البيانات من صناعة كثيفة العمالة إلى صناعة معرفية وتقنية.
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
قوة الحوسبة، قد تحدد مجموعة بيانات المجموعة عالية الجودة الحد الأعلى لقدرات النموذج الكبير
سوف تستضيف مدينة شانغهاي مؤتمر مطوري GDC العالمي 2025 (Global Developer Conference) من 21 إلى 23 فبراير. وقد أفادت لجنة الاقتصاد والمعلومات في شانغهاي أن 100 مجتمع للمطورين محليين ودوليين سيشاركون في هذا الحدث، بما في ذلك Hugging Face، مجتمع مطوري مايكروسوفت، CSDN، مجتمع ألي مودا، Linux Foundation، ARPA Foundation، مجتمع هواوي، وغيرها؛ مع التركيز على التقنيات الأساسية مثل النماذج الكبيرة، قوة الحوسبة، المعلومات النصية، الأدوات، منصات البرمجيات، حيث تشمل مجموعة المطورين المشاركين مجالات تطوير الأجهزة، والحوسبة السحابية، والبيانات الكبيرة، وانترنت الأشياء، والذكاء الاصطناعي، والروبوتات، والبلوكشين، وMetaverse.
شنغهاي Coopas التكنولوجيا المحدودة هي واحدة من الشركات المشاركة في المؤتمر. يتم وضع الشركة كمنصة تشغيل خدمة وظيفية مهنية ، وهي ملتزمة بتوفير خدمات بيانات مجموعة منخفضة التكلفة وعالية الجودة للنماذج الأساسية والنماذج الرأسية وأصحاب المشاريع المبتكرين الصغار والمتوسطين.
"لم يسترح فريقنا بأكمله منذ بداية السنة القمرية الجديدة الكبيرة، حيث كانوا جميعًا يبحثون ويتابعون الابتكارات في DeepSeek." قال الرئيس التنفيذي لـ كوباسي CEO هوانغ هايتشينغ لوسائل الإعلام. ظهور DeepSeek جعل صناعة الذكاء الاصطناعي ككل متحمسة وقلقة في الوقت نفسه. القلق يأتي أساسًا من حقيقة أن النماذج الكبيرة الحالية استثمرت الكثير من الأموال، ولكنها لم تحقق النتائج التي حققتها DeepSeek."
وقال انه يعتقد أن نجاح DeepSeek يكمن في الابتكار في خوارزمية الأصلية بالإضافة إلى استخدام مجموعة بيانات اللغة عالية الجودة، مما يمكن توفير قوة الحوسبة والبيانات بشكل كبير، وهو ما يوفر أفكارًا لصناعة النماذج الضخمة في الصين. وأوضح هوانغ هايتشينغ أنه وفقًا للوضع الحالي للنماذج الضخمة، ستحدد مجموعة البيانات اللغوية عالية الجودة الحد الأقصى لقدرة النماذج الضخمة، ويمكن أن يقلل توفير مجموعة البيانات اللغوية عالية الجودة بشكل كبير من تكلفة تدريب شركات النماذج الضخمة.
وأشار إلى أن كوباس قد بدأت بالفعل في بناء قاعدة بيانات صناعية شاملة في مجالات الذكاء البشري والمالية والتصنيع والتعليم والرعاية الصحية والترفيه وحوكمة المدن، حيث تم تشغيل منصة التشغيل 1.0 لقاعدة البيانات وتسريع تنفيذ تصميم المنصة 2.0 من العالم الحقيقي إلى المحاكاة إلى توليف البيانات. حاليًا، تم ربط هذه الشركة بأكثر من 50 شريكًا في البيئة المعرفية، وذلك عن طريق توفير مجموعات بيانات فعالة عالية الجودة للشركاء لتقليل تكلفة النماذج الكبيرة.
تعمل قانون التكبير لا يزال يعمل، لكن السرعة قد تباطأت بالفعل، حسب تقدير Huang Haiqing. ويعتقد أنه في المستقبل، ستبدأ تطبيقات النماذج الكبيرة متعددة الوضع في التفجير، وستصبح نماذج الأعمال ToB (الشركات) و ToG (الحكومة) اتجاها رئيسيا للشركات الكبيرة النموذجية، وفي الوقت الحالي، تتجه الكثير من الشركات النموذجية الأساسية نحو الصناعات العمودية، وستكون هناك أقل من عشرة نماذج أساسية كبيرة يمكن البقاء على قيد الحياة في السوق الصينية في المستقبل.
في الصناعة الفعلية، ويعتقد أن في الوقت الحالي، تحظى الصناعات المالية والتعليمية والطبية والصناعية بالأولوية في اعتناق النماذج الكبيرة. وفي المجالات الرئيسية، مثل القيادة الآلية والذكاء الجسدي والذكاء العلمي وغيرها، يتم تطبيق النماذج الكبيرة بنشاط. مع تقدم الوقت، ستستخدم صناعة النقل وصناعة التجزئة في المستقبل النماذج الكبيرة. وهذا يتطلب أيضًا طلبات أكبر وجودة أعلى لبيانات الصناعات العمودية. بالنسبة للنماذج الاستدلالية، يتعين أيضًا بناء عملية استدلالية على البيانات الأصلية، وهذا يضع متطلبات جديدة على إنتاج اللغة.
في جمع البيانات وإنتاجها ، يوصي هوانغ هايتشينغ أيضًا بتحديث قانون حقوق الطبع والنشر بما يتماشى مع العصر ، وتحديد نطاق مناسب لبيانات تدريب الذكاء الاصطناعي والنماذج الكبيرة.
"هذا ليس تغييرًا للماضي، بل إضافة وتحديث، أعتقد أن هذا هو مسار مناسب وقابل للتنفيذ." قال هوانغ هايتشينغ "في مجال الذكاء الاصطناعي والنماذج الكبيرة وبيانات اللغة، كانت قوانين حقوق الطبع والنشر السابقة موجهة نحو البشر، وعند تدريب النماذج الكبيرة على بيانات اللغة، إذا تم استخدام معايير سابقة لقياس معايير التعلم الآلي، فقد لا تكون مناسبة تمامًا. وبالإضافة إلى ذلك، هذه المشكلة أثرت بالفعل على تكاليف شراء بيانات اللغة الخاصة بالشركات المتخصصة في النماذج الكبيرة وعلى المخاطر القانونية."
واقترح أن يتم تسريع تحديد قواعد استخدام البيانات اللغوية الكبيرة بشكل معقول، وتعزيز تطبيق "النصوص واستخراج البيانات" في مجال التدريب المسبق؛ تعزيز استخدام البيانات المعقول للتعلم الآلي في السوق المحلية، وتحقيق توازن بين حقوق أصحاب حقوق النشر واحتياجات التطور التكنولوجي، وحل مشكلة الصعوبة في الترخيص؛ يجب على الحكومة إصدار سياسات تحفيزية، ودعم شركات بيانات اللغة في تعزيز تطوير سلسلة أدوات الأتمتة، وخفض تكلفة بيانات اللغة؛ وإنشاء منصة سلسلة أدوات تنظيف ووسم الذكاء الاصطناعي، وخفض تكلفة البيانات اللغوية؛ وتسريع الأبحاث القانونية حول نطاق حماية مولدات الذكاء الاصطناعي، ووضع قواعد واضحة لملكية مولدات الذكاء الاصطناعي والمسؤولية.
وأشار Huang Haiqing إلى أن الذكاء الاصطناعي سيكون السائد في تسمية البيانات وتنظيفها في المستقبل، حيث ستتحول تسمية البيانات من صناعة كثيفة العمالة إلى صناعة معرفية وتقنية.
(مصدر المقال: جيميان نيوز)
المصدر: موقع شرق المال
المؤلف: جمهورية الواجهة الجديدة