أصدرت جمعية الإنترنت في الصين: تقرير أبحاث صناعة الذكاء الاصطناعي التوليدي العالمي لعام 2023

** المصدر: جمعية الإنترنت الصينية **

في 19 مايو 2023 ، خلال المؤتمر العالمي السابع للذكاء "القمة العالمية للتعاون والابتكار التكنولوجي الذكي" ، بتوجيه من جمعية الإنترنت الصينية ورابطة صناعة البرمجيات الصينية ، وجمعية تيانجين للذكاء الاصطناعي ، وتكنولوجيا Zhiding ، و Zhiding Think Tank بشكل مشترك " تم إصدار الخريطة العالمية لصناعة الذكاء الاصطناعي التوليدية 2023 "و" تقرير أبحاث صناعة الذكاء الاصطناعي التوليدي العالمي لعام 2023 "الذي أعده المؤلف لفهم تطوير الذكاء الاصطناعي التوليدي العالمي للإدارات الحكومية والممارسين في الصناعة والمعلمين والوضع العام للرجوع إليها.

رصيد الصورة: تم إنشاؤه بواسطة أدوات * Unbounded AI *

نظرًا لكونه مجالًا رائدًا للذكاء الاصطناعي ، فقد أصبح الذكاء الاصطناعي التوليدي أهم موضوع تقني في العالم. في عام 2022 ، أصدرت OpenAI ChatGPT ، وحقق الذكاء الاصطناعي التوليدي تقدمًا مهمًا على مستوى تطبيق النموذج ، حيث تجاوز عدد المستخدمين النشطين شهريًا 100 مليون في شهرين فقط ، مما يجعله أسرع تطبيق استهلاكي نموًا في التاريخ. قامت العديد من شركات التكنولوجيا حول العالم بزيادة استثماراتها في البحث والتطوير في مجال الذكاء الاصطناعي التوليدي ، وأطلقت باستمرار إنجازات مهمة في التكنولوجيا والمنتجات والتطبيقات ، واستمرت في تعزيز الابتكار وتسويق الذكاء الاصطناعي.

في هذا السياق ، بتوجيه من جمعية الإنترنت في الصين ورابطة صناعة البرمجيات الصينية ، أصدرت جمعية الذكاء الاصطناعي في تيانجين ، و Zhiding Technology ، و Zhiding Think Tank بالاشتراك مع "تقرير أبحاث صناعة الذكاء الاصطناعي التوليدي العالمي لعام 2023" ، والذي يبدأ من منظور عالمي ، لفرز نظرة عامة على الصناعة ، والبنية التحتية ، ونموذج الخوارزمية ، وتطبيق السيناريو ، وفرص وتحديات الذكاء الاصطناعي التوليدي ، وعرض التطور الصناعي للذكاء الاصطناعي التوليدي بشكل شامل ، وتوفير المزيد من المعلومات للإدارات الحكومية ، والعاملين في الصناعة ، والمعلمين والجمهور. يوفر الفهم الجيد للذكاء الاصطناعي التوليدي مرجعًا.

** 01 نظرة عامة على صناعة الذكاء الاصطناعي التوليدية **

** 1.1 مفهوم الذكاء الاصطناعي التوليدي ومرحلة إنشاء المحتوى **

الذكاء الاصطناعي التوليدي هو طريقة إنتاج جديدة تستخدم تقنية الذكاء الاصطناعي لإنشاء المحتوى تلقائيًا بعد المحتوى الذي تم إنشاؤه بشكل احترافي (PGC) والمحتوى الذي ينشئه المستخدم (UGC).

يقوم الذكاء الاصطناعي التوليدي تلقائيًا بإنشاء وإنشاء نصوص وصوت وصورة وفيديو ومعلومات متعددة الوسائط بناءً على بيانات تدريب ضخمة ونماذج مدربة مسبقًا واسعة النطاق. منذ أن أصدرت OpenAI ChatGPT في عام 2022 ، اندلعت موجة عالمية من الذكاء الاصطناعي التوليدي ، وأطلقت العديد من شركات التكنولوجيا نماذج ومنتجات ذكاء اصطناعي توليدية ، وما يرتبط بها من بنية تحتية وخدمات أساسية.

** 1.2 القوى الدافعة لتطوير صناعة الذكاء الاصطناعي التوليدية **

في السنوات الأخيرة ، استمر مقياس البيانات العالمية في النمو. تتوقع IDC أن يصل مقياس البيانات العالمي إلى 175ZB بحلول عام 2025 ، مما يوفر موارد بيانات ضخمة للتدريب على نماذج الذكاء الاصطناعي ؛ يوفر إدخال رقائق AI عالية الأداء دعمًا هامًا لقوة الحوسبة لـ نماذج ما قبل التدريب واسعة النطاق ؛ مع التطوير المستمر ، حققت نماذج مثل Transformer و BERT و LaMDA و ChatGPT تحسينًا تكراريًا سريعًا. مدفوعة بالبيانات وقوة الحوسبة والنماذج ، تطورت صناعة الذكاء الاصطناعي التوليدية العالمية بسرعة ، وتم إثراء السيناريوهات والتطبيقات ذات الصلة بشكل مستمر.

** 02 البنية التحتية التوليدية للذكاء الاصطناعي **

** 2.1 توفر رقائق الذكاء الاصطناعي عالية الأداء دعمًا للطاقة الحاسوبية لتدريب الذكاء الاصطناعي التوليدي **

لقد دخل تطور الذكاء الاصطناعي عصر النماذج الكبيرة من عصر التعلم العميق ، حيث أظهر عدد معلمات نماذج ما قبل التدريب واسعة النطاق زيادة هائلة ، الأمر الذي يتطلب دعم قوة حوسبة عالية الأداء.

في الوقت الحالي ، تبلغ قوة الحوسبة التدريبية لنماذج ما قبل التدريب واسعة النطاق من 10 إلى 100 ضعف تلك التي كانت في الماضي.يستخدم تدريب نموذج الذكاء الاصطناعي الحالي السائد على نطاق واسع رقائق Nvidia Tensor Core GPU. على سبيل المثال ، أنفقت Microsoft مئات الملايين من الدولارات لشراء عشرات الآلاف من رقائق Nvidia A100 لمساعدة Open AI في بناء ChatGPT.

** 2.2 توفر مجموعات حوسبة الذكاء الاصطناعي موارد حوسبة واسعة النطاق للتدريب التوليدي على الذكاء الاصطناعي **

يمكن أن توفر مجموعات حوسبة الذكاء الاصطناعي قوة حوسبة واسعة النطاق ، وتحسن باستمرار معدل استخدام موارد طاقة الحوسبة ، وتحسن تخزين البيانات وقدرات المعالجة ، وتسريع تدريب النموذج الكبير للذكاء الاصطناعي وكفاءة التفكير.

في الوقت الحالي ، لا تزال مجموعات الحوسبة النموذجية للذكاء الاصطناعي ، مثل Nvidia DGX SuperPOD ، و Baidu Intelligent Cloud High-Performance Computing Cluster EHC ، والجيل الجديد من Tencent من مجموعة الحوسبة عالية الأداء HCC ، وما إلى ذلك ، تستمر البنية التحتية لقوة الحوسبة ذات الصلة في توفير موارد طاقة حوسبة قوية للتوليد سيناريوهات تدريب الذكاء الاصطناعي ، وتقليل حد وتكلفة التدريب النموذجي ، وتعزيز تنفيذ نماذج الذكاء الاصطناعي التوليدية.

** 2.3 توفر الخدمة السحابية للذكاء الاصطناعي دعم النظام الأساسي لتطوير نموذج الذكاء الاصطناعي التوليدي **

يتطلب تطوير نماذج التدريب المسبق للذكاء الاصطناعي طلبًا كبيرًا على الخدمات السحابية.يمكن أن توفر الخدمات السحابية للذكاء الاصطناعي وحدات تطوير الذكاء الاصطناعي.من خلال نماذج الخدمة المتنوعة ، يمكن تقليل تكاليف تطوير المطورين ودورات تطوير المنتجات ، ويمكن توفير تمكين الذكاء الاصطناعي لتطوير النموذج.

حالة نموذجية هي Amazon SageMaker ، والتي يمكنها توفير تحليل الصور / الصور ومعالجة الكلام وفهم اللغة الطبيعية والخدمات الأخرى ذات الصلة ، ويمكن للمستخدمين تحقيق التطبيقات الوظيفية دون معرفة المعلمات والخوارزميات.

توفر منصة Baidu Flying Paddle EasyDL ذات العتبة الصفرية لتطوير الذكاء الاصطناعي وظائف مثل تصنيف الصور ، واكتشاف الكائنات ، وتصنيف النص ، وتصنيف الصوت ، وتصنيف الفيديو ، وتحقيق التدريب الآلي الشامل وخفض عتبة التطوير المخصص لمنظمة العفو الدولية.

** 03 نموذج خوارزمية الذكاء الاصطناعي التوليدي **

** 3.1 تاريخ تطوير نماذج الذكاء الاصطناعي التوليدية العالمية **

** 3.2 النماذج الرئيسية لتوليد اللغة: OpenAI GPT-1 إلى GPT-4 **

منذ عام 2018 ، أصدرت OpenAI تباعاً سلسلة من نماذج التدريب المسبق التوليدية مثل GPT-1 و GPT-2 و GPT-3 و ChatGPT و GPT-4. يعتمد نموذج GPT-1 على بنية المحول ، ويتم الاحتفاظ فقط بجزء وحدة فك التشفير من البنية ؛

نموذج GPT-2 يلغي مرحلة الضبط الدقيق في GPT-1 ؛

يتخلى نموذج GPT-3 عن اللقطة الصفرية لـ GPT-2 ، ويستخدم عددًا قليلاً من اللقطات لإعطاء عدد صغير من العينات لمهام محددة ؛ يستخدم ChatGPT تقنية RLHF (التعلم المعزز بالردود البشرية) لتعزيز القدرة على ضبط إخراج الموديل؛

يتميز نموذج GPT-4 الذي تم إصداره في عام 2023 بقدرات متعددة الوسائط أكثر قوة. فهو يدعم الإدخال متعدد الوسائط للرسومات والنص ويولد نص الاستجابة ، والذي يمكنه تحقيق التصنيف والتحليل والاستخراج الدلالي الضمني للعناصر المرئية ، مما يُظهر قدرة استجابة ممتازة .

** 3.3 النموذج السائد لتوليد فئة اللغة: Google Transformer to PaLM-E **

في عام 2017 ، أصدرت Google نموذج Transformer الأيقوني. أصبحت وحدة فك التشفير لهذا النموذج العنصر الأساسي في نموذج GPT. من خلال تقديم آلية الانتباه ، يمكنها تحقيق الحوسبة المتوازية على نطاق أوسع ، وتقليل وقت تدريب النموذج بشكل كبير ، وجعل نماذج الذكاء الاصطناعي واسعة النطاق مطبقة. يتحسن نموذج BERT ونموذج LaMDA باستمرار من حيث قدرات استخراج المعلومات والأمان.

يتميز نموذج PaLM-E الذي تم إطلاقه حديثًا بقدرات قوية على التعميم والترحيل ، حيث يمكنه معالجة البيانات متعددة الوسائط (اللغة ، والرؤية ، واللمس ، وما إلى ذلك).

** 3.4 النموذج الأساسي لتوليد الصور: نموذج الانتشار **

يمكن تتبع البحث حول نموذج الانتشار إلى عام 2015 ، وتم اقتراح النموذج الاحتمالي لانتشار تقليل الضوضاء (DDPM) في عام 2020 ، مما يدل على القدرات القوية لنموذج الانتشار ويقود تطوير نموذج الانتشار. يشتمل النموذج بشكل أساسي على عمليتين: العملية الأمامية والعملية العكسية. وتسمى العملية الأمامية أيضًا عملية الانتشار. يتعلم نموذج الانتشار عن طريق إضافة ضوضاء Gaussian إلى الصورة لتدمير بيانات التدريب ، ويكتشف طريقة عكس الضوضاء عملية ، واستخدام طرق تقليل الضوضاء التي تم تعلمها تمكن من توليف الصور الجديدة من المدخلات العشوائية.

تتمثل ميزة نموذج الانتشار في أن الصور التي تم إنشاؤها ذات جودة أعلى ولا تتطلب تدريبًا على الخصومة ، وفي حالة الحاجة إلى بيانات أقل ، يتم تحسين تأثير إنشاء الصورة للنموذج بشكل ملحوظ.

** الجزء 04 من تطبيق سيناريو الذكاء الاصطناعي التوليدي 4.1 نظرة عامة على تطبيقات الذكاء الاصطناعي التوليدية العالمية **

** 4.2 تطبيق سيناريو الذكاء الاصطناعي التوليدي - إنشاء النص **

تطبيقات إنشاء النص بشكل أساسي في أربعة مجالات: استمرار المحتوى ، ونقل نمط النص ، وإنشاء الملخص / العنوان ، وإنشاء النص بالكامل.

بشكل عام ، يعد إنشاء النصوص استنادًا إلى تقنية البرمجة اللغوية العصبية تطبيقًا سابقًا في الذكاء الاصطناعي التوليفي. أطلقت شركات التكنولوجيا المشهورة عالميًا أدوات تطبيق إنشاء النصوص ، مثل Microsoft و Xmind وغيرها من المنتجات ذات الصلة في كتابة الإعلانات وتحليل البيانات والعروض التقديمية ، وهناك حالات التطبيق في رسم الخرائط الذهنية والجوانب الأخرى.

** 4.3 تطبيق المشهد التوليدي AI - إنشاء الصور **

تنقسم السيناريوهات الفنية لتوليد الصورة إلى تحرير سمات الصورة ، وإنشاء وتعديل جزئي للصور ، وإنشاء صورة شاملة. من بينها ، أول سيناريوهين للهبوط هما أدوات تحرير الصور ، ويتوافق إنشاء الصور من طرف إلى طرف مع سيناريوهين رئيسيين لإنشاء الصور الإبداعية وتوليد الصور الوظيفية.

في الوقت الحاضر ، تُستخدم أدوات تحرير الصور على نطاق واسع ، والمنتجات ذات الصلة وفيرة نسبيًا ؛ يتم تقديم توليد الصور الإبداعية في الغالب في شكل NFT ، وما إلى ذلك ، والصور الوظيفية هي في الغالب ملصقات / واجهات تسويقية ، وشعار ، وصور نموذجية ، وصور رمزية للمستخدم .

** 4.4 تطبيق سيناريو الذكاء الاصطناعي التوليدي — توليد الصوت **

يعد إنشاء الصوت أمرًا شائعًا بالفعل في الحياة اليومية ، ويمكن تقسيم مجالات تطبيقه بشكل أكبر إلى توليف الكلام وإنشاء الموسيقى ، ويتضمن تركيب الكلام مجال إنشاء الكلام المحدد (TTS) واستنساخ الكلام.

النضج التقني لمجال تحويل النص إلى كلام مرتفع نسبيًا ، ولكن لا يزال هناك نقص في التعبير العاطفي ؛ يعد استنساخ الصوت ذا أهمية كبيرة للفيلم والرسوم المتحركة والصناعات الأخرى ويستحق الاهتمام ؛ يمكن تقسيم إنشاء الموسيقى إلى كلمات وتكوين ، الترتيب ، التسجيل ، الخلط ، إلخ. الاتجاهات المتعددة ، تعتمد عملية الإنشاء بشكل أساسي على نموذج المحولات.

** 4.5 تطبيق سيناريو الذكاء الاصطناعي العام - إنشاء الفيديو **

من المتوقع أن يكون إنشاء الفيديو سيناريو متوسط إلى عالي الإمكانات في مجال التوليد متعدد الوسائط في المستقبل. يتوافق إنشاء الفيديو بشكل أساسي مع ثلاثة حقول: تحرير سمات الفيديو ، والتحرير التلقائي للفيديو ، وإنشاء جزء من الفيديو.

تم استخدام تحرير سمات الفيديو على نطاق واسع في مجال إنشاء الفيديو ، مما أدى إلى تحسين كفاءة تحرير الفيديو بشكل كبير ؛ يعد التحرير التلقائي للفيديو بشكل أساسي في مرحلة التجربة التقنية ؛ يشبه مبدأ وجوهر إنشاء أجزاء الفيديو إنشاء الصور ، مع التركيز على قطع الفيديو في إطارات ، ثم تحرير كل إطار. معالجة الصور ، التكنولوجيا في هذه المرحلة هي تحسين دقة التعديل والتعديل في الوقت الحقيقي.

** 4.6 تطبيق سيناريو الذكاء الاصطناعي العام - الإنسان الرقمي **

يشير البشر الرقميون إلى توليف الخصائص البشرية المتعددة الموجودة في العالم غير المادي (مثل الصور ومقاطع الفيديو والبث المباشر و VR). يمثل الإنسان الرقمي الانتقال من الطرائق منخفضة الكثافة مثل النص / الصوت إلى طرائق كثافة المعلومات الأعلى مثل التفاعل بين الصور / الفيديو / الوقت الحقيقي.في المستقبل ، سيكون الفيديو وحتى metaverse سيناريوهات تطبيق مهمة للإنسان الرقمي.

في مجال الذكاء الاصطناعي التوليدي ، يمكن تقسيم الجيل البشري الرقمي إلى إنشاء فيديو رقمي بشري وتفاعل رقمي بشري في الوقت الفعلي.يعد إنشاء الفيديو البشري الرقمي حاليًا أحد أكثر المجالات استخدامًا ، بينما يتم استخدام التفاعل الرقمي البشري في الوقت الفعلي في الغالب في خدمة العملاء الذكية المرئية ، والمزيد من التركيز على الميزات التفاعلية في الوقت الفعلي.

** 05 فرص وتحديات الذكاء الاصطناعي التوليفية **

** 5.1 في عصر الذكاء الاصطناعي التوليدي ، تم استبدال العمل الإداري بدرجة كبيرة ، ومن المتوقع أن تصبح "مطالبة العملاء" مهنة جديدة **

تأثير الذكاء الاصطناعي التوليدي على التوظيف تتعايش تحديات وفرص العمل. من ناحية أخرى ، سيعزز الذكاء الاصطناعي التوليدي الترقية الذكية للوظائف ، وسيتم استبدال بعض الوظائف. وفقًا لتحليل Goldman Sachs ، يمكن لإمكانيات الأتمتة الذكية للذكاء الاصطناعي التوليدي تحسين كفاءة العمل بشكل كبير وتقليل تكاليف التشغيل. ستتأثر الوظائف التقليدية في الولايات المتحدة وأوروبا بأتمتة الذكاء الاصطناعي بدرجات متفاوتة ، ويمكن للذكاء الاصطناعي التوليدي أن يحل محل ربع الوظائف .

من ناحية أخرى ، فإن الذكاء الاصطناعي التوليدي سيخلق أيضًا وظائف جديدة: "مهندس" يسمح للأشخاص باستخدام اللغة الطبيعية كمحفزات للتفاعل مع الذكاء الاصطناعي للحصول على المعلومات أو إنشاء الأعمال. بالإضافة إلى ذلك ، ستولد المجالات ذات الصلة حول الذكاء الاصطناعي أيضًا عددًا كبيرًا من الوظائف الجديدة.

** 5.2 يتم توزيع حقوق الطبع والنشر لأعمال الذكاء الاصطناعي التوليفية بشكل أساسي بين مالكي البرامج والمستخدمين **

إن جوهر الذكاء الاصطناعي التوليدي هو تطبيق التعلم الآلي. في مرحلة التعلم النموذجي ، سيستخدم حتماً عددًا كبيرًا من مجموعات البيانات لأداء التدريب.ومع ذلك ، لا تزال مسألة ملكية حقوق الطبع والنشر للمنتجات بعد التدريب مثيرة للجدل.

نظرًا لأن الأشخاص القانونيين يمكنهم التمتع بالحقوق ، فلا يمكن التمتع بحقوق الطبع والنشر لأعمال الذكاء الاصطناعي التوليدية إلا من قبل أولئك الذين ساهموا في إنشاء العمل. ويشمل الموظفون المعنيون مطوري البرامج والمالكين والمستخدمين (قد تتداخل هويات الموضوعات). يتم تعويضها من حقوق التأليف والنشر الخاصة بالبرامج ، ويتم توزيع حقوق التأليف والنشر لأعمال الذكاء الاصطناعي التوليفية بشكل أساسي بين مالكي البرامج والمستخدمين.

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت
تداول العملات الرقمية في أي مكان وفي أي وقت
qrCode
امسح لتنزيل تطبيق Gate.io
المنتدى
بالعربية
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)