** المؤلف | Li Yuan، Lingzi County **
** المحرر | Wei Shijie **
قال هينتون البالغ من العمر 75 عامًا لجميع العلماء الشباب الحاضرين: "أنا عجوز" ، وأعرب عن أمله في أن يدرس الجميع "كيفية الحصول على ذكاء خارق". إنه يرى تحديًا غير مسبوق للأنواع الأقل ذكاءً للتحكم في شيء أكثر ذكاءً منها. **
في مؤتمر Zhiyuan للذكاء الاصطناعي ، ألقى هينتون ، عراب الذكاء الاصطناعي ، كلمة حول "مساران إلى الذكاء". من تحليل معمارية ومبادئ الحوسبة ، توصل إلى استنتاجه الخاص بأن "الشبكة العصبية الاصطناعية ستكون أكثر ذكاءً من الدماغ البشري" ، وهو أسرع بكثير مما كان يتخيله في الأصل.
في خطابه الذي استمر 30 دقيقة ، تحدث عن بنية الحوسبة الحالية حيث يتم فصل البرامج والأجهزة ، وبموجب هذه القاعدة ، فإن تدريب النماذج الكبيرة يستهلك الكثير من قوة الحوسبة. من أجل استخدام طاقة أقل لتدريب النماذج الكبيرة ، اقترح مفهوم ** الحوسبة المميتة ** - مثل ذكاء الشخص يعتمد على جسده ، لا يمكن نسخه إلى جسم آخر حسب الرغبة ، والبرنامج أكثر اعتمادًا على الأجهزة الموجودة عليها.
لكن المشكلة التي تلت ذلك هي أنه عند تلف جهاز معين ، يتضرر البرنامج أيضًا ، و "المعرفة المكتسبة تموت أيضًا معًا". الحل الذي اقترحه هو نقل المعرفة حول الأجهزة القديمة إلى الأجهزة الجديدة بطريقة "مقطرة" ، تمامًا مثل المعلم الذي يقوم بتعليم الطلاب.
** المفهوم المطابق لـ "تقطير المعرفة" (الحوسبة البيولوجية) هو "تقاسم الوزن" (الحوسبة الرقمية) ، وهما ما أسماه هينتون "مساران للذكاء". ** العلاقة بين نموذج لغة كبير ونسخه هي تقاسم الوزن ، وكل نسخة تحصل بشكل مباشر على معرفة معلمات النموذج بالكامل - على سبيل المثال ، يمكن لـ ChatGPT التحدث إلى آلاف الأشخاص في نفس الوقت بناءً على النموذج الذي يقف وراءها. وعملية التعلم المستمر المتمثلة في التحدث إلى الجميع تنتمي إلى "تقطير المعرفة".
على الرغم من أن "تقطير المعرفة" أقل كفاءة بكثير من "تقاسم الوزن" ، كما أن النطاق الترددي منخفض أيضًا ، يمكن أن يحتوي النموذج الكبير على 1000 نسخة ، وفي النهاية يحصل على معرفة أكثر 1000 مرة من أي شخص واحد.
تتعلم النماذج حاليًا فقط من المستندات - أي المعرفة التي يعالجها الإنسان. ومع تطور التكنولوجيا ، سيكون بمقدورهم التعلم من المعلومات المرئية ، ومن ثم قد يتعلمون التعامل مع الروبوتات. ومن ثم فهم أذكى بسهولة من البشر ، وأذكياء بما يكفي ليكونوا جيدين في خداع الناس. ** والبشر لا يجيدون التعامل مع الأشياء بشكل أكثر ذكاءً من أنفسهم. كيف تتجنب مخاطر هذه الذكاءات "فائقة الذكاء"؟ هذا هو الموضوع الذي تركه لكل عالم شاب. **
** فيما يلي محتوى الكلام الرئيسي الذي جمعه Geek Park: **
** سأتحدث اليوم عن بحث يقودني إلى الاعتقاد بأن الذكاء الخارق أقرب مما كنت أعتقد. **
لدي سؤالان أود التحدث عنهما ، وستركز طاقتي بشكل أساسي على السؤال الأول ، ما إذا كانت الشبكات العصبية الاصطناعية ستصبح قريبًا أكثر ذكاءً من الشبكات العصبية الحقيقية؟ سوف أتوسع في بحثي الذي يقودني إلى استنتاج مفاده أن مثل هذا الشيء قد يحدث قريبًا. في نهاية الحديث ، سأتحدث عما إذا كان بإمكاننا الحفاظ على السيطرة على الذكاء الخارق ، لكن هذا لن يكون المحتوى الرئيسي لهذا الحديث.
في الحوسبة التقليدية ، تم تصميم أجهزة الكمبيوتر لتتبع التعليمات بدقة. يمكننا تشغيل نفس البرنامج أو الشبكة العصبية بالضبط على أجهزة مادية مختلفة ، لأننا نعلم أن الجهاز سيتبع التعليمات بدقة. هذا يعني أن المعرفة في البرنامج أو أوزان الشبكة العصبية خالدة ، أي أنها لا تعتمد على أي جهاز محدد. تكلفة تحقيق هذا النوع من الخلود باهظة. علينا تشغيل الترانزستورات بقوة عالية ، لذا فإن سلوكهم رقمي. ولا يمكننا الاستفادة من الخصائص التناظرية والمتغيرة الغنية للأجهزة.
لذا فإن سبب وجود أجهزة الكمبيوتر الرقمية ، وسبب اتباعها للتعليمات بدقة ، هو أنه في التصميمات التقليدية ، ينظر البشر إلى مشكلة ، ويكتشفون الخطوات التي يجب اتخاذها لحل المشكلة ، ثم نطلب من الكمبيوتر اتخاذ هذه الخطوات . لكن هذا تغير.
لدينا الآن طريقة مختلفة لجعل أجهزة الكمبيوتر تقوم بالأشياء ، وهي التعلم من الأمثلة ، ونعرض لهم فقط ما نريدهم أن يفعلوه. بسبب هذا التغيير ، لدينا الآن فرصة للتخلي عن أحد المبادئ الأساسية لعلوم الكمبيوتر ، وهو فصل البرامج عن الأجهزة.
قبل أن نتخلى عن ذلك ، دعونا نلقي نظرة على سبب كونه مبدأً جيدًا. تتيح لنا إمكانية الفصل تشغيل نفس البرنامج على أجهزة مختلفة. يمكننا أيضًا دراسة خصائص البرامج مباشرة دون القلق بشأن الأجهزة الإلكترونية. ولهذا السبب يمكن أن يصبح قسم علوم الكمبيوتر تخصصًا خاصًا به ومستقلًا عن قسم الهندسة الكهربائية.
** إذا تخلينا عن فصل الأجهزة والبرامج ، فإننا نحصل على ما أسميه الحوسبة غير الخالدة. **
من الواضح أن لها جوانب سلبية كبيرة ، ولكن لها أيضًا بعض المكاسب الضخمة. لكي أكون قادرًا على تشغيل نماذج لغة كبيرة بطاقة أقل ، خاصة لتدريبهم ، بدأت العمل على الحوسبة غير الخالدة.
أكبر فائدة يمكن جنيها من التخلي عن الخلود هي أن التخلي عن فصل الأجهزة والبرامج يمكن أن يوفر الكثير من الطاقة. لأنه يمكننا استخدام الحوسبة التناظرية بطاقة منخفضة للغاية ، وهو بالضبط ما يفعله الدماغ. إنها تتطلب 1 بت من الحساب ، لأن الخلايا العصبية إما تعمل أو لا تعمل. لكن معظم الحسابات تتم بالتناظرية ، والتي يمكن إجراؤها بقدرة منخفضة جدًا.
يمكننا أيضًا الحصول على أجهزة أرخص. لذلك يجب تصنيع أجهزة اليوم بدقة شديدة في 2D (طائرة) بينما يمكننا تطويرها في بيئة ثلاثية الأبعاد لأننا لسنا بحاجة إلى معرفة بالضبط كيف توصل الأجهزة الكهرباء ، أو بالضبط كيف تعمل كل قطعة على حدة. .
من الواضح أن القيام بذلك يتطلب الكثير من تقنية النانو الجديدة ، أو ربما إعادة هندسة جينية للخلايا العصبية البيولوجية ، لأن الخلايا العصبية البيولوجية تفعل تقريبًا ما نريدها أن تفعله. ** قبل أن نناقش جميع الجوانب السلبية للحوسبة غير الخالدة ، أود أن أعطي مثالًا على الحوسبة التي يمكن القيام بها بشكل أرخص بكثير باستخدام الأجهزة التناظرية. **
إذا كنت ترغب في مضاعفة متجه النشاط العصبي في مصفوفة الوزن ، فهذا هو الحساب المركزي للشبكة العصبية ، ويقوم بمعظم العمل للشبكة العصبية. ما نقوم به حاليًا هو دفع الترانزستورات بقوة عالية جدًا لتمثيل بتات العدد بالأرقام. ثم نقوم بـ O (n ^ 2) ، ونضرب عددين من رقمين n. قد تكون هذه عملية على جهاز كمبيوتر ، ولكنها على مستوى البت المربّع لـ n.
نهج آخر هو تنفيذ نشاط الخلايا العصبية كجهد ووزن كموصلية. ثم في وحدة زمنية ، يتم ضرب الجهد في الموصلية للحصول على شحنة ، وتضاف الشحنة من تلقاء نفسها. لذلك من الواضح أنه يمكنك فقط ضرب متجه الجهد بمصفوفة التوصيل. هذا أكثر كفاءة في استخدام الطاقة ، والرقائق التي تعمل بهذه الطريقة موجودة بالفعل.
لسوء الحظ ، ما يفعله الناس بعد ذلك هو محاولة تحويل الإجابة التناظرية إلى رقمية ، الأمر الذي يتطلب استخدام محولات التيار المتردد باهظة الثمن. نرغب في البقاء تمامًا في العالم التناظري إذا استطعنا. لكن القيام بذلك يتسبب في أن تنتهي الأجهزة المختلفة بحوسبة أشياء مختلفة قليلاً.
لذلك ، ** المشكلة الرئيسية في الحوسبة غير الخالدة هي أنه عند التعلم ، يجب أن يتعلم البرنامج وفقًا للخصائص المحددة للأجهزة المحاكاة التي يعمل عليها ، دون معرفة الخصائص المحددة لكل قطعة من الأجهزة ، ** على سبيل المثال ، الوظيفة الدقيقة التي تربط مدخلات الخلايا العصبية بمخرجات العصبون ، غير مدركين للتوصيلية.
هذا يعني أنه لا يمكننا استخدام الخوارزميات مثل backpropagation للحصول على التدرجات ، لأن backpropagation يتطلب نموذجًا دقيقًا للانتشار الأمامي. لذا فإن السؤال هو ، إذا لم نتمكن من استخدام خوارزمية backpropagation ، فماذا يمكننا أن نفعل أيضًا؟ لأننا جميعًا نعتمد اعتمادًا كبيرًا على backpropagation الآن.
يمكنني أن أظهر تعلمًا بسيطًا ومباشرًا لاضطراب الوزن ، والذي تمت دراسته كثيرًا. لكل وزن في الشبكة ، يتم إنشاء متجه اضطراب مؤقت صغير عشوائي. ثم قياس التغيير في دالة الهدف العام على مجموعة صغيرة من الأمثلة ، يمكنك تغيير الأوزان بشكل دائم حسب حجم متجه الاضطراب وفقًا لكيفية تحسين الوظيفة الهدف. لذلك إذا ساءت الوظيفة الموضوعية ، فمن الواضح أنك تسير في الاتجاه الآخر.
الشيء الجميل في هذه الخوارزمية هو أنها تؤدي في المتوسط بالإضافة إلى الانتشار العكسي لأنها في المتوسط تتبع التدرج اللوني أيضًا. المشكلة هي أن لديها تباينًا كبيرًا جدًا. لذلك عندما تختار اتجاهًا عشوائيًا للتحرك فيه ، فإن الضوضاء الناتجة تصبح سيئة للغاية مع زيادة حجم الشبكة. هذا يعني أن هذه الخوارزمية فعالة لعدد صغير من الاتصالات ، ولكن ليس للشبكات الكبيرة.
لدينا أيضًا خوارزمية أفضل لتعلم اضطراب النشاط. لا يزال لديه مشاكل مماثلة ، لكنه أفضل بكثير من اضطراب الوزن. اضطراب النشاط هو ما تعتبره اضطرابًا متجهًا عشوائيًا لإجمالي المدخلات لكل خلية عصبية. تقوم باضطراب متجه عشوائي لكل مدخل في الخلية العصبية وترى ما يحدث لوظيفة الهدف عندما تقوم بهذا الاضطراب العشوائي على مجموعة صغيرة من الأمثلة وتحصل على الوظيفة الموضوعية بسبب هذا الاضطراب ، ثم يمكنك حساب كيفية تغيير كل منها الوزن الوارد للخلايا العصبية لمتابعة التدرج. هذه الطريقة أقل ضوضاء.
بالنسبة للمهام البسيطة مثل MNIST ، فإن مثل هذه الخوارزمية جيدة بما فيه الكفاية. لكنها لا تزال لا تعمل بشكل جيد بما يكفي لتوسيع نطاق الشبكات العصبية الكبيرة.
** بدلاً من العثور على وظيفة موضوعية يمكن تطبيقها على شبكة عصبية صغيرة ، يمكننا محاولة إيجاد خوارزمية تعليمية تعمل مع شبكة عصبية كبيرة. ** الفكرة هي تدريب شبكة عصبية كبيرة. وما سنفعله هو وجود الكثير من الوظائف الموضوعية الصغيرة التي تنطبق على جزء صغير من الشبكة بأكملها. لذلك ، كل مجموعة صغيرة من الخلايا العصبية لها وظيفتها الموضوعية المحلية.
** للتلخيص ، حتى الآن ، لم نعثر على خوارزمية تعلم جيدة حقًا يمكنها الاستفادة من خصائص المحاكاة ، لكن لدينا خوارزمية تعليمية ليست سيئة ، يمكنها حل مشكلات بسيطة مثل MNIST ، ولكنها ليست جيدة جدًا. **
المشكلة الثانية الكبيرة في الحوسبة غير الخالدة هي طبيعتها غير الخالدة. هذا يعني أنه ** عندما تموت قطعة معينة من الأجهزة ، فإن كل المعارف التي تعلمتها تموت معها ، ** لأن تعلمها يعتمد بالكامل على تفاصيل قطعة معينة من الأجهزة. لذا فإن أفضل طريقة لحل هذه المشكلة هي أن تقوم بتقطير المعرفة من المعلم (الأجهزة القديمة) إلى الطالب (الأجهزة الجديدة) قبل أن تموت الأجهزة. هذا هو اتجاه البحث الذي أحاول الترويج له الآن.
تم إنشاء Midjourney
سيُظهر المعلم للطلاب الردود الصحيحة على المدخلات المختلفة ، وسيحاول الطلاب بعد ذلك تقليد استجابات المعلم. إنه مثل تويتر ترامب. بعض الناس غاضبون جدًا من تغريدات ترامب لأنهم يشعرون أن ترامب يكذب ، ويعتقدون أن ترامب يحاول شرح الحقائق. لا. ما فعله ترامب هو اختيار موقف والحصول على استجابة مستهدفة وعاطفية للغاية لهذا الموقف. رأى أتباعه ذلك ، وتعلموا كيفية التعامل مع الموقف ، وتعلموا كيفية ضبط الأوزان في الشبكة العصبية ، واستجابوا عاطفياً للموقف بنفس الطريقة. لا علاقة له بحقيقة أن هذا زعيم طائفة يقوم بتعليم أتباع طائفته التعصب ، لكنه فعال للغاية.
لذلك ، إذا فكرنا في كيفية عمل التقطير ، ففكر في عامل يصنف الصور إلى 1024 فئة غير متداخلة. الإجابة الصحيحة لا تستغرق سوى حوالي 10 بتات. لذلك عندما تقوم بتدريب هذا الوكيل على مثيل تدريبي ، إذا أخبرته بالإجابة الصحيحة ، فأنت تضع قيودًا مقدارها 10 بت على أوزان الشبكة.
** لكن لنفترض الآن أننا قمنا بتدريب وكيل لضبط نفسه وفقًا لإجابات المعلم لهذه الفئات البالغ عددها 1024. ** بعد ذلك يمكن الحصول على نفس التوزيع الاحتمالي ، ويتم الحصول على 1023 رقمًا حقيقيًا في التوزيع ، بافتراض أن هذه الاحتمالات ليست صغيرة ، فإن هذا يوفر مئات المرات من القيود.
عادةً ، عندما تقوم بتدريب نموذج ، فإنك تقوم بتدريبه بشكل صحيح على مجموعة بيانات التدريب ، ثم نأمل أن يتم تعميمه بشكل صحيح على بيانات الاختبار. لكن هنا ، عندما تجد الطالب ، تقوم بتدريب الطالب مباشرة على التعميم ، لأن المتدرب يعمم بنفس طريقة المعلم.
سأستخدم بيانات الصورة من MNIST في الرقم 2 كمثال. يمكننا أن نرى الاحتمالات التي حددها المعلم لفئات مختلفة.
من الواضح أن السطر الأول هو 2 ، كما أعطى المعلم أيضًا احتمالًا كبيرًا هو 2. الصف الثاني ، المعلم واثق تمامًا من أنه 2 ، لكنه يعتقد أيضًا أنه يمكن أن يكون 3 ، أو يمكن أن يكون 8 ، ويمكنك أن ترى أن هناك بالفعل تشابهًا طفيفًا بين 3 و 8 في هذا صورة. في الصف الثالث ، هذا 2 قريب جدًا من 0. لذلك سيخبر المعلم الطلاب أنه يجب عليك اختيار الإخراج 2 في هذا الوقت ، ولكن عليك أيضًا وضع رهان صغير على 0. بهذه الطريقة ، يمكن للطالب أن يتعلم في هذه الحالة أكثر من إخباره مباشرة بأن هذا هو 2 ، ويمكنه معرفة الرقم الذي يبدو عليه الشكل. في السطر الرابع ، يعتقد المعلم أنها 2 ، ولكن من المحتمل جدًا أيضًا أنها 1 ، وهي الطريقة التي كتبت بها 1 في الصورة ، وأحيانًا يكتب شخص ما 1 مثل هذا.
والسطر الأخير ، في الواقع ، خمن الذكاء الاصطناعي خطأً ، فقد اعتقد أنه كان 5 ، والإجابة الصحيحة التي قدمتها مجموعة بيانات MNIST كانت 2. ويمكن للطلاب التعلم من أخطاء المعلم.
ما أحبه حقًا في نموذج تقطير المعرفة هو أننا ندرب الطالب على التعميم بنفس طريقة المعلم ، بما في ذلك وضع علامة على احتمال ضئيل للإجابات الخاطئة. عادةً ، عندما تقوم بتدريب نموذج ، فإنك تمنحه مجموعة بيانات تدريبية والإجابات الصحيحة ، ثم نأمل أن يتم تعميمه بشكل صحيح على مجموعة بيانات الاختبار لإنتاج الإجابات الصحيحة. أنت تحاول منعه من التعقيد الشديد ، أو القيام بأشياء مختلفة ، على أمل أن يتم تعميمه بشكل صحيح. لكن هنا ، عندما تقوم بتدريب الطالب ، فإنك تقوم بتدريب الطالب مباشرة على التعميم بنفس طريقة المعلم.
لذا الآن أريد أن أتحدث عن كيف يمكن لمجتمع الوكلاء مشاركة المعرفة. بدلاً من التفكير في وكيل واحد ، من الأفضل التفكير في مشاركة المعرفة داخل المجتمع.
واتضح أن الطريقة التي يشارك بها المجتمع المعرفة تحدد الكثير من الأشياء التي تفعلها بشأن الحوسبة. لذلك مع النموذج الرقمي ، مع الذكاء الرقمي ، يمكنك الحصول على مجموعة كاملة من الوكلاء باستخدام نفس النسخة الدقيقة من الأوزان واستخدام تلك الأوزان بالطريقة نفسها بالضبط. هذا يعني أنه يمكن للوكلاء المختلفين النظر إلى أجزاء مختلفة من بيانات التدريب.
يمكنهم حساب تدرج الأوزان على هذه الأجزاء من بيانات التدريب ، ومن ثم يمكنهم حساب متوسط تدرجاتهم. الآن ، يتعلم كل نموذج من البيانات التي يراها كل نموذج ، مما يعني أنك تكتسب قدرة هائلة على رؤية الكثير من البيانات ، لأنه سيكون لديك نسخ مختلفة من النموذج تبحث في أجزاء مختلفة من البيانات ، ويمكنهم مشاركة التدرجات أو الأوزان المشتركة لمشاركة ما تعلموه بكفاءة عالية.
إذا كان لديك نموذج به تريليون أوزان ، فهذا يعني أنه في كل مرة يتشاركون فيها شيئًا ما ، تحصل على تريليون بت من عرض النطاق الترددي. لكن ثمن القيام بذلك هو أنك يجب أن تتصرف مع الوكيل الرقمي بنفس الطريقة تمامًا.
لذلك ، فإن البديل لاستخدام تقاسم الوزن هو استخدام التقطير. وهذا ما فعلناه مع النماذج الرقمية. هذه هندسة مختلفة.
ومع ذلك ، عليك القيام بذلك إذا كان لديك نماذج بيولوجية تستفيد من الطبيعة المحاكاة لقطعة معينة من الأجهزة. لا يمكنك مشاركة الأوزان. لذلك ، يجب عليك استخدام المعرفة المشتركة الموزعة ، وهي ليست فعالة للغاية. ** من الصعب تقاسم المعرفة مع التقطير. الجمل التي أقوم بإنشائها ، أنت تحاول معرفة كيفية تغيير الأوزان الخاصة بك حتى تولد نفس الجمل. **
ومع ذلك ، فإن هذا النطاق الترددي أقل بكثير من مجرد مشاركة التدرجات. يرغب كل من قام بالتدريس في أن يقول ما يعرفه ويصب في عقول طلابه. ستكون هذه نهاية الكلية. لكن لا يمكننا العمل بهذه الطريقة لأننا أذكياء من الناحية البيولوجية ولن تعمل طريقي معك.
حتى الآن ، لدينا طريقتان مختلفتان لإجراء الحسابات. ** الحوسبة العددية والبيولوجية باستخدام خصائص الحيوانات. إنهم مختلفون تمامًا في كيفية مشاركة المعرفة بشكل فعال بين مختلف الوكلاء. **
إذا نظرت إلى نماذج لغة كبيرة ، فإنها تستخدم الحساب العددي ومشاركة الوزن. لكن كل نسخة من النموذج ، كل وكيل ، يكتسب المعرفة من الملف بطريقة غير فعالة للغاية. أخذ مستند ومحاولة التنبؤ بالكلمة التالية هو في الواقع تقطير معرفي غير فعال للغاية ، ما يتعلمه ليس توقع المعلم لتوزيع الاحتمالات للكلمة التالية ، ولكن محتوى الكلمة التالية التي اختارها مؤلف المستند. لذلك ، يعد هذا نطاقًا تردديًا منخفضًا جدًا. وهذه هي الطريقة التي تتعلم بها هذه النماذج اللغوية الكبيرة من الناس.
** بينما تعلم كل نسخة من نموذج لغة كبير غير فعال ، لديك 1000 نسخة. لهذا السبب يمكنهم أن يتعلموا أكثر منا 1000 مرة. لذلك أعتقد أن هذه النماذج اللغوية الكبيرة تعرف 1000 مرة أكثر من أي شخص. **
الآن ، السؤال هو ، ماذا يحدث إذا بدأ هؤلاء الوكلاء الرقميون ، بدلاً من التعلم منا ببطء شديد من خلال تقطير المعرفة ، في التعلم مباشرة من العالم الحقيقي؟
يجب أن أؤكد أنه حتى تقطير المعرفة يتعلم ببطء شديد ، لكن عندما يتعلمون منا ، يمكنهم تعلم أشياء مجردة جدًا. ** لقد تعلم البشر الكثير عن العالم على مدى آلاف السنين القليلة الماضية ، ويمكن للوكلاء الرقميين الاستفادة من هذه المعرفة بشكل مباشر. يمكن للبشر أن يلفظوا ما تعلمناه ، لذا فإن الوكلاء الرقميين لديهم وصول مباشر إلى كل ما تعلمه البشر عن العالم على مدى آلاف السنين القليلة الماضية لأننا كتبناه.
لكن بهذه الطريقة ، لا يزال النطاق الترددي لكل وكيل رقمي منخفضًا جدًا ، لأنهم يتعلمون من المستندات. إذا قاموا بالتعلم بدون إشراف ، مثل نمذجة مقاطع الفيديو ، فبمجرد أن نجد طريقة فعالة لنمذجة مقاطع الفيديو لتدريب النموذج ، يمكنهم التعلم من جميع مقاطع فيديو YouTube ، وهي عبارة عن الكثير من البيانات. أو إذا كان بإمكانهم التلاعب بالعالم المادي ، مثل قدرتهم على التحكم في الأذرع الروبوتية وما إلى ذلك.
أعتقد حقًا أنه بمجرد أن يبدأ هؤلاء الوكلاء الرقميون في القيام بذلك ، سيكونون قادرين على تعلم الكثير أكثر من البشر ، وسيكونون قادرين على التعلم بسرعة إلى حد ما. لذلك نحن بحاجة إلى الوصول إلى النقطة الثانية التي ذكرتها أعلاه في عرض الشرائح ، وهو ما يحدث إذا أصبحت هذه الأشياء أكثر ذكاءً منا؟ **
بالطبع ، هذا أيضًا هو المحتوى الرئيسي لهذا الاجتماع. لكن مساهمتي الرئيسية هي ، ** أريد أن أخبرك أن هذه الذكاءات الخارقة قد تصل في وقت أقرب بكثير مما كنت أعتقد. **
** سيستخدمها الأشخاص السيئون للقيام بأشياء مثل التلاعب بالإلكترونيات ، وهو ما يحدث بالفعل في الولايات المتحدة أو العديد من الأماكن الأخرى ، وسيحاول الناس استخدام الذكاء الاصطناعي لكسب الحروب. **
إذا كنت تريد أن يكون الوكيل المتميز فعالاً ، فأنت بحاجة إلى السماح له بإنشاء أهداف فرعية. هذا يثير مشكلة واضحة ** ، لأن هناك هدفًا فرعيًا واضحًا يمكن أن يعزز بشكل كبير قدرته على مساعدتنا في تحقيق أي شيء: وهو منح أنظمة الذكاء الاصطناعي مزيدًا من القوة والتحكم. كلما زادت قدرتك على التحكم ، أصبح من الأسهل تحقيق أهدافك. ** لا أرى كيف يمكننا منع الذكاء الرقمي من محاولة اكتساب المزيد من السيطرة لتحقيق أهدافهم الأخرى. لذا بمجرد أن يبدأوا في فعل ذلك ، تظهر المشكلة.
بالنسبة إلى الذكاء الخارق ، حتى إذا قمت بتخزينه في بيئة معزولة تمامًا غير متصلة بالإنترنت (airgap) ، فسيجد أنه يمكنه بسهولة اكتساب المزيد من القوة عن طريق التلاعب بالناس. ** لسنا معتادين على التفكير في الأشياء الأكثر ذكاءً منا وكيف نريد التفاعل معها. ** لكن يبدو لي أنه من الواضح أنه يمكنهم تعلم كيف يكونوا بارعين للغاية في خداع الناس. لأنه يمكن أن نرى ممارستنا لخداع الآخرين في عدد كبير من الروايات أو في أعمال نيكولو مكيافيلي. وبمجرد أن تصبح جيدًا حقًا في خداع الأشخاص ، يمكنك جعلهم يقومون بأي عمل تريده. على سبيل المثال ، إذا كنت تريد اختراق مبنى في واشنطن ، فلست بحاجة للذهاب إلى هناك ، فأنت تخدع الناس ليجعلوا يعتقدون أنه من خلال اختراق هذا المبنى ، فإنهم ينقذون الديمقراطية. وأعتقد أنه مخيف جدًا.
** لا يمكنني معرفة كيفية منع حدوث ذلك الآن ، وأنا أتقدم في العمر. ** آمل أن يتمكن العديد من الباحثين الشباب والرائعين ، مثلك في المؤتمر ، من العمل على كيفية الحصول على هذه الذكاء الخارق - أن تجعل حياتنا أفضل دون أن تجعلهم الطرف المهيمن.
لدينا ميزة ، ميزة بسيطة ، أن هذه الأشياء لم تتطور ، لقد بنيناها. ** لأنهم لم يتطوروا ، ربما ليس لديهم الأهداف العدوانية المتنافسة التي يمتلكها البشر ، ** ربما يساعد ذلك ، ربما يمكننا منحهم مبدأ أخلاقيًا. لكن في الوقت الحالي ، أنا متوتر فقط لأنني لا أعرف أي أمثلة لشيء أكثر ذكاءً يهيمن عليه شيء أقل ذكاءً مما كان عليه عندما كانت هناك فجوة كبيرة في الذكاء. ** أحد الأمثلة التي أحب أن أعطيها هو افتراض أن الضفادع خلقت البشر. من برأيك يتحكم الآن؟ ضفدع أم إنسان؟ هذا كل شيء لخطابي. **
شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
عراب الذكاء الاصطناعي هينتون: أنا عجوز ، كيف تتحكم في "الذكاء الخارق" الأكثر ذكاءً من البشر ، الأمر متروك لك
المصدر: Geek Park
قال هينتون البالغ من العمر 75 عامًا لجميع العلماء الشباب الحاضرين: "أنا عجوز" ، وأعرب عن أمله في أن يدرس الجميع "كيفية الحصول على ذكاء خارق". إنه يرى تحديًا غير مسبوق للأنواع الأقل ذكاءً للتحكم في شيء أكثر ذكاءً منها. **
في مؤتمر Zhiyuan للذكاء الاصطناعي ، ألقى هينتون ، عراب الذكاء الاصطناعي ، كلمة حول "مساران إلى الذكاء". من تحليل معمارية ومبادئ الحوسبة ، توصل إلى استنتاجه الخاص بأن "الشبكة العصبية الاصطناعية ستكون أكثر ذكاءً من الدماغ البشري" ، وهو أسرع بكثير مما كان يتخيله في الأصل.
لكن المشكلة التي تلت ذلك هي أنه عند تلف جهاز معين ، يتضرر البرنامج أيضًا ، و "المعرفة المكتسبة تموت أيضًا معًا". الحل الذي اقترحه هو نقل المعرفة حول الأجهزة القديمة إلى الأجهزة الجديدة بطريقة "مقطرة" ، تمامًا مثل المعلم الذي يقوم بتعليم الطلاب.
** المفهوم المطابق لـ "تقطير المعرفة" (الحوسبة البيولوجية) هو "تقاسم الوزن" (الحوسبة الرقمية) ، وهما ما أسماه هينتون "مساران للذكاء". ** العلاقة بين نموذج لغة كبير ونسخه هي تقاسم الوزن ، وكل نسخة تحصل بشكل مباشر على معرفة معلمات النموذج بالكامل - على سبيل المثال ، يمكن لـ ChatGPT التحدث إلى آلاف الأشخاص في نفس الوقت بناءً على النموذج الذي يقف وراءها. وعملية التعلم المستمر المتمثلة في التحدث إلى الجميع تنتمي إلى "تقطير المعرفة".
على الرغم من أن "تقطير المعرفة" أقل كفاءة بكثير من "تقاسم الوزن" ، كما أن النطاق الترددي منخفض أيضًا ، يمكن أن يحتوي النموذج الكبير على 1000 نسخة ، وفي النهاية يحصل على معرفة أكثر 1000 مرة من أي شخص واحد.
تتعلم النماذج حاليًا فقط من المستندات - أي المعرفة التي يعالجها الإنسان. ومع تطور التكنولوجيا ، سيكون بمقدورهم التعلم من المعلومات المرئية ، ومن ثم قد يتعلمون التعامل مع الروبوتات. ومن ثم فهم أذكى بسهولة من البشر ، وأذكياء بما يكفي ليكونوا جيدين في خداع الناس. ** والبشر لا يجيدون التعامل مع الأشياء بشكل أكثر ذكاءً من أنفسهم. كيف تتجنب مخاطر هذه الذكاءات "فائقة الذكاء"؟ هذا هو الموضوع الذي تركه لكل عالم شاب. **
** فيما يلي محتوى الكلام الرئيسي الذي جمعه Geek Park: **
** سأتحدث اليوم عن بحث يقودني إلى الاعتقاد بأن الذكاء الخارق أقرب مما كنت أعتقد. **
لدي سؤالان أود التحدث عنهما ، وستركز طاقتي بشكل أساسي على السؤال الأول ، ما إذا كانت الشبكات العصبية الاصطناعية ستصبح قريبًا أكثر ذكاءً من الشبكات العصبية الحقيقية؟ سوف أتوسع في بحثي الذي يقودني إلى استنتاج مفاده أن مثل هذا الشيء قد يحدث قريبًا. في نهاية الحديث ، سأتحدث عما إذا كان بإمكاننا الحفاظ على السيطرة على الذكاء الخارق ، لكن هذا لن يكون المحتوى الرئيسي لهذا الحديث.
لذا فإن سبب وجود أجهزة الكمبيوتر الرقمية ، وسبب اتباعها للتعليمات بدقة ، هو أنه في التصميمات التقليدية ، ينظر البشر إلى مشكلة ، ويكتشفون الخطوات التي يجب اتخاذها لحل المشكلة ، ثم نطلب من الكمبيوتر اتخاذ هذه الخطوات . لكن هذا تغير.
لدينا الآن طريقة مختلفة لجعل أجهزة الكمبيوتر تقوم بالأشياء ، وهي التعلم من الأمثلة ، ونعرض لهم فقط ما نريدهم أن يفعلوه. بسبب هذا التغيير ، لدينا الآن فرصة للتخلي عن أحد المبادئ الأساسية لعلوم الكمبيوتر ، وهو فصل البرامج عن الأجهزة.
قبل أن نتخلى عن ذلك ، دعونا نلقي نظرة على سبب كونه مبدأً جيدًا. تتيح لنا إمكانية الفصل تشغيل نفس البرنامج على أجهزة مختلفة. يمكننا أيضًا دراسة خصائص البرامج مباشرة دون القلق بشأن الأجهزة الإلكترونية. ولهذا السبب يمكن أن يصبح قسم علوم الكمبيوتر تخصصًا خاصًا به ومستقلًا عن قسم الهندسة الكهربائية.
** إذا تخلينا عن فصل الأجهزة والبرامج ، فإننا نحصل على ما أسميه الحوسبة غير الخالدة. **
من الواضح أن لها جوانب سلبية كبيرة ، ولكن لها أيضًا بعض المكاسب الضخمة. لكي أكون قادرًا على تشغيل نماذج لغة كبيرة بطاقة أقل ، خاصة لتدريبهم ، بدأت العمل على الحوسبة غير الخالدة.
يمكننا أيضًا الحصول على أجهزة أرخص. لذلك يجب تصنيع أجهزة اليوم بدقة شديدة في 2D (طائرة) بينما يمكننا تطويرها في بيئة ثلاثية الأبعاد لأننا لسنا بحاجة إلى معرفة بالضبط كيف توصل الأجهزة الكهرباء ، أو بالضبط كيف تعمل كل قطعة على حدة. .
من الواضح أن القيام بذلك يتطلب الكثير من تقنية النانو الجديدة ، أو ربما إعادة هندسة جينية للخلايا العصبية البيولوجية ، لأن الخلايا العصبية البيولوجية تفعل تقريبًا ما نريدها أن تفعله. ** قبل أن نناقش جميع الجوانب السلبية للحوسبة غير الخالدة ، أود أن أعطي مثالًا على الحوسبة التي يمكن القيام بها بشكل أرخص بكثير باستخدام الأجهزة التناظرية. **
إذا كنت ترغب في مضاعفة متجه النشاط العصبي في مصفوفة الوزن ، فهذا هو الحساب المركزي للشبكة العصبية ، ويقوم بمعظم العمل للشبكة العصبية. ما نقوم به حاليًا هو دفع الترانزستورات بقوة عالية جدًا لتمثيل بتات العدد بالأرقام. ثم نقوم بـ O (n ^ 2) ، ونضرب عددين من رقمين n. قد تكون هذه عملية على جهاز كمبيوتر ، ولكنها على مستوى البت المربّع لـ n.
نهج آخر هو تنفيذ نشاط الخلايا العصبية كجهد ووزن كموصلية. ثم في وحدة زمنية ، يتم ضرب الجهد في الموصلية للحصول على شحنة ، وتضاف الشحنة من تلقاء نفسها. لذلك من الواضح أنه يمكنك فقط ضرب متجه الجهد بمصفوفة التوصيل. هذا أكثر كفاءة في استخدام الطاقة ، والرقائق التي تعمل بهذه الطريقة موجودة بالفعل.
لسوء الحظ ، ما يفعله الناس بعد ذلك هو محاولة تحويل الإجابة التناظرية إلى رقمية ، الأمر الذي يتطلب استخدام محولات التيار المتردد باهظة الثمن. نرغب في البقاء تمامًا في العالم التناظري إذا استطعنا. لكن القيام بذلك يتسبب في أن تنتهي الأجهزة المختلفة بحوسبة أشياء مختلفة قليلاً.
لذلك ، ** المشكلة الرئيسية في الحوسبة غير الخالدة هي أنه عند التعلم ، يجب أن يتعلم البرنامج وفقًا للخصائص المحددة للأجهزة المحاكاة التي يعمل عليها ، دون معرفة الخصائص المحددة لكل قطعة من الأجهزة ، ** على سبيل المثال ، الوظيفة الدقيقة التي تربط مدخلات الخلايا العصبية بمخرجات العصبون ، غير مدركين للتوصيلية.
هذا يعني أنه لا يمكننا استخدام الخوارزميات مثل backpropagation للحصول على التدرجات ، لأن backpropagation يتطلب نموذجًا دقيقًا للانتشار الأمامي. لذا فإن السؤال هو ، إذا لم نتمكن من استخدام خوارزمية backpropagation ، فماذا يمكننا أن نفعل أيضًا؟ لأننا جميعًا نعتمد اعتمادًا كبيرًا على backpropagation الآن.
يمكنني أن أظهر تعلمًا بسيطًا ومباشرًا لاضطراب الوزن ، والذي تمت دراسته كثيرًا. لكل وزن في الشبكة ، يتم إنشاء متجه اضطراب مؤقت صغير عشوائي. ثم قياس التغيير في دالة الهدف العام على مجموعة صغيرة من الأمثلة ، يمكنك تغيير الأوزان بشكل دائم حسب حجم متجه الاضطراب وفقًا لكيفية تحسين الوظيفة الهدف. لذلك إذا ساءت الوظيفة الموضوعية ، فمن الواضح أنك تسير في الاتجاه الآخر.
لدينا أيضًا خوارزمية أفضل لتعلم اضطراب النشاط. لا يزال لديه مشاكل مماثلة ، لكنه أفضل بكثير من اضطراب الوزن. اضطراب النشاط هو ما تعتبره اضطرابًا متجهًا عشوائيًا لإجمالي المدخلات لكل خلية عصبية. تقوم باضطراب متجه عشوائي لكل مدخل في الخلية العصبية وترى ما يحدث لوظيفة الهدف عندما تقوم بهذا الاضطراب العشوائي على مجموعة صغيرة من الأمثلة وتحصل على الوظيفة الموضوعية بسبب هذا الاضطراب ، ثم يمكنك حساب كيفية تغيير كل منها الوزن الوارد للخلايا العصبية لمتابعة التدرج. هذه الطريقة أقل ضوضاء.
بالنسبة للمهام البسيطة مثل MNIST ، فإن مثل هذه الخوارزمية جيدة بما فيه الكفاية. لكنها لا تزال لا تعمل بشكل جيد بما يكفي لتوسيع نطاق الشبكات العصبية الكبيرة.
** بدلاً من العثور على وظيفة موضوعية يمكن تطبيقها على شبكة عصبية صغيرة ، يمكننا محاولة إيجاد خوارزمية تعليمية تعمل مع شبكة عصبية كبيرة. ** الفكرة هي تدريب شبكة عصبية كبيرة. وما سنفعله هو وجود الكثير من الوظائف الموضوعية الصغيرة التي تنطبق على جزء صغير من الشبكة بأكملها. لذلك ، كل مجموعة صغيرة من الخلايا العصبية لها وظيفتها الموضوعية المحلية.
** للتلخيص ، حتى الآن ، لم نعثر على خوارزمية تعلم جيدة حقًا يمكنها الاستفادة من خصائص المحاكاة ، لكن لدينا خوارزمية تعليمية ليست سيئة ، يمكنها حل مشكلات بسيطة مثل MNIST ، ولكنها ليست جيدة جدًا. **
المشكلة الثانية الكبيرة في الحوسبة غير الخالدة هي طبيعتها غير الخالدة. هذا يعني أنه ** عندما تموت قطعة معينة من الأجهزة ، فإن كل المعارف التي تعلمتها تموت معها ، ** لأن تعلمها يعتمد بالكامل على تفاصيل قطعة معينة من الأجهزة. لذا فإن أفضل طريقة لحل هذه المشكلة هي أن تقوم بتقطير المعرفة من المعلم (الأجهزة القديمة) إلى الطالب (الأجهزة الجديدة) قبل أن تموت الأجهزة. هذا هو اتجاه البحث الذي أحاول الترويج له الآن.
سيُظهر المعلم للطلاب الردود الصحيحة على المدخلات المختلفة ، وسيحاول الطلاب بعد ذلك تقليد استجابات المعلم. إنه مثل تويتر ترامب. بعض الناس غاضبون جدًا من تغريدات ترامب لأنهم يشعرون أن ترامب يكذب ، ويعتقدون أن ترامب يحاول شرح الحقائق. لا. ما فعله ترامب هو اختيار موقف والحصول على استجابة مستهدفة وعاطفية للغاية لهذا الموقف. رأى أتباعه ذلك ، وتعلموا كيفية التعامل مع الموقف ، وتعلموا كيفية ضبط الأوزان في الشبكة العصبية ، واستجابوا عاطفياً للموقف بنفس الطريقة. لا علاقة له بحقيقة أن هذا زعيم طائفة يقوم بتعليم أتباع طائفته التعصب ، لكنه فعال للغاية.
لذلك ، إذا فكرنا في كيفية عمل التقطير ، ففكر في عامل يصنف الصور إلى 1024 فئة غير متداخلة. الإجابة الصحيحة لا تستغرق سوى حوالي 10 بتات. لذلك عندما تقوم بتدريب هذا الوكيل على مثيل تدريبي ، إذا أخبرته بالإجابة الصحيحة ، فأنت تضع قيودًا مقدارها 10 بت على أوزان الشبكة.
** لكن لنفترض الآن أننا قمنا بتدريب وكيل لضبط نفسه وفقًا لإجابات المعلم لهذه الفئات البالغ عددها 1024. ** بعد ذلك يمكن الحصول على نفس التوزيع الاحتمالي ، ويتم الحصول على 1023 رقمًا حقيقيًا في التوزيع ، بافتراض أن هذه الاحتمالات ليست صغيرة ، فإن هذا يوفر مئات المرات من القيود.
عادةً ، عندما تقوم بتدريب نموذج ، فإنك تقوم بتدريبه بشكل صحيح على مجموعة بيانات التدريب ، ثم نأمل أن يتم تعميمه بشكل صحيح على بيانات الاختبار. لكن هنا ، عندما تجد الطالب ، تقوم بتدريب الطالب مباشرة على التعميم ، لأن المتدرب يعمم بنفس طريقة المعلم.
من الواضح أن السطر الأول هو 2 ، كما أعطى المعلم أيضًا احتمالًا كبيرًا هو 2. الصف الثاني ، المعلم واثق تمامًا من أنه 2 ، لكنه يعتقد أيضًا أنه يمكن أن يكون 3 ، أو يمكن أن يكون 8 ، ويمكنك أن ترى أن هناك بالفعل تشابهًا طفيفًا بين 3 و 8 في هذا صورة. في الصف الثالث ، هذا 2 قريب جدًا من 0. لذلك سيخبر المعلم الطلاب أنه يجب عليك اختيار الإخراج 2 في هذا الوقت ، ولكن عليك أيضًا وضع رهان صغير على 0. بهذه الطريقة ، يمكن للطالب أن يتعلم في هذه الحالة أكثر من إخباره مباشرة بأن هذا هو 2 ، ويمكنه معرفة الرقم الذي يبدو عليه الشكل. في السطر الرابع ، يعتقد المعلم أنها 2 ، ولكن من المحتمل جدًا أيضًا أنها 1 ، وهي الطريقة التي كتبت بها 1 في الصورة ، وأحيانًا يكتب شخص ما 1 مثل هذا.
والسطر الأخير ، في الواقع ، خمن الذكاء الاصطناعي خطأً ، فقد اعتقد أنه كان 5 ، والإجابة الصحيحة التي قدمتها مجموعة بيانات MNIST كانت 2. ويمكن للطلاب التعلم من أخطاء المعلم.
ما أحبه حقًا في نموذج تقطير المعرفة هو أننا ندرب الطالب على التعميم بنفس طريقة المعلم ، بما في ذلك وضع علامة على احتمال ضئيل للإجابات الخاطئة. عادةً ، عندما تقوم بتدريب نموذج ، فإنك تمنحه مجموعة بيانات تدريبية والإجابات الصحيحة ، ثم نأمل أن يتم تعميمه بشكل صحيح على مجموعة بيانات الاختبار لإنتاج الإجابات الصحيحة. أنت تحاول منعه من التعقيد الشديد ، أو القيام بأشياء مختلفة ، على أمل أن يتم تعميمه بشكل صحيح. لكن هنا ، عندما تقوم بتدريب الطالب ، فإنك تقوم بتدريب الطالب مباشرة على التعميم بنفس طريقة المعلم.
لذا الآن أريد أن أتحدث عن كيف يمكن لمجتمع الوكلاء مشاركة المعرفة. بدلاً من التفكير في وكيل واحد ، من الأفضل التفكير في مشاركة المعرفة داخل المجتمع.
واتضح أن الطريقة التي يشارك بها المجتمع المعرفة تحدد الكثير من الأشياء التي تفعلها بشأن الحوسبة. لذلك مع النموذج الرقمي ، مع الذكاء الرقمي ، يمكنك الحصول على مجموعة كاملة من الوكلاء باستخدام نفس النسخة الدقيقة من الأوزان واستخدام تلك الأوزان بالطريقة نفسها بالضبط. هذا يعني أنه يمكن للوكلاء المختلفين النظر إلى أجزاء مختلفة من بيانات التدريب.
يمكنهم حساب تدرج الأوزان على هذه الأجزاء من بيانات التدريب ، ومن ثم يمكنهم حساب متوسط تدرجاتهم. الآن ، يتعلم كل نموذج من البيانات التي يراها كل نموذج ، مما يعني أنك تكتسب قدرة هائلة على رؤية الكثير من البيانات ، لأنه سيكون لديك نسخ مختلفة من النموذج تبحث في أجزاء مختلفة من البيانات ، ويمكنهم مشاركة التدرجات أو الأوزان المشتركة لمشاركة ما تعلموه بكفاءة عالية.
إذا كان لديك نموذج به تريليون أوزان ، فهذا يعني أنه في كل مرة يتشاركون فيها شيئًا ما ، تحصل على تريليون بت من عرض النطاق الترددي. لكن ثمن القيام بذلك هو أنك يجب أن تتصرف مع الوكيل الرقمي بنفس الطريقة تمامًا.
لذلك ، فإن البديل لاستخدام تقاسم الوزن هو استخدام التقطير. وهذا ما فعلناه مع النماذج الرقمية. هذه هندسة مختلفة.
ومع ذلك ، عليك القيام بذلك إذا كان لديك نماذج بيولوجية تستفيد من الطبيعة المحاكاة لقطعة معينة من الأجهزة. لا يمكنك مشاركة الأوزان. لذلك ، يجب عليك استخدام المعرفة المشتركة الموزعة ، وهي ليست فعالة للغاية. ** من الصعب تقاسم المعرفة مع التقطير. الجمل التي أقوم بإنشائها ، أنت تحاول معرفة كيفية تغيير الأوزان الخاصة بك حتى تولد نفس الجمل. **
ومع ذلك ، فإن هذا النطاق الترددي أقل بكثير من مجرد مشاركة التدرجات. يرغب كل من قام بالتدريس في أن يقول ما يعرفه ويصب في عقول طلابه. ستكون هذه نهاية الكلية. لكن لا يمكننا العمل بهذه الطريقة لأننا أذكياء من الناحية البيولوجية ولن تعمل طريقي معك.
حتى الآن ، لدينا طريقتان مختلفتان لإجراء الحسابات. ** الحوسبة العددية والبيولوجية باستخدام خصائص الحيوانات. إنهم مختلفون تمامًا في كيفية مشاركة المعرفة بشكل فعال بين مختلف الوكلاء. **
** بينما تعلم كل نسخة من نموذج لغة كبير غير فعال ، لديك 1000 نسخة. لهذا السبب يمكنهم أن يتعلموا أكثر منا 1000 مرة. لذلك أعتقد أن هذه النماذج اللغوية الكبيرة تعرف 1000 مرة أكثر من أي شخص. **
الآن ، السؤال هو ، ماذا يحدث إذا بدأ هؤلاء الوكلاء الرقميون ، بدلاً من التعلم منا ببطء شديد من خلال تقطير المعرفة ، في التعلم مباشرة من العالم الحقيقي؟
يجب أن أؤكد أنه حتى تقطير المعرفة يتعلم ببطء شديد ، لكن عندما يتعلمون منا ، يمكنهم تعلم أشياء مجردة جدًا. ** لقد تعلم البشر الكثير عن العالم على مدى آلاف السنين القليلة الماضية ، ويمكن للوكلاء الرقميين الاستفادة من هذه المعرفة بشكل مباشر. يمكن للبشر أن يلفظوا ما تعلمناه ، لذا فإن الوكلاء الرقميين لديهم وصول مباشر إلى كل ما تعلمه البشر عن العالم على مدى آلاف السنين القليلة الماضية لأننا كتبناه.
لكن بهذه الطريقة ، لا يزال النطاق الترددي لكل وكيل رقمي منخفضًا جدًا ، لأنهم يتعلمون من المستندات. إذا قاموا بالتعلم بدون إشراف ، مثل نمذجة مقاطع الفيديو ، فبمجرد أن نجد طريقة فعالة لنمذجة مقاطع الفيديو لتدريب النموذج ، يمكنهم التعلم من جميع مقاطع فيديو YouTube ، وهي عبارة عن الكثير من البيانات. أو إذا كان بإمكانهم التلاعب بالعالم المادي ، مثل قدرتهم على التحكم في الأذرع الروبوتية وما إلى ذلك.
أعتقد حقًا أنه بمجرد أن يبدأ هؤلاء الوكلاء الرقميون في القيام بذلك ، سيكونون قادرين على تعلم الكثير أكثر من البشر ، وسيكونون قادرين على التعلم بسرعة إلى حد ما. لذلك نحن بحاجة إلى الوصول إلى النقطة الثانية التي ذكرتها أعلاه في عرض الشرائح ، وهو ما يحدث إذا أصبحت هذه الأشياء أكثر ذكاءً منا؟ **
** سيستخدمها الأشخاص السيئون للقيام بأشياء مثل التلاعب بالإلكترونيات ، وهو ما يحدث بالفعل في الولايات المتحدة أو العديد من الأماكن الأخرى ، وسيحاول الناس استخدام الذكاء الاصطناعي لكسب الحروب. **
إذا كنت تريد أن يكون الوكيل المتميز فعالاً ، فأنت بحاجة إلى السماح له بإنشاء أهداف فرعية. هذا يثير مشكلة واضحة ** ، لأن هناك هدفًا فرعيًا واضحًا يمكن أن يعزز بشكل كبير قدرته على مساعدتنا في تحقيق أي شيء: وهو منح أنظمة الذكاء الاصطناعي مزيدًا من القوة والتحكم. كلما زادت قدرتك على التحكم ، أصبح من الأسهل تحقيق أهدافك. ** لا أرى كيف يمكننا منع الذكاء الرقمي من محاولة اكتساب المزيد من السيطرة لتحقيق أهدافهم الأخرى. لذا بمجرد أن يبدأوا في فعل ذلك ، تظهر المشكلة.
بالنسبة إلى الذكاء الخارق ، حتى إذا قمت بتخزينه في بيئة معزولة تمامًا غير متصلة بالإنترنت (airgap) ، فسيجد أنه يمكنه بسهولة اكتساب المزيد من القوة عن طريق التلاعب بالناس. ** لسنا معتادين على التفكير في الأشياء الأكثر ذكاءً منا وكيف نريد التفاعل معها. ** لكن يبدو لي أنه من الواضح أنه يمكنهم تعلم كيف يكونوا بارعين للغاية في خداع الناس. لأنه يمكن أن نرى ممارستنا لخداع الآخرين في عدد كبير من الروايات أو في أعمال نيكولو مكيافيلي. وبمجرد أن تصبح جيدًا حقًا في خداع الأشخاص ، يمكنك جعلهم يقومون بأي عمل تريده. على سبيل المثال ، إذا كنت تريد اختراق مبنى في واشنطن ، فلست بحاجة للذهاب إلى هناك ، فأنت تخدع الناس ليجعلوا يعتقدون أنه من خلال اختراق هذا المبنى ، فإنهم ينقذون الديمقراطية. وأعتقد أنه مخيف جدًا.
** لا يمكنني معرفة كيفية منع حدوث ذلك الآن ، وأنا أتقدم في العمر. ** آمل أن يتمكن العديد من الباحثين الشباب والرائعين ، مثلك في المؤتمر ، من العمل على كيفية الحصول على هذه الذكاء الخارق - أن تجعل حياتنا أفضل دون أن تجعلهم الطرف المهيمن.
لدينا ميزة ، ميزة بسيطة ، أن هذه الأشياء لم تتطور ، لقد بنيناها. ** لأنهم لم يتطوروا ، ربما ليس لديهم الأهداف العدوانية المتنافسة التي يمتلكها البشر ، ** ربما يساعد ذلك ، ربما يمكننا منحهم مبدأ أخلاقيًا. لكن في الوقت الحالي ، أنا متوتر فقط لأنني لا أعرف أي أمثلة لشيء أكثر ذكاءً يهيمن عليه شيء أقل ذكاءً مما كان عليه عندما كانت هناك فجوة كبيرة في الذكاء. ** أحد الأمثلة التي أحب أن أعطيها هو افتراض أن الضفادع خلقت البشر. من برأيك يتحكم الآن؟ ضفدع أم إنسان؟ هذا كل شيء لخطابي. **