جرد لوكلاء الذكاء الاصطناعي المستقلين، تغطية كاملة للبناء والتطبيق والتقييم، نظرة عامة على 32 صفحة كتبها وين جيرونغ من جاولينغ من المؤتمر الشعبي الوطني

المحرر: دو وي، تشن بينغ

توفر هذه الورقة مقدمة شاملة للبناء والتطبيق المحتمل وتقييم العوامل بناءً على نماذج اللغة الكبيرة (LLMs)، والتي لها أهمية كبيرة لفهم شامل لتطور هذا المجال ولإلهام الأبحاث المستقبلية.

مصدر الصورة: تم إنشاؤها بواسطة Unbounded AI‌

في عصر الذكاء الاصطناعي اليوم، تعتبر العوامل المستقلة طريقًا واعدًا نحو الذكاء العام الاصطناعي (AGI). إن ما يسمى بالوكيل المستقل قادر على إكمال المهام من خلال التخطيط والتعليمات المستقلة. في نماذج التطوير المبكرة، تهيمن الاستدلالات على وظيفة السياسة التي تحدد تصرفات الوكيل، والتي يتم تحسينها تدريجيًا في التفاعل البيئي.

ومع ذلك، في بيئات المجال المفتوح غير المقيدة، غالبًا ما يكون من الصعب على الوكلاء المستقلين التصرف بكفاءة على المستوى البشري.

مع النجاح الكبير الذي حققته نماذج اللغات الكبيرة (LLMs) في السنوات الأخيرة، فقد أظهرت القدرة على تحقيق ذكاء يشبه الإنسان. لذلك، بفضل قدراتها القوية، يتم استخدام LLM بشكل متزايد كمنسق أساسي لإنشاء وكلاء مستقلين، وقد ظهر العديد من وكلاء الذكاء الاصطناعي على التوالي. توفر هذه العوامل طريقًا قابلاً للتطبيق لأنظمة الذكاء الاصطناعي الأكثر تعقيدًا وقابلية للتكيف من خلال محاكاة عمليات صنع القرار الشبيهة بالإنسان.

*قائمة بالوكلاء المستقلين المعتمدين على LLM، بما في ذلك وكلاء الأدوات والوكلاء المحاكيين والوكلاء العامين ووكلاء المجال. *

في هذه المرحلة، من المهم جدًا إجراء تحليل شامل للوكلاء المستقلين الناشئين القائمين على LLM، ومن الأهمية بمكان أن نفهم تمامًا حالة تطوير هذا المجال وإلهام الأبحاث المستقبلية.

في هذه الورقة، أجرى باحثون من كلية هيلهاوس للذكاء الاصطناعي في جامعة رنمين الصينية مسحًا شاملاً للوكلاء المستقلين المعتمدين على LLM، مع التركيز على ثلاثة جوانب لبنائهم وتطبيقهم وتقييمهم.

عنوان الورقة:

ولبناء الوكيل، اقترحوا إطارًا موحدًا يتكون من أربعة أجزاء، وهي وحدة التكوين لتمثيل سمات الوكيل، ووحدة الذاكرة لتخزين المعلومات التاريخية، ووحدة التخطيط لصياغة استراتيجيات العمل المستقبلية، ووحدة الإجراء وحدة لتنفيذ قرارات التخطيط. بعد تقديم وحدات الوكيل النموذجية، قام الباحثون أيضًا بتلخيص استراتيجيات الضبط الدقيق المستخدمة بشكل شائع لتعزيز قدرة العوامل على التكيف مع سيناريوهات التطبيق المختلفة.

ثم يحدد الباحثون التطبيقات المحتملة للوكلاء المستقلين، ويستكشفون كيف يمكنهم الاستفادة من مجالات العلوم الاجتماعية والعلوم الطبيعية والهندسة. وأخيرا، تتم مناقشة طرق التقييم للوكلاء المستقلين، بما في ذلك استراتيجيات التقييم الذاتية والموضوعية. ويوضح الشكل أدناه الهيكل العام للمقالة.

مصدر:

** بناء وكلاء مستقلين على أساس LLM **

من أجل جعل الوكيل المستقل القائم على LLM أكثر كفاءة، هناك جانبان يجب مراعاتهما: أولاً، ما هو نوع البنية التي يجب تصميمها حتى يتمكن الوكيل من الاستفادة بشكل أفضل من LLM؛ ثانيًا، كيفية تعلم المعلمات بشكل فعال.

تصميم معمارية الوكيل: تقترح هذه الورقة إطارًا موحدًا لتلخيص البنية المقترحة في الدراسات السابقة، ويظهر الهيكل العام في الشكل 2، والذي يتكون من وحدة التنميط ووحدة الذاكرة ووحدة التخطيط ووحدة العمل.

باختصار، تهدف وحدة التحليل إلى تحديد الدور الذي يلعبه الوكيل؛ وتضع وحدة الذاكرة والتخطيط الوكيل في بيئة ديناميكية، مما يمكّن الوكيل من تذكر السلوكيات السابقة والتخطيط للإجراءات المستقبلية؛ وتتم ترجمة القرارات إلى مخرجات ملموسة. ومن بين هذه الوحدات، تؤثر وحدة التحليل على وحدات الذاكرة والتخطيط، وتؤثر هذه الوحدات الثلاث معًا على وحدة العمل.

وحدة التحليل

يقوم الوكلاء المستقلون بتنفيذ المهام من خلال أدوار محددة، مثل المبرمجين والمدرسين وخبراء المجال. تهدف وحدة التحليل إلى الإشارة إلى دور الوكيل، وعادةً ما تتم كتابة هذه المعلومات في مطالبات الإدخال للتأثير على سلوك LLM. في الأعمال الحالية، هناك ثلاث استراتيجيات شائعة الاستخدام لإنشاء ملفات تعريف الوكيل: الأساليب اليدوية، وطرق إنشاء ماجستير إدارة الأعمال، وطرق محاذاة مجموعة البيانات.

وحدة الذاكرة

تلعب وحدات الذاكرة دورًا مهمًا جدًا في بناء عوامل الذكاء الاصطناعي. إنه يحفظ المعلومات المدركة من البيئة ويستخدم الذاكرة المسجلة لتسهيل الإجراءات المستقبلية للوكيل. يمكن لوحدات الذاكرة أن تساعد الوكلاء على تجميع الخبرة وتحقيق التطور الذاتي وإكمال المهام بطريقة أكثر اتساقًا ومعقولية وفعالية.

وحدة التخطيط

عندما يواجه البشر مهمة معقدة، يقومون أولاً بتقسيمها إلى مهام فرعية بسيطة، ثم يحلون كل مهمة فرعية واحدة تلو الأخرى. تمنح وحدة التخطيط الوكيل المعتمد على LLM قدرات التفكير والتخطيط اللازمة لحل المهام المعقدة، مما يجعل الوكيل أكثر شمولاً وقوة وموثوقية. تقدم هذه المقالة وحدتين للتخطيط: التخطيط بدون تغذية راجعة والتخطيط باستخدام التغذية الراجعة.

وحدة العمل

تهدف وحدة العمل إلى تحويل قرار الوكيل إلى نتيجة محددة. يتفاعل بشكل مباشر مع البيئة ويحدد مدى فعالية الوكيل في إنجاز المهام. يقدم هذا القسم من منظور هدف العمل والسياسة ومساحة العمل وتأثير العمل.

بالإضافة إلى الأجزاء الأربعة المذكورة أعلاه، يقدم هذا الفصل أيضًا استراتيجيات التعلم للوكيل، بما في ذلك التعلم من الأمثلة، والتعلم من ردود الفعل البيئية، والتعلم من ردود الفعل البشرية التفاعلية.

يسرد الجدول 1 المراسلات بين العمل السابق وتصنيفنا:

** تطبيق الوكيل المستقل القائم على LLM **

يستكشف هذا الفصل التأثير التحويلي للوكلاء المستقلين المعتمدين على LLM في ثلاثة مجالات متميزة: العلوم الاجتماعية، والعلوم الطبيعية، والهندسة.

على سبيل المثال، يمكن استخدام الوكلاء المعتمدين على LLM لتصميم وتحسين الهياكل المعقدة مثل المباني والجسور والسدود والطرق وما إلى ذلك. في السابق، اقترح بعض الباحثين إطارًا تفاعليًا يعمل فيه المهندسون المعماريون البشريون ووكلاء الذكاء الاصطناعي معًا لبناء بيئات هيكلية في عمليات محاكاة ثلاثية الأبعاد. يمكن للوكلاء التفاعليين فهم تعليمات اللغة الطبيعية، ووضع الوحدات، وطلب المشورة، ودمج التعليقات البشرية، مما يوضح إمكانية التعاون بين الإنسان والآلة في التصميم الهندسي.

في علوم الكمبيوتر وهندسة البرمجيات، على سبيل المثال، يوفر الوكلاء المعتمدون على LLM إمكانية أتمتة عملية الترميز والاختبار وتصحيح الأخطاء وإنشاء الوثائق. اقترح بعض الباحثين ChatDev، وهو إطار عمل شامل يتواصل فيه العديد من الوكلاء ويتعاونون من خلال حوار اللغة الطبيعية لإكمال دورة حياة تطوير البرمجيات؛ ويمكن استخدام ToolBench لمهام مثل الإكمال التلقائي للكود وتوصية الكود؛ يمكن لـ MetaGPT أن يلعب دور مدير المنتج، والمهندس المعماري، ومدير المشروع، والمهندس، والإشراف الداخلي على إنشاء الكود وتحسين جودة كود الإخراج النهائي، وما إلى ذلك.

يوضح الجدول التالي التطبيقات التمثيلية للوكلاء المستقلين المعتمدين على LLM:

التقييم القائم على LLM للوكلاء المستقلين

تقدم هذه المقالة استراتيجيتين للتقييم شائعي الاستخدام: التقييم الذاتي والتقييم الموضوعي.

يشير التقييم الذاتي إلى قدرة البشر على اختبار العوامل المستندة إلى LLM من خلال وسائل مختلفة مثل التفاعل والتسجيل. في هذه الحالة، غالبًا ما يتم تعيين الأشخاص المشاركين في التقييم من خلال منصات التعهيد الجماعي؛ ويعتقد بعض الباحثين أن موظفي التعهيد الجماعي غير مستقرين بسبب اختلافات القدرات الفردية، لذلك يتم استخدام شروح الخبراء أيضًا للتقييم.

علاوة على ذلك، في بعض الدراسات الحالية، يمكننا استخدام وكلاء LLM كمقيمين شخصيين. في دراسة ChemCrow، على سبيل المثال، يقوم uatorGPT بتقييم النتائج التجريبية من خلال تعيين تصنيف يأخذ في الاعتبار كلاً من إكمال المهمة بنجاح ودقة عملية التفكير الأساسية. مثال آخر هو أن Chat قام بتشكيل فريق تحكيم متعدد الوكلاء قائم على LLM لتقييم نتائج إنشاء النموذج من خلال المناقشة.

يتمتع التقييم الموضوعي بالعديد من المزايا مقارنة بالتقييم الذاتي، والذي يشير إلى استخدام المقاييس الكمية لتقييم قدرات الوكلاء المستقلين المعتمدين على LLM. يقوم هذا القسم بمراجعة وتجميع طرق التقييم الموضوعي من منظور المقاييس والاستراتيجيات والمعايير.

يمكننا الجمع بين هاتين الطريقتين أثناء تقييم الاستخدام.

يلخص الجدول 3 المراسلات بين العمل السابق واستراتيجيات التقييم هذه:

لمزيد من المعلومات، يرجى الرجوع إلى الورقة الأصلية.

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت
تداول العملات الرقمية في أي مكان وفي أي وقت
qrCode
امسح لتنزيل تطبيق Gate.io
المنتدى
بالعربية
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)