المقالة اليوم تشرح إطار الوكالة، وتقييمنا لتطورها. كما أنها طلب لاقتراحات، موجه لرواد الأعمال العاملين في مجال تقاطع العملات الرقمية عبر الإنترنت (العملات المشفرة) والوكالة.
خلال العام الماضي، قام Decentralised.co بأبحاث عميقة في مجال التقاطع بين التشفير والذكاء الاصطناعي. حتى قمنا ببناء منتج يستخدمه أكثر من 70,000 شخص، لتتبع وكلاء الذكاء الاصطناعي وبنية الوكالة. على الرغم من أن الحماس حول هذا المجال قد تراجع في الأسابيع الأخيرة، إلا أن تأثير الذكاء الاصطناعي على التكنولوجيا والمجتمع هو شيء لم نراه منذ بداية الإنترنت. إذا كانت العملة المشفرة ستصبح المسار المالي للمستقبل، كما توقعنا، فإن تشابكها مع الذكاء الاصطناعي سيكون موضوعًا يتكرر مرارًا وتكرارًا، بدلاً من أن يكون مجرد مرة واحدة.
واحدة من فئات المشاريع الأكثر إثارة التي نشأت من هذه الموجة هي إطارات الذكاء الاصطناعي الأصلية للتشفير. إنها تجربة مثيرة تجلب مبادئ البلوكشين الأساسية - نقل القيمة غير المرخص به، والشفافية، والحوافز المتسقة - إلى تطوير الذكاء الاصطناعي. طبيعتها مفتوحة المصدر تمنحنا فرصة نادرة لاستكشاف كيفية عملها الداخلي، وليس فقط تحليل التزاماتها، ولكن أيضًا تحليل كيفية عملها الفعلي.
في هذه المقالة، نحن نحلل أولا معنى الأطر الوكيلية الفعلي وأهميتها. ثم نقوم بحل مشكلة واضحة: عندما تكون الخيارات الناضجة مثل LangChain موجودة، لماذا نحتاج إلى إطارات تشفير أصلية؟ لهذا، نحلل الأطر الأصلية المشفرة الرائدة ومزاياها وعيوبها في الحالات الاستخدامية المختلفة. وأخيرًا، إذا كنت تقوم ببناء وكيل ذكاء اصطناعي، سنساعدك في اتخاذ قرار بشأن الإطار الذي قد يكون مناسبًا لاحتياجاتك. أو عليك استخدام الإطار للبناء.
دعونا نتعمق في النقاش.
التجريد
"تقدم الحضارة يكمن في زيادة عدد العمليات الهامة التي يمكننا تنفيذها دون تفكير." - ألفريد نورث وايتهيد
تخيل كيف كان يعيش أسلافنا. كان علي كل أسرة زراعة غذائها الخاص، وصنع ملابسها الخاصة، وبناء منزلها الخاص. قضوا الكثير من الوقت في المهام الأساسية للبقاء على قيد الحياة، وكادوا لا يملكون الوقت لفعل أي شيء آخر. حتى قبل قرنين من الزمان، كانت نسبة تقارب 90 % من الناس يعملون في مجال الزراعة. اليوم، نشتري الطعام من السوبر ماركت، ونعيش في منازل بناها خبراء، ونرتدي ملابس تم إنتاجها في مصانع بعيدة. ما كانت مهمة كانت تتطلب جهود عدة أجيال أصبحت صفقة بسيطة. اليوم، يعمل فقط 27 % من سكان العالم في الزراعة (تنخفض إلى أقل من 5 % في البلدان المتقدمة).
عندما نبدأ في اكتساب تقنية جديدة، سيظهر نمط مألوف. نفهم أولا المبادئ الأساسية - ما هو فعال، ما هو غير فعال، وأي الأنماط تظهر بشكل متكرر. عندما تصبح هذه الأنماط واضحة، نقوم بتجميعها في تجربة أكثر سهولة وسرعة وموثوقية. هذه التجربة تحرر الوقت والموارد لمواجهة تحديات أكثر تنوعًا ومعنى. وهذا ينطبق أيضًا على بناء البرمجيات.
على سبيل المثال، دعنا نأخذ تطوير الويب. في البداية، كان على المطورين كتابة كل شيء من الصفر - مثل معالجة طلبات HTTP وإدارة الحالة وإنشاء واجهة المستخدم - هذه المهام معقدة وتستغرق وقتًا طويلاً. ثم ظهرت أطر مثل React التي بسهولة كبيرة تبسط هذه التحديات من خلال توفير مستويات تجريد مفيدة. اتبع تطوير التطبيقات المحمولة مسارًا مماثلاً. في البداية، كان على المطورين اكتساب معرفة عميقة محددة للمنصة، لكن ظهور أدوات مثل React Native و Flutter جعلهم قادرين على كتابة الكود مرة واحدة ونشره في أي مكان.
ظهرت أنماط مماثلة من التجريد في التعلم الآلي. في أوائل عام 2000 ، اكتشف الباحثون إمكانات وحدات معالجة الرسومات في أعباء عمل ML. في البداية ، كان على المطورين أن يتصارعوا مع بدائيات الرسومات واللغات مثل GLSL من OpenGL - وهي أدوات لم يتم تصميمها للحوسبة للأغراض العامة. تغير كل شيء في عام 2006 عندما قدمت NVIDIA CUDA ، مما جعل برمجة GPU أكثر سهولة وجلب تدريب ML إلى قاعدة مطورين أوسع.
مع تزايد زخم تطوير ML، ظهرت أطر متخصصة لتجريد تعقيد برمجة وحدة معالجة الرسومات. TensorFlow و PyTorch تتيح للمطورين التركيز على هيكل النموذج، بدلاً من الوقوع في الطين الناتج عن رموز وحدة معالجة الرسومات الأساسية أو التفاصيل النفذية. هذا يسرع من تكرار هياكل النماذج، بالإضافة إلى التقدم السريع الذي شهدناه في مجال الذكاء الاصطناعي/تعلم الآلة خلال السنوات القليلة الماضية.
نحن نشهد الآن تطورا مشابها لوكيل الذكاء الاصطناعي - وهو برنامج قادر على اتخاذ القرارات واتخاذ الإجراءات لتحقيق هدف ، تماما مثل المساعد البشري أو الموظف. يستخدم نموذجا لغويا كبيرا باعتباره "دماغه" ويمكنه استخدام أدوات مختلفة مثل البحث في الويب أو إجراء مكالمات API أو الوصول إلى قواعد البيانات لإنجاز المهام.
يجب على المطور كتابة رموز معقدة للتعامل مع كل جانب: كيف يفكر الوكيل، وكيف يقرر استخدام أي أدوات ومتى، وكيف يتفاعل مع هذه الأدوات، وكيف يتذكر سياق التفاعلات السابقة، وكيف يقسم المهام الكبيرة إلى خطوات قابلة للإدارة. يجب حل كل نمط على حدة، مما يؤدي إلى العمل المتكرر وعدم الاتساق في النتائج.
هنا هو حيث يبرز إطار الوكيل الذكي. تماما كما حدد React الجزء الصعب من إدارة تحديثات واجهة المستخدم والحالة لتبسيط تطوير الويب، هذه الأطر تحل التحديات الشائعة في بناء وكلاء الذكاء الاصطناعي. إنها توفر لنا مكونات جاهزة للاستخدام لأنماط فعالة وجدناها، مثل كيفية بناء عمليات اتخاذ القرار للوكيل ودمج أدوات مختلفة والحفاظ على السياق في عدة تفاعلات.
باستخدام الإطار، يمكن للمطورين التركيز على جعل وكالتهم فريدة من نوعها - وظائفها وسيناريوهاتها المحددة - بدلاً من إعادة بناء هذه المكونات الأساسية. يمكنهم إنشاء وكلاء ذكاء اصطناعي معقدة في أيام أو أسابيع بدلاً من أشهر، والتجربة بشكل أسهل بأساليب مختلفة، واقتباس أفضل الممارسات التي اكتشفها المطورون الآخرون والمجتمع.
لفهم أهمية الأطر بشكل أفضل، دعنا نأخذ في اعتبار مطور يبني وكيلًا يساعد الأطباء في مراجعة التقارير الطبية. إذا لم تكن هناك أطر، فسيكون عليهم كتابة جميع الشيفرة من الصفر: التعامل مع مرفقات البريد الإلكتروني، استخراج النص من ملفات PDF، إدخال النص بالتنسيق الصحيح إلى LLM، إدارة سجل المحادثات لتتبع المحتوى الذي تم مناقشته بالفعل، وضمان أن يقوم الوكيل بالرد بشكل مناسب. بالنسبة للمهام التي ليست فريدة من نوعها لحالتها الخاصة، هذه شفرة معقدة بشكل كبير.
باستخدام الإطار الوكالة، يمكن استخدام العديد من هذه البنى مباشرة. يتولى الإطار قراءة البريد الإلكتروني وملفات PDF، ويوفر نماذج لبناء تلميحات المعرفة الطبية، ويدير سير الحوار، ويساعد حتى في تتبع التفاصيل الهامة في عدة محادثات. يمكن للمطورين التركيز على جعل وكيلهم مميزًا، مثل ضبط تلميحات التحليل الطبي أو إضافة فحوصات أمان محددة للتشخيص، بدلاً من إعادة اختراع النماذج الشائعة. ما كان من الممكن سابقًا أن يحتاج عدة أشهر لبنائه من الصفر، يمكن الآن إكمال تصميم النموذج الأولي في غضون بضعة أيام.
أصبح LangChain سكينًا سويسريًا لتطوير الذكاء الاصطناعي، مما يوفر مجموعة أدوات مرنة لبناء تطبيقات قائمة على LLM. على الرغم من أنه ليس بالضبط إطار وكالة، إلا أنه يوفر العناصر الأساسية لبناء معظم أطر وكالة، بدءًا من سلسلة ترتيب استدعاءات LLM إلى نظام ذاكرة للحفاظ على السياق. يجعل نظام الإيكولوجية المتكامل والوثائق الغنية منه نقطة انطلاق مفضلة للمطورين الذين يرغبون في بناء تطبيقات عملية للذكاء الاصطناعي.
ثم هناك أطر ذكاء اصطناعي متعددة العوامل مثل CrewAI و AutoGen، التي تتيح للمطورين بناء أنظمة تعمل فيها عدة وكلاء ذكاء اصطناعي بتنسيق تعاوني، حيث لكل وكيل دور وقدرات فريدة. هذه الأطر لا تقوم بتنفيذ المهام بتسلسل بسيط، بل تؤكد على التعاون بين الوكلاء من خلال الحوار لحل المشاكل بشكل مشترك.
على سبيل المثال، عند توزيع تقرير بحث، قد يقوم وكيل بتوضيح هيكله، في حين قد يقوم وكيل آخر بجمع المعلومات ذات الصلة، وقد يقوم وكيل ثالث بالتعليق على المسودة النهائية وتحسينها. هذا يشبه تكوين فريق افتراضي، حيث يمكن لوكلاء الذكاء الاصطناعي مناقشة ومناقشة وتحسين الحلول معًا. وعادة ما يُشار إلى أنظمة الوكلاء المتعددة التي تعمل بشكل تعاوني بهذه الطريقة لتحقيق أهداف عالية المستوى على أنها "مجموعة" من الوكلاء الذكاء الاصطناعي.
على الرغم من أنه ليس إطارا تقليديا ، إلا أن AutoGPT كان رائدا في مفهوم وكلاء الذكاء الاصطناعي المستقلين. يوضح كيف يمكن الذكاء الاصطناعي اتخاذ هدف عالي المستوى ، وتقسيمه إلى مهام فرعية ، وإكماله بشكل مستقل مع الحد الأدنى من المدخلات البشرية. على الرغم من قيوده ، أثار AutoGPT موجة من الابتكار للوكلاء المستقلين وأثر على تصميم أطر أكثر تنظيما تلت ذلك.
ولكن لماذا التشفير؟
كل هذه الخلفيات تؤدي في النهاية إلى ظهور إطار الوكالة الذكية الأصلي للتشفير. في هذا الوقت، قد تتساءل، لماذا تحتاج Web3 إلى إطارها الخاص عندما لدينا إطارات ناضجة نسبيًا مثل Langchain و CrewAI في Web2؟ بالطبع، يمكن للمطورين استخدام هذه الأطر الحالية لبناء أي وكالة يرغبون فيها؟ وبمراعاة تفضيل هذه الصناعة لفرض Web3 على أي حكاية، فإن هذا الشك مبرر.
نعتقد أن وجود إطار وكيل محدد لـ Web3 يوجد به ثلاثة أسباب كافية.
وكيل مالي يعمل على السلسلة
نحن نعتقد أن معظم صفقات البنوك في المستقبل ستتم على سكة بلوكتشين. هذا يعزز الحاجة إلى نوع من الوكلاء الذكاء الاصطناعي، والذين يمكنهم تحليل البيانات على السلسلة، وتنفيذ صفقات بلوكتشين، وإدارة الأصول الرقمية عبر عدة بروتوكولات وشبكات. من الروبوتات التداول التلقائي التي يمكنها اكتشاف فرص التحكم، إلى مديري محافظ الاستثمار الذين ينفذون استراتيجيات العائد، يعتمد هؤلاء الوكلاء على تكامل عميق لوظائف بلوكتشين في عملياتهم الأساسية.
الأطر النموذجية للويب 2 التقليدية لا توفر مكونات أصلية لهذه المهام. يجب عليك تجميع مكتبة طرف ثالث للتفاعل مع العقود الذكية وتحليل الأحداث الأصلية على السلسلة ومعالجة إدارة المفتاح الخاصة - مما يقدم تعقيدًا وثغرات محتملة. بدلاً من ذلك، يمكن للأطر النموذجية للويب 3 المتخصصة التعامل مع هذه الوظائف بشكل جاهز، مما يسمح للمطورين بالتركيز على منطق واستراتيجيات وكلائهم، بدلاً من محاربة أنابيب سلسلة الكتل منخفضة المستوى.
التنسيق الأصلي والحوافز
Blockchain لا يتعلق فقط بالعملات الرقمية. وهي توفر نظاما عالميا للسجل مع أدوات مالية مدمجة لتعزيز التنسيق بين الوكلاء المتعددين. بدلا من الاعتماد على السمعة خارج السلسلة أو قواعد البيانات المنعزلة ، يمكن للمطورين استخدام الأوليات على السلسلة مثل التخزين والضمان ومجمعات الحوافز لتنسيق مصالح وكلاء الذكاء الاصطناعي المتعددين.
تخيل مجموعة من الوكلاء يتعاونون لإكمال مهمة معقدة (على سبيل المثال، وضع علامات على البيانات لتدريب نموذج جديد). يمكن تتبع أداء كل وكيل على السلسلة وتخصيص المكافآت تلقائيًا استنادًا إلى المساهمة. شفافية النظام القائم على تقنية سلسلة الكتل وثباته يسمحان بتوزيع الأجور بشكل عادل وتتبع سمعة أقوى وبرامج حوافز متطورة في الوقت الحقيقي.
يمكن تضمين هذه الوظائف بوضوح في البنية الأساسية للتشفير، مما يسمح للمطورين باستخدام عقود ذكية لتصميم هيكل تحفيزي، دون الحاجة إلى إعادة تصميم العجلة في كل مرة تحتاج فيها إلى الوكالة أو الدفع لوكالة أخرى.
الفرص الجديدة في السوق المبكرة
على الرغم من أن الأطر مثل LangChain لديها بالفعل مشاركة الأفكار وتأثير الشبكة، إلا أن مجال وكلاء الذكاء الاصطناعي لا يزال في مرحلة مبكرة. لا يزال غير واضح حاليا كيف سيبدو الحال النهائي لهذه الأنظمة، وليس هناك طريقة لقفل السوق.
فتح اقتصاد التشفير إمكانيات جديدة لبناء وإدارة وتحويل القيمة بواسطة التحفيز الاقتصادي، وهذه الإمكانيات لا يمكن تصويرها بشكل كامل في اقتصاديات SaaS أو Web2 التقليدية. يمكن أن تفتح التجارب في هذه المرحلة المبكرة استراتيجيات تحويل قيمة جديدة للإطار نفسه، بدلاً من بناء وكلاء على الإطار.
المنافسين
ElizaOS مرتبطة بمشروع AI16Z الشهير وهي إطار مبني على Typescript يستخدم لإنشاء ونشر وإدارة وكلاء الذكاء الاصطناعي. تم تصميمها كنظام تشغيل ودية لـ Web3 يسمح لمطوري البرامج ببناء وكلاء ذوي شخصيات فريدة وأدوات مرنة للتفاعل مع سلسلة الكتل وتوسيعها بسهولة من خلال أنظمة متعددة للوكلاء.
Rig هو إطار وكيل AI مفتوح المصدر تم تطويره بواسطة Playgrounds Analytics Inc. ، والذي تم بناؤه باستخدام لغة برمجة Rust ، ويستخدم لإنشاء وكلاء AI قابلين للتوسيع والتعددية. إنه مرتبط بمشروع AI Rig Complex (ARC).
Daydreams هو إطار وكيل توليدية، تم إنشاؤه في الأصل لإنشاء وكلاء مستقلين للألعاب على السلسلة، ولكن توسع فيما بعد لتنفيذ مهام على السلسلة.
Pippin هو إطار عميل AI تم تطويره بواسطة مؤسس BabyAGI Yohei Nakajima ، بهدف مساعدة المطورين في إنشاء مساعدين رقميين متعددين الوحدات ومستقلين. قام Yohei أولاً ببناء وكيل مستقل ، ثم قام بتوسيعه إلى إطار عام.
ZerePy هو إطار Python مفتوح المصدر مصمم لنشر وكلاء مستقلين عبر عدة منصات وسلاسل كتلية، مع التركيز الرئيسي على تكامل الذكاء الاصطناعي ووسائل التواصل الاجتماعي الإبداعية. كما كان الحال مع Pippin ، بدأ Zerepy كوكيل مستقل Zerebro في الأصل ثم تطور ليصبح إطارًا.
القياسية
لتقييم قوة كل إطار، نحن نقف من وجهة نظر مطوري الذكاء الاصطناعي الذين يرغبون في بناء وكلاء AI. ما الذي يهمهم؟ نعتقد أن تقسيم التقييم إلى ثلاث فئات رئيسية مفيد جدًا: الأساسيات والوظائف وتجربة المطور.
يمكنك اعتبار النواة الأساسية للإطار كبناء لجميع الوكلاء الآخرين. إذا كانت النواة ضعيفة أو بطيئة أو لا تتطور باستمرار، فسيكون استخدام الوكلاء الذي تم إنشاؤهم باستخدام هذا الإطار مقيدًا بنفس القيود. يمكن تقييم النواة وفقًا للمعايير التالية:
حلقة الاستدلال الأساسية: عقل أي إطار وكيفية حله للمشكلات. يدعم الإطار القوي كل شيء من تدفق الإدخال والإخراج الأساسي إلى سلاسل الأفكار ونماذج معقدة. بدون قدرة استدلالية قوية، لا يمكن للوكيل تقسيم المهام المعقدة بشكل فعال أو تقييم الخيارات المتعددة، مما يبسطها إلى روبوتات محادثة رائعة.
آلية الذاكرة: يحتاج الوكيل إلى الذاكرة القصيرة الأجل للمحادثة المستمرة وأيضًا إلى التخزين الطويل الأجل للحصول على معرفة دائمة. الأطر الجيدة ليست مجرد تذكر - بل فهي تفهم العلاقات بين المعلومات المختلفة وتستطيع إعطاء الأولوية للمعلومات التي تستحق الاحتفاظ بها ونسيان الباقي.
دعم الدمج و RAG: يجب على الوكلاء الحديثين استخدام المعرفة الخارجية مثل الوثائق وبيانات السوق. يمكن للأطر القوية تضمين هذه المعلومات بسهولة واسترجاعها وفقًا للسياق من خلال RAG، مما يسمح ببناء الاستجابات على أساس المعرفة المحددة، بدلاً من الاعتماد فقط على تدريب النماذج الأساسية.
تكوين الشخصية: قدرة تشكيل طريقة التواصل لدى موظفي خدمة العملاء (اللهجة، الأدب، والشخصية) أمر حيوي لمشاركة المستخدمين. يمكن للإطار الجيد تكوين هذه السمات بسهولة، مما يعرف أن شخصية موظفي خدمة العملاء ستؤثر بشكل كبير على ثقة المستخدمين.
التنسيق متعدد الوكالات: يوفر الإطار القوي نمطًا مدمجًا للتعاون بين الوكالات، سواء من خلال الحوار المنظم، أو تكليف المهام، أو نظام المشاركة في الذاكرة. يمكن أن يؤدي هذا إلى إنشاء فرق متخصصة، حيث يستخدم كل وكيل قدراته الفريدة لحل المشكلات معًا.
بالإضافة إلى وظائف النواة، يعتمد فعالية الإطار إلى حد كبير على وظائفه وتكامله. توسعت الأدوات بشكل كبير قدرات الوكيل الفعلية. يمكن للوكيل الذي لديه فقط صلاحيات الوصول إلى LLM المشاركة في المحادثات، لكن بمنحه صلاحية الوصول إلى متصفح الويب، يمكنه الحصول على المعلومات في الوقت الحقيقي. عند ربطه بواجهة برمجة تطبيقات التقويم الخاصة بك، يمكنه ترتيب الاجتماعات. كل أداة جديدة تزيد قدرات الوكيل بشكل مضاعف. من وجهة نظر مطوري البرمجيات، كلما زاد عدد الأدوات، زادت خياراتهم ونطاق تجاربهم.
نحن نقيم إطار العمل الأصلي للتشفير من ثلاثة جوانب:
دعم نماذج الذكاء الاصطناعي والوظائف: يوفر الإطار القوي التكامل الأصلي مع مجموعة متنوعة من نماذج اللغات - من سلسلة GPT من OpenAI إلى بدائل مفتوحة المصدر مثل Llama و Mistral. ولكن هذا لا يتعلق بـ LLM فقط. يمكن أن يوسع دعم الوظائف الأخرى للذكاء الاصطناعي الوكيل بشكل كبير، مثل تحويل النص إلى كلام، واستخدام المتصفح، وتوليد الصور، والاستدلال المحلي للنماذج، وهكذا. يصبح دعم النماذج القوية ضروريًا للعديد من إطارات هذا النوع.
دعم البنية التحتية ل Web3: يتطلب إنشاء وكيل تشفير تكاملا عميقا مع البنية التحتية ل blockchain. وهذا يعني دعم مكونات Web3 الضرورية ، مثل المحافظ لتوقيع المعاملات ، و RPCs للاتصال المتسلسل ، والمفهرسات للوصول إلى البيانات. يجب أن يتكامل إطار العمل القوي مع الأدوات والخدمات الأساسية عبر النظام البيئي ، من أسواق NFT وبروتوكولات DeFi إلى حلول الهوية وطبقات توافر البيانات.
تغطية السلسلة: يحدد دعم البنية التحتية لـ Web3 ما يمكن للوكالات القيام به، في حين يحدد تغطية السلسلة حيث يمكنها القيام بذلك. يتطور النظام البيئي للتشفير ليصبح كيانًا متعدد السلاسل متفرعًا، مما يبرز أهمية تغطية السلاسل الواسعة النطاق.
في النهاية ، حتى أقوى الأطر يمكن أن تكون جيدة فقط مثل تجربة المطور. يمكن أن يتباهى إطار العمل بوظائف من الدرجة الأولى ، ولكن لن يتم اعتماده على نطاق واسع إذا كان من الصعب على المطورين استخدامه بفعالية.
اللغة المستخدمة في الإطار تؤثر مباشرة على من يمكنه استخدامه للبناء. يحتل Python مكانة ريادية في مجالي الذكاء الاصطناعي وعلوم البيانات، ولذلك أصبح بشكل طبيعي خيارًا لإطار الذكاء الاصطناعي. قد يكون للإطارات التي تمت كتابتها بلغة نيش ميزة فريدة، ولكن يمكن أن تعزل نفسها عن نظام البيئة للمطورين الأوسع نطاقًا. يجعل انتشار JavaScript في تطوير الويب منه منافسًا قويًا آخر، خاصة بالنسبة للأطر الموجهة نحو تكامل الويب.
الوثائق الواضحة والشاملة هي خط الحياة للمطورين الذين يتبنون الأطر الجديدة. هذا ليس فقط مرجع API، على الرغم من أن هذه أيضًا أمور مهمة للغاية. تتضمن الوثائق القوية نظرة عامة على مفاهيم الأساسية، ودروس تعليمية تفصيلية، وأمثلة للشفرات المصدرية ذات التعليقات الجيدة، وبرامج تعليمية، ودليل لحل المشكلات، وأنماط تصميم معمول بها.
النتيجة
يُلخص الجدول أداء كل إطار في المعايير التي حددناها للتو في الترتيب (التصنيف 1-5).
على الرغم من أن مناقشة أسباب كل نقطة بيانات تتجاوز نطاق هذا المقال، إلا أن هناك بعض الانطباعات المميزة التي تركها كل إطار لنا.
Eliza هي أكثر الأطر نضوجًا في هذه القائمة حتى الآن. نظرًا لأن إطار Eliza أصبح نقطة تقديم الذكاء الاصطناعي للنظام البيئي للتشفير في الموجة الأخيرة من الوسطاء، فإن ميزة بارزة لها هي كمية الميزات والتكامل التي تدعمها.
نظرًا لشهرتها، يقوم كل سلسلة كتلية وأداة تطوير بدمج نفسها بسرعة في هذا الإطار (حاليًا لديها ما يقرب من 100 تكامل!). في الوقت نفسه، جذبت Eliza أنشطة تطويرية أكثر من معظم الأطر الأخرى. يستفيد Eliza على الأقل في المدى القصير من بعض آثار الشبكة الواضحة جدًا. يتم كتابة هذا الإطار بلغة TypeScript، وهي لغة ناضجة تستخدم من قبل كل من المبتدئين والمطورين ذوي الخبرة، مما يعزز بشكل أكبر تطوره.
Eliza تبرز أيضًا بسبب المحتوى التعليمي الغني والدروس التعليمية التي توفرها للمطورين لاستخدام هذا الإطار.
لقد رأينا بالفعل سلسلة من وكلاء Eliza Framework ، بما في ذلك Spore و Eliza (وكيل) و Pillzumi. من المتوقع أن يتم إصدار إصدار جديد من إطار عمل Eliza في الأسابيع القادمة.
طريقة Rig مختلفة تمامًا عن طريقة Eliza. إنها تبرز بنواة قوية وخفيفة الوزن وعالية الأداء. إنها تدعم مجموعة متنوعة من أوضاع الاستدلال، بما في ذلك سلاسل الاقتراحات (تطبيق تسلسلي للاقتراحات) والتنسيق (تنسيق عدة وكلاء) والمنطق الشرطي والتوازي (تنفيذ العمليات المتزامنة).
ومع ذلك، لا يوجد في حد ذاته Rig تكامل غني. بدلاً من ذلك، يتبع نهجًا مختلفًا، ويشير الفريق إلى ذلك بـ "Arc Handshake". هنا، يتعاون فريق Arc مع فرق عالية الجودة مختلفة في Web2 و Web3 لتوسيع وظائف Rig. تشمل بعض هذه التعاونات التعاون مع Soulgraph لتطوير وكالة الشخصية، والتعاون مع Listen و Solana Agent Kit لتطوير وظائف سلسلة الكتل.
ومع ذلك ، فإن Rig له عيبان. بادئ ذي بدء ، إنه مكتوب بلغة Rust ، وعلى الرغم من أنه شديد الأداء ، إلا أن عددا قليلا نسبيا من المطورين على دراية به. ثانيا ، لم نر سوى عدد محدود من الوكلاء الذين يعملون بالحفارات في تطبيقات العالم الحقيقي (باستثناء AskJimmy) ، مما يجعل من الصعب تقييم اعتماد المطور الحقيقي.
قبل بدء Daydreams، كان lordOfAFew مساهمًا رئيسيًا في إطار Eliza. هذا جعله يتعرف على نمو الإطار، والأهم من ذلك، التعرف على بعض النقاط السلبية. الاختلاف الرئيسي بين Daydreams والأطر الأخرى هو تركيزه على الاستدلال بسلسلة الأفكار للمساعدة في تحقيق الأهداف طويلة المدى. هذا يعني أنه عندما يتم تحديد هدف عالي المستوى ومعقد، سيقوم الوكيل بالتفكير في خطوات متعددة، واقتراح مجموعة متنوعة من الإجراءات، وقبولها أو رفضها استنادًا إلى ما إذا كانت ستساعد في تحقيق الهدف، ثم مواصلة هذه العملية لتحقيق التقدم. هذا يجعل الوكلاء الذين يتم إنشاؤهم باستخدام Daydreams حقًا مستقلين.
أثر خلفية المؤسس في بناء مشاريع الألعاب هذه الطريقة. الألعاب، وخاصة الألعاب على السلسلة، هي بيئة تدريبية مثالية لتدريب الوكلاء واختبار قدراتهم. ليس من المستغرب أن بعض الاستخدامات المبكرة لوكيل Daydreams كانت في ألعاب مثل Pistols، Istarai، وPonziLand.
هذا الإطار لديه أيضًا تنفيذ وتنسيق سير عمل قوي للوكلاء المتعددين.
مماثلة ل Daydreams ، Pippin هي أيضًا متأخرة في ألعاب الإطار. في هذه المقالة ، سنقدم تفاصيل عن إطلاقها. رؤية Yohei الأساسية هي جعل الوكالات تكون "وجودًا رقميًا" حيث يمكنها التشغيل بذكاء وبشكل مستقل عن طريق الوصول إلى الأدوات الصحيحة. تتجلى هذه الرؤية في النواة البسيطة والأنيقة لـ Pippin. مع بضعة أسطر من الشيفرة ، يمكنك إنشاء وكالة معقدة يمكنها العمل بشكل مستقل ، وحتى كتابة الشيفرة بنفسها.
إن عيب هذا الإطار هو أنه حتى يفتقر إلى وظائف أساسية مثل تضمين النواة الدعمي وسير عمل RAG. كما أنه يشجع المطورين على استخدام معظم التكاملات من خلال مكتبة الطرف الثالث Composio. بالمقارنة مع الأطر الأخرى المناقشة حتى الآن، فإنه ليس ناضجًا على الإطلاق.
بعض وكلاء البناء مع باكون تشمل ديتو وتيليمافيا.
Zerepy لديها تنفيذ أساسي نسبيًا بسيط. إنها تختار مهمة واحدة من مجموعة المهام المكونة بشكل فعال وتنفذها عند الحاجة. ومع ذلك، فإنها تفتقر إلى نماذج استدلال معقدة مثل الدفع نحو الهدف أو التخطيط الذهني.
على الرغم من دعمه لاستدعاء العديد من LLM، إلا أنه يفتقر إلى أي تضمين أو تنفيذ RAG. كما يفتقر أيضًا إلى أي بنى جملية للذاكرة أو تنسيق للوكلاء المتعددين.
هذه الوظيفة الأساسية ونقص التكامل ينعكسان في اعتماد Zerepy. لم نرَ أي وكيل فعلي يستخدم هذا الإطار بعد.
إذا كان كل هذا يبدو تقنيًا ونظريًا للغاية، فلن نلومك. السؤال الأبسط هو "هل يمكنني استخدام هذه الأطر الخاصة ببناء وكلاء ما دون الحاجة إلى كتابة العديد من الشفرات؟".
لتقييم هذه الأطر عمليا، حددنا خمسة أنواع شائعة من الوكلاء الذين يرغب المطورون غالبا في إنشائها. إنها تمثل مستويات مختلفة من التعقيد وتختبر جوانب مختلفة من وظائف كل إطار.
**وكيل محادثة الوثائق: ** اختبار وظيفة RAG الأساسية ، بما في ذلك معالجة الوثائق وصيانة السياق ودقة الاقتباس وإدارة الذاكرة. يكشف هذا الاختبار عن قدرة الإطار على التنقل بين فهم الوثائق الحقيقية والتطابق البسيط للأنماط.
روبوت المحادثة: تقييم نظام الذاكرة واتساق السلوك. يجب أن يحافظ هذا الإطار على خصائص الشخصية المتسقة، ويتذكر المعلومات الرئيسية في المحادثة، ويسمح بالتكوين الشخصي، مما يحول بشكل أساسي الروبوتات غير الحالية إلى كيانات رقمية دائمة.
روبوت التداول على السلسلة: من خلال معالجة بيانات السوق في الوقت الحقيقي، وتنفيذ صفقات عبر السلاسل، وتحليل المشاعر الاجتماعية، وتنفيذ استراتيجيات التداول لاختبار تكامل الخارجي. يكشف ذلك كيفية تعامل الإطار مع البنية التحتية المعقدة لسلسلة الكتل واتصالات واجهة برمجة التطبيقات (API).
ألعاب الشخصيات غير القابلة للعب: على الرغم من أن العالم بدأ في التركيز على الوكلاء فقط في العام الماضي ، فقد لعب الوكلاء دورا حاسما كشخصية غير لاعب في (NPC) اللعبة لعقود. تنتقل بروكسيات الألعاب من الوكلاء المستندة إلى القواعد إلى الوكلاء الأذكياء المدعومين من LLM وتظل حالة الاستخدام الأساسية لأطر العمل. هنا ، نختبر قدرة الوكيل على فهم البيئة ، وسيناريوهات التفكير المستقل ، وتحقيق الأهداف طويلة الأجل.
مساعد صوتي: تقييم معالجة الوقت الحقيقي وتجربة المستخدم من خلال معالجة الصوت والرد السريع وتكامل منصة الرسائل. يختبر هذا ما إذا كان الإطار قادرًا على دعم تطبيقات تفاعلية حقيقية، بدلاً من نمط الطلب والاستجابة البسيط.
لقد قمنا بتقييم كل إطار بناء بدرجة تصل إلى 5 نقاط لكل نوع من أنواع الوكلاء. وإليك أداءها:
عند تقييم هذه الأطر، يولي معظم التحليلات اهتمامًا كبيرًا لمؤشرات GitHub مثل النجوم والفورك. هنا، سنقدم لمحة سريعة عن ما هي هذه المؤشرات، وإلى أي حد تعكس جودة الأطر.
يعمل العلامات النجمية كإشارة واضحة لشعبية المشروع. في الأساس، فهي علامات مرجعية يضعها المطورون على المشاريع التي يجدونها مثيرة أو يرغبون في تتبعها. على الرغم من أن عدد النجوم العالي يدل على وعي واهتمام واسعين، إلا أنه قد يؤدي إلى الإيهام. في بعض الأحيان، قد تتراكم النجوم على المشروع نتيجة للتسويق بدلاً من القيمة التقنية. يجب اعتبار النجوم كدليل اجتماعي بدلاً من معيار قياس الجودة.
يخبرك عدد الفروكات عن عدد المطورين الذين قاموا بإنشاء نسخ لمستودعاتهم الخاصة لبناءها. عادة ما يشير المزيد من الفروكات إلى أن المطورين يستخدمون ويوسعون المشروع بنشاط. وبمعنى آخر، يتطلب الفهم السياقي الأصلي لعدد كبير من الفروكات أن يتم التخلي عنها في النهاية.
تكشف عدد المساهمين عن عدد المطورين المختلفين الذين قدموا فعليا الرموز إلى المشروع. غالبا ما يكون هذا أكثر مغزى من النجوم أو الفروع. يشير عدد المساهمين العاديين الصحيح إلى أن المشروع لديه مجتمع نشط يقوم بصيانته وتحسينه.
ذهبنا خطوة أبعد من ذلك وصممنا مؤشرنا الخاص - نقاط المساهمة. نحن نقيم التاريخ العام لكل مطور ، بما في ذلك مساهمتهم السابقة في مشاريع أخرى ، وتردد نشاطهم وشعبية حساباتهم ، ونخصص درجة لكل مساهم. ثم نقوم بمعدل مساهمي مشروع ما وفقًا للوزن المرتبط بكمية مساهماتهم.
ماذا تعني هذه الأرقام بالنسبة لإطارنا؟
في معظم الحالات ، يمكن تجاهل عدد النجوم. ليست لديهم معنى معتبر في السياق. الاستثناء هو Eliza ، التي كانت في وقت ما أول مستودع اتجاهي في جميع المشاريع على GitHub ، وهو ما يتفق مع كونها نقطة شيرلين لجميع الذكاء الاصطناعي المشفر. بالإضافة إلى ذلك ، فإن مطورين معروفين مثل 0xCygaar قد ساهموا في هذا المشروع. يتم انعكاس هذا أيضًا في عدد المساهمين - بجذبها لعشرة أضعاف مقارنة بالمشاريع الأخرى - جذب Eliza للمساهمين.
بالإضافة إلى ذلك، Daydreams مثير للاهتمام بالنسبة لنا فقط لأنه جذب مطورين عاليين المستوى. كمتأخر يتم إطلاقه بعد ذروة التسويق، لم يستفد من تأثير شبكة إليزا.
ما هو الخطوة التالية؟
إذا كنت مطورًا، نأمل أننا على الأقل قد قدمنا نقطة انطلاق لاختيار الإطار الذي ستبني عليه (إذا كنت بحاجة إليه). بالإضافة إلى ذلك، ستحتاج لاختبار بجدية مدى ملاءمة المنطق الأساسي والتكامل لكل إطار لحالتك الاستخدامية. هذا أمر لا مفر منه.
من وجهة نظر المراقب، من الأهم أن نتذكر أن جميع أطر وكلاء الذكاء الاصطناعي هذه ليست بعمر يتجاوز ثلاثة أشهر. (نعم، يبدو أنها أطول قليلاً.) خلال هذه الفترة، تحولت من التضخيم المفرط إلى ما يُعرف بـ "برج الهواء". هذه هي طبيعة التكنولوجيا. على الرغم من وجود هذه التقلبات، نحن نعتقد أن هذا المجال هو تجربة جديدة مثيرة ودائمة في مجال العملات المشفرة.
ما يهم بعد ذلك هو كيف تنضج هذه الأطر من حيث التكنولوجيا وتحقيق الدخل.
من الناحية التقنية، يمكن للأطر أن تخلق أكبر ميزة لنفسها من خلال جعل الوكلاء قادرين على التفاعل بسلاسة على السلسلة. وهذا هو السبب الرئيسي لاختيار المطورين الأطر الأصلية المشفرة بدلاً من الأطر العامة. بالإضافة إلى ذلك، فإن مشكلة الوكالات وبناء التكنولوجيا الوكالية هي مشكلة تقنية رائدة عالميًا، حيث يحدث كل يوم تطور جديد. يجب أن تستمر الأطر في التطور والتكيف مع هذه التطورات.
كيف يمكن للإطار أن يجعل النقود أمرًا أكثر إثارة. في هذه المرحلة الأولى، كان إنشاء منصة إطلاق مستوحاة من Virtuals أمرًا سهلًا للغاية. ولكننا نعتقد أن هناك الكثير من المساحة للتجارب هنا. نحن نتجه نحو مستقبل يضم ملايين الوكلاء، الذين يعملون بشكل خاص في مجموعة متنوعة من المجالات الفرعية التي يمكن تصورها. يمكن للأدوات التي تساعدهم على التنسيق بشكل فعال أن تستخلص قيمة هائلة من رسوم التداول. كبوابة للبناة، يعتبر الإطار بالطبع الأنسب لاستخلاص هذه القيمة.
في الوقت نفسه، تتنكر تحويل الإطار إلى عملة كمشكلة تحويل العملة في مشروع مفتوح المصدر ومكافأة المساهمين، حيث خلق هؤلاء المساهمون دائمًا بدون مقابل وبجهد كبير. إذا كان فريق قادرًا على كسر كيفية إنشاء اقتصاد مفتوح المصدر مستدام، وفي الوقت نفسه الحفاظ على رمزه الأساسي، فإن تأثيره سيتجاوز بكثير إطار الوكالة.
هذه هي الموضوعات التي نأمل في استكشافها في الأشهر المقبلة.
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
الصراع على إطار وكيل AI: من الأفضل Eliza أم Rig أم Daydreams
المؤلف: شلوك خيماني، أوليفر جاروس المصدر: Decentralised.co الترجمة: شان أوبا، Golden Finance
المقالة اليوم تشرح إطار الوكالة، وتقييمنا لتطورها. كما أنها طلب لاقتراحات، موجه لرواد الأعمال العاملين في مجال تقاطع العملات الرقمية عبر الإنترنت (العملات المشفرة) والوكالة.
خلال العام الماضي، قام Decentralised.co بأبحاث عميقة في مجال التقاطع بين التشفير والذكاء الاصطناعي. حتى قمنا ببناء منتج يستخدمه أكثر من 70,000 شخص، لتتبع وكلاء الذكاء الاصطناعي وبنية الوكالة. على الرغم من أن الحماس حول هذا المجال قد تراجع في الأسابيع الأخيرة، إلا أن تأثير الذكاء الاصطناعي على التكنولوجيا والمجتمع هو شيء لم نراه منذ بداية الإنترنت. إذا كانت العملة المشفرة ستصبح المسار المالي للمستقبل، كما توقعنا، فإن تشابكها مع الذكاء الاصطناعي سيكون موضوعًا يتكرر مرارًا وتكرارًا، بدلاً من أن يكون مجرد مرة واحدة.
واحدة من فئات المشاريع الأكثر إثارة التي نشأت من هذه الموجة هي إطارات الذكاء الاصطناعي الأصلية للتشفير. إنها تجربة مثيرة تجلب مبادئ البلوكشين الأساسية - نقل القيمة غير المرخص به، والشفافية، والحوافز المتسقة - إلى تطوير الذكاء الاصطناعي. طبيعتها مفتوحة المصدر تمنحنا فرصة نادرة لاستكشاف كيفية عملها الداخلي، وليس فقط تحليل التزاماتها، ولكن أيضًا تحليل كيفية عملها الفعلي.
في هذه المقالة، نحن نحلل أولا معنى الأطر الوكيلية الفعلي وأهميتها. ثم نقوم بحل مشكلة واضحة: عندما تكون الخيارات الناضجة مثل LangChain موجودة، لماذا نحتاج إلى إطارات تشفير أصلية؟ لهذا، نحلل الأطر الأصلية المشفرة الرائدة ومزاياها وعيوبها في الحالات الاستخدامية المختلفة. وأخيرًا، إذا كنت تقوم ببناء وكيل ذكاء اصطناعي، سنساعدك في اتخاذ قرار بشأن الإطار الذي قد يكون مناسبًا لاحتياجاتك. أو عليك استخدام الإطار للبناء.
دعونا نتعمق في النقاش.
التجريد
تخيل كيف كان يعيش أسلافنا. كان علي كل أسرة زراعة غذائها الخاص، وصنع ملابسها الخاصة، وبناء منزلها الخاص. قضوا الكثير من الوقت في المهام الأساسية للبقاء على قيد الحياة، وكادوا لا يملكون الوقت لفعل أي شيء آخر. حتى قبل قرنين من الزمان، كانت نسبة تقارب 90 % من الناس يعملون في مجال الزراعة. اليوم، نشتري الطعام من السوبر ماركت، ونعيش في منازل بناها خبراء، ونرتدي ملابس تم إنتاجها في مصانع بعيدة. ما كانت مهمة كانت تتطلب جهود عدة أجيال أصبحت صفقة بسيطة. اليوم، يعمل فقط 27 % من سكان العالم في الزراعة (تنخفض إلى أقل من 5 % في البلدان المتقدمة).
عندما نبدأ في اكتساب تقنية جديدة، سيظهر نمط مألوف. نفهم أولا المبادئ الأساسية - ما هو فعال، ما هو غير فعال، وأي الأنماط تظهر بشكل متكرر. عندما تصبح هذه الأنماط واضحة، نقوم بتجميعها في تجربة أكثر سهولة وسرعة وموثوقية. هذه التجربة تحرر الوقت والموارد لمواجهة تحديات أكثر تنوعًا ومعنى. وهذا ينطبق أيضًا على بناء البرمجيات.
! cfpYG94rSxhzdHHC3T4K0tAk7UApcvUMQoqb5hCa.png
على سبيل المثال، دعنا نأخذ تطوير الويب. في البداية، كان على المطورين كتابة كل شيء من الصفر - مثل معالجة طلبات HTTP وإدارة الحالة وإنشاء واجهة المستخدم - هذه المهام معقدة وتستغرق وقتًا طويلاً. ثم ظهرت أطر مثل React التي بسهولة كبيرة تبسط هذه التحديات من خلال توفير مستويات تجريد مفيدة. اتبع تطوير التطبيقات المحمولة مسارًا مماثلاً. في البداية، كان على المطورين اكتساب معرفة عميقة محددة للمنصة، لكن ظهور أدوات مثل React Native و Flutter جعلهم قادرين على كتابة الكود مرة واحدة ونشره في أي مكان.
ظهرت أنماط مماثلة من التجريد في التعلم الآلي. في أوائل عام 2000 ، اكتشف الباحثون إمكانات وحدات معالجة الرسومات في أعباء عمل ML. في البداية ، كان على المطورين أن يتصارعوا مع بدائيات الرسومات واللغات مثل GLSL من OpenGL - وهي أدوات لم يتم تصميمها للحوسبة للأغراض العامة. تغير كل شيء في عام 2006 عندما قدمت NVIDIA CUDA ، مما جعل برمجة GPU أكثر سهولة وجلب تدريب ML إلى قاعدة مطورين أوسع.
مع تزايد زخم تطوير ML، ظهرت أطر متخصصة لتجريد تعقيد برمجة وحدة معالجة الرسومات. TensorFlow و PyTorch تتيح للمطورين التركيز على هيكل النموذج، بدلاً من الوقوع في الطين الناتج عن رموز وحدة معالجة الرسومات الأساسية أو التفاصيل النفذية. هذا يسرع من تكرار هياكل النماذج، بالإضافة إلى التقدم السريع الذي شهدناه في مجال الذكاء الاصطناعي/تعلم الآلة خلال السنوات القليلة الماضية.
نحن نشهد الآن تطورا مشابها لوكيل الذكاء الاصطناعي - وهو برنامج قادر على اتخاذ القرارات واتخاذ الإجراءات لتحقيق هدف ، تماما مثل المساعد البشري أو الموظف. يستخدم نموذجا لغويا كبيرا باعتباره "دماغه" ويمكنه استخدام أدوات مختلفة مثل البحث في الويب أو إجراء مكالمات API أو الوصول إلى قواعد البيانات لإنجاز المهام.
يجب على المطور كتابة رموز معقدة للتعامل مع كل جانب: كيف يفكر الوكيل، وكيف يقرر استخدام أي أدوات ومتى، وكيف يتفاعل مع هذه الأدوات، وكيف يتذكر سياق التفاعلات السابقة، وكيف يقسم المهام الكبيرة إلى خطوات قابلة للإدارة. يجب حل كل نمط على حدة، مما يؤدي إلى العمل المتكرر وعدم الاتساق في النتائج.
هنا هو حيث يبرز إطار الوكيل الذكي. تماما كما حدد React الجزء الصعب من إدارة تحديثات واجهة المستخدم والحالة لتبسيط تطوير الويب، هذه الأطر تحل التحديات الشائعة في بناء وكلاء الذكاء الاصطناعي. إنها توفر لنا مكونات جاهزة للاستخدام لأنماط فعالة وجدناها، مثل كيفية بناء عمليات اتخاذ القرار للوكيل ودمج أدوات مختلفة والحفاظ على السياق في عدة تفاعلات.
باستخدام الإطار، يمكن للمطورين التركيز على جعل وكالتهم فريدة من نوعها - وظائفها وسيناريوهاتها المحددة - بدلاً من إعادة بناء هذه المكونات الأساسية. يمكنهم إنشاء وكلاء ذكاء اصطناعي معقدة في أيام أو أسابيع بدلاً من أشهر، والتجربة بشكل أسهل بأساليب مختلفة، واقتباس أفضل الممارسات التي اكتشفها المطورون الآخرون والمجتمع.
لفهم أهمية الأطر بشكل أفضل، دعنا نأخذ في اعتبار مطور يبني وكيلًا يساعد الأطباء في مراجعة التقارير الطبية. إذا لم تكن هناك أطر، فسيكون عليهم كتابة جميع الشيفرة من الصفر: التعامل مع مرفقات البريد الإلكتروني، استخراج النص من ملفات PDF، إدخال النص بالتنسيق الصحيح إلى LLM، إدارة سجل المحادثات لتتبع المحتوى الذي تم مناقشته بالفعل، وضمان أن يقوم الوكيل بالرد بشكل مناسب. بالنسبة للمهام التي ليست فريدة من نوعها لحالتها الخاصة، هذه شفرة معقدة بشكل كبير.
باستخدام الإطار الوكالة، يمكن استخدام العديد من هذه البنى مباشرة. يتولى الإطار قراءة البريد الإلكتروني وملفات PDF، ويوفر نماذج لبناء تلميحات المعرفة الطبية، ويدير سير الحوار، ويساعد حتى في تتبع التفاصيل الهامة في عدة محادثات. يمكن للمطورين التركيز على جعل وكيلهم مميزًا، مثل ضبط تلميحات التحليل الطبي أو إضافة فحوصات أمان محددة للتشخيص، بدلاً من إعادة اختراع النماذج الشائعة. ما كان من الممكن سابقًا أن يحتاج عدة أشهر لبنائه من الصفر، يمكن الآن إكمال تصميم النموذج الأولي في غضون بضعة أيام.
أصبح LangChain سكينًا سويسريًا لتطوير الذكاء الاصطناعي، مما يوفر مجموعة أدوات مرنة لبناء تطبيقات قائمة على LLM. على الرغم من أنه ليس بالضبط إطار وكالة، إلا أنه يوفر العناصر الأساسية لبناء معظم أطر وكالة، بدءًا من سلسلة ترتيب استدعاءات LLM إلى نظام ذاكرة للحفاظ على السياق. يجعل نظام الإيكولوجية المتكامل والوثائق الغنية منه نقطة انطلاق مفضلة للمطورين الذين يرغبون في بناء تطبيقات عملية للذكاء الاصطناعي.
ثم هناك أطر ذكاء اصطناعي متعددة العوامل مثل CrewAI و AutoGen، التي تتيح للمطورين بناء أنظمة تعمل فيها عدة وكلاء ذكاء اصطناعي بتنسيق تعاوني، حيث لكل وكيل دور وقدرات فريدة. هذه الأطر لا تقوم بتنفيذ المهام بتسلسل بسيط، بل تؤكد على التعاون بين الوكلاء من خلال الحوار لحل المشاكل بشكل مشترك.
! SXYgyuC4qnpplO0idJXnSanSo3OXAp1TMMrHtspG.png
على سبيل المثال، عند توزيع تقرير بحث، قد يقوم وكيل بتوضيح هيكله، في حين قد يقوم وكيل آخر بجمع المعلومات ذات الصلة، وقد يقوم وكيل ثالث بالتعليق على المسودة النهائية وتحسينها. هذا يشبه تكوين فريق افتراضي، حيث يمكن لوكلاء الذكاء الاصطناعي مناقشة ومناقشة وتحسين الحلول معًا. وعادة ما يُشار إلى أنظمة الوكلاء المتعددة التي تعمل بشكل تعاوني بهذه الطريقة لتحقيق أهداف عالية المستوى على أنها "مجموعة" من الوكلاء الذكاء الاصطناعي.
على الرغم من أنه ليس إطارا تقليديا ، إلا أن AutoGPT كان رائدا في مفهوم وكلاء الذكاء الاصطناعي المستقلين. يوضح كيف يمكن الذكاء الاصطناعي اتخاذ هدف عالي المستوى ، وتقسيمه إلى مهام فرعية ، وإكماله بشكل مستقل مع الحد الأدنى من المدخلات البشرية. على الرغم من قيوده ، أثار AutoGPT موجة من الابتكار للوكلاء المستقلين وأثر على تصميم أطر أكثر تنظيما تلت ذلك.
ولكن لماذا التشفير؟
كل هذه الخلفيات تؤدي في النهاية إلى ظهور إطار الوكالة الذكية الأصلي للتشفير. في هذا الوقت، قد تتساءل، لماذا تحتاج Web3 إلى إطارها الخاص عندما لدينا إطارات ناضجة نسبيًا مثل Langchain و CrewAI في Web2؟ بالطبع، يمكن للمطورين استخدام هذه الأطر الحالية لبناء أي وكالة يرغبون فيها؟ وبمراعاة تفضيل هذه الصناعة لفرض Web3 على أي حكاية، فإن هذا الشك مبرر.
نعتقد أن وجود إطار وكيل محدد لـ Web3 يوجد به ثلاثة أسباب كافية.
وكيل مالي يعمل على السلسلة
نحن نعتقد أن معظم صفقات البنوك في المستقبل ستتم على سكة بلوكتشين. هذا يعزز الحاجة إلى نوع من الوكلاء الذكاء الاصطناعي، والذين يمكنهم تحليل البيانات على السلسلة، وتنفيذ صفقات بلوكتشين، وإدارة الأصول الرقمية عبر عدة بروتوكولات وشبكات. من الروبوتات التداول التلقائي التي يمكنها اكتشاف فرص التحكم، إلى مديري محافظ الاستثمار الذين ينفذون استراتيجيات العائد، يعتمد هؤلاء الوكلاء على تكامل عميق لوظائف بلوكتشين في عملياتهم الأساسية.
! UgKQjpORqg52fRAWEK0NlemKNxv7W03vfqHNYVkj.png
الأطر النموذجية للويب 2 التقليدية لا توفر مكونات أصلية لهذه المهام. يجب عليك تجميع مكتبة طرف ثالث للتفاعل مع العقود الذكية وتحليل الأحداث الأصلية على السلسلة ومعالجة إدارة المفتاح الخاصة - مما يقدم تعقيدًا وثغرات محتملة. بدلاً من ذلك، يمكن للأطر النموذجية للويب 3 المتخصصة التعامل مع هذه الوظائف بشكل جاهز، مما يسمح للمطورين بالتركيز على منطق واستراتيجيات وكلائهم، بدلاً من محاربة أنابيب سلسلة الكتل منخفضة المستوى.
التنسيق الأصلي والحوافز
Blockchain لا يتعلق فقط بالعملات الرقمية. وهي توفر نظاما عالميا للسجل مع أدوات مالية مدمجة لتعزيز التنسيق بين الوكلاء المتعددين. بدلا من الاعتماد على السمعة خارج السلسلة أو قواعد البيانات المنعزلة ، يمكن للمطورين استخدام الأوليات على السلسلة مثل التخزين والضمان ومجمعات الحوافز لتنسيق مصالح وكلاء الذكاء الاصطناعي المتعددين.
تخيل مجموعة من الوكلاء يتعاونون لإكمال مهمة معقدة (على سبيل المثال، وضع علامات على البيانات لتدريب نموذج جديد). يمكن تتبع أداء كل وكيل على السلسلة وتخصيص المكافآت تلقائيًا استنادًا إلى المساهمة. شفافية النظام القائم على تقنية سلسلة الكتل وثباته يسمحان بتوزيع الأجور بشكل عادل وتتبع سمعة أقوى وبرامج حوافز متطورة في الوقت الحقيقي.
يمكن تضمين هذه الوظائف بوضوح في البنية الأساسية للتشفير، مما يسمح للمطورين باستخدام عقود ذكية لتصميم هيكل تحفيزي، دون الحاجة إلى إعادة تصميم العجلة في كل مرة تحتاج فيها إلى الوكالة أو الدفع لوكالة أخرى.
الفرص الجديدة في السوق المبكرة
على الرغم من أن الأطر مثل LangChain لديها بالفعل مشاركة الأفكار وتأثير الشبكة، إلا أن مجال وكلاء الذكاء الاصطناعي لا يزال في مرحلة مبكرة. لا يزال غير واضح حاليا كيف سيبدو الحال النهائي لهذه الأنظمة، وليس هناك طريقة لقفل السوق.
فتح اقتصاد التشفير إمكانيات جديدة لبناء وإدارة وتحويل القيمة بواسطة التحفيز الاقتصادي، وهذه الإمكانيات لا يمكن تصويرها بشكل كامل في اقتصاديات SaaS أو Web2 التقليدية. يمكن أن تفتح التجارب في هذه المرحلة المبكرة استراتيجيات تحويل قيمة جديدة للإطار نفسه، بدلاً من بناء وكلاء على الإطار.
المنافسين
القياسية
لتقييم قوة كل إطار، نحن نقف من وجهة نظر مطوري الذكاء الاصطناعي الذين يرغبون في بناء وكلاء AI. ما الذي يهمهم؟ نعتقد أن تقسيم التقييم إلى ثلاث فئات رئيسية مفيد جدًا: الأساسيات والوظائف وتجربة المطور.
يمكنك اعتبار النواة الأساسية للإطار كبناء لجميع الوكلاء الآخرين. إذا كانت النواة ضعيفة أو بطيئة أو لا تتطور باستمرار، فسيكون استخدام الوكلاء الذي تم إنشاؤهم باستخدام هذا الإطار مقيدًا بنفس القيود. يمكن تقييم النواة وفقًا للمعايير التالية:
بالإضافة إلى وظائف النواة، يعتمد فعالية الإطار إلى حد كبير على وظائفه وتكامله. توسعت الأدوات بشكل كبير قدرات الوكيل الفعلية. يمكن للوكيل الذي لديه فقط صلاحيات الوصول إلى LLM المشاركة في المحادثات، لكن بمنحه صلاحية الوصول إلى متصفح الويب، يمكنه الحصول على المعلومات في الوقت الحقيقي. عند ربطه بواجهة برمجة تطبيقات التقويم الخاصة بك، يمكنه ترتيب الاجتماعات. كل أداة جديدة تزيد قدرات الوكيل بشكل مضاعف. من وجهة نظر مطوري البرمجيات، كلما زاد عدد الأدوات، زادت خياراتهم ونطاق تجاربهم.
نحن نقيم إطار العمل الأصلي للتشفير من ثلاثة جوانب:
في النهاية ، حتى أقوى الأطر يمكن أن تكون جيدة فقط مثل تجربة المطور. يمكن أن يتباهى إطار العمل بوظائف من الدرجة الأولى ، ولكن لن يتم اعتماده على نطاق واسع إذا كان من الصعب على المطورين استخدامه بفعالية.
النتيجة
يُلخص الجدول أداء كل إطار في المعايير التي حددناها للتو في الترتيب (التصنيف 1-5).
! QTbxg0nhpjbbKbgJdAE0VDDYvQN3qF5biJlLAxNq.png
على الرغم من أن مناقشة أسباب كل نقطة بيانات تتجاوز نطاق هذا المقال، إلا أن هناك بعض الانطباعات المميزة التي تركها كل إطار لنا.
Eliza هي أكثر الأطر نضوجًا في هذه القائمة حتى الآن. نظرًا لأن إطار Eliza أصبح نقطة تقديم الذكاء الاصطناعي للنظام البيئي للتشفير في الموجة الأخيرة من الوسطاء، فإن ميزة بارزة لها هي كمية الميزات والتكامل التي تدعمها.
! ZK8bWvOX185Ygh0O1vGd5JaLPrIjlTgHtKXkXlkm.png
نظرًا لشهرتها، يقوم كل سلسلة كتلية وأداة تطوير بدمج نفسها بسرعة في هذا الإطار (حاليًا لديها ما يقرب من 100 تكامل!). في الوقت نفسه، جذبت Eliza أنشطة تطويرية أكثر من معظم الأطر الأخرى. يستفيد Eliza على الأقل في المدى القصير من بعض آثار الشبكة الواضحة جدًا. يتم كتابة هذا الإطار بلغة TypeScript، وهي لغة ناضجة تستخدم من قبل كل من المبتدئين والمطورين ذوي الخبرة، مما يعزز بشكل أكبر تطوره.
Eliza تبرز أيضًا بسبب المحتوى التعليمي الغني والدروس التعليمية التي توفرها للمطورين لاستخدام هذا الإطار.
لقد رأينا بالفعل سلسلة من وكلاء Eliza Framework ، بما في ذلك Spore و Eliza (وكيل) و Pillzumi. من المتوقع أن يتم إصدار إصدار جديد من إطار عمل Eliza في الأسابيع القادمة.
طريقة Rig مختلفة تمامًا عن طريقة Eliza. إنها تبرز بنواة قوية وخفيفة الوزن وعالية الأداء. إنها تدعم مجموعة متنوعة من أوضاع الاستدلال، بما في ذلك سلاسل الاقتراحات (تطبيق تسلسلي للاقتراحات) والتنسيق (تنسيق عدة وكلاء) والمنطق الشرطي والتوازي (تنفيذ العمليات المتزامنة).
ومع ذلك، لا يوجد في حد ذاته Rig تكامل غني. بدلاً من ذلك، يتبع نهجًا مختلفًا، ويشير الفريق إلى ذلك بـ "Arc Handshake". هنا، يتعاون فريق Arc مع فرق عالية الجودة مختلفة في Web2 و Web3 لتوسيع وظائف Rig. تشمل بعض هذه التعاونات التعاون مع Soulgraph لتطوير وكالة الشخصية، والتعاون مع Listen و Solana Agent Kit لتطوير وظائف سلسلة الكتل.
ومع ذلك ، فإن Rig له عيبان. بادئ ذي بدء ، إنه مكتوب بلغة Rust ، وعلى الرغم من أنه شديد الأداء ، إلا أن عددا قليلا نسبيا من المطورين على دراية به. ثانيا ، لم نر سوى عدد محدود من الوكلاء الذين يعملون بالحفارات في تطبيقات العالم الحقيقي (باستثناء AskJimmy) ، مما يجعل من الصعب تقييم اعتماد المطور الحقيقي.
قبل بدء Daydreams، كان lordOfAFew مساهمًا رئيسيًا في إطار Eliza. هذا جعله يتعرف على نمو الإطار، والأهم من ذلك، التعرف على بعض النقاط السلبية. الاختلاف الرئيسي بين Daydreams والأطر الأخرى هو تركيزه على الاستدلال بسلسلة الأفكار للمساعدة في تحقيق الأهداف طويلة المدى. هذا يعني أنه عندما يتم تحديد هدف عالي المستوى ومعقد، سيقوم الوكيل بالتفكير في خطوات متعددة، واقتراح مجموعة متنوعة من الإجراءات، وقبولها أو رفضها استنادًا إلى ما إذا كانت ستساعد في تحقيق الهدف، ثم مواصلة هذه العملية لتحقيق التقدم. هذا يجعل الوكلاء الذين يتم إنشاؤهم باستخدام Daydreams حقًا مستقلين.
أثر خلفية المؤسس في بناء مشاريع الألعاب هذه الطريقة. الألعاب، وخاصة الألعاب على السلسلة، هي بيئة تدريبية مثالية لتدريب الوكلاء واختبار قدراتهم. ليس من المستغرب أن بعض الاستخدامات المبكرة لوكيل Daydreams كانت في ألعاب مثل Pistols، Istarai، وPonziLand.
هذا الإطار لديه أيضًا تنفيذ وتنسيق سير عمل قوي للوكلاء المتعددين.
مماثلة ل Daydreams ، Pippin هي أيضًا متأخرة في ألعاب الإطار. في هذه المقالة ، سنقدم تفاصيل عن إطلاقها. رؤية Yohei الأساسية هي جعل الوكالات تكون "وجودًا رقميًا" حيث يمكنها التشغيل بذكاء وبشكل مستقل عن طريق الوصول إلى الأدوات الصحيحة. تتجلى هذه الرؤية في النواة البسيطة والأنيقة لـ Pippin. مع بضعة أسطر من الشيفرة ، يمكنك إنشاء وكالة معقدة يمكنها العمل بشكل مستقل ، وحتى كتابة الشيفرة بنفسها.
! MAHfGrrIS2Xy6VWc4t47Sxn3wWWKjZDbLKoRAGAb.png
إن عيب هذا الإطار هو أنه حتى يفتقر إلى وظائف أساسية مثل تضمين النواة الدعمي وسير عمل RAG. كما أنه يشجع المطورين على استخدام معظم التكاملات من خلال مكتبة الطرف الثالث Composio. بالمقارنة مع الأطر الأخرى المناقشة حتى الآن، فإنه ليس ناضجًا على الإطلاق.
بعض وكلاء البناء مع باكون تشمل ديتو وتيليمافيا.
Zerepy لديها تنفيذ أساسي نسبيًا بسيط. إنها تختار مهمة واحدة من مجموعة المهام المكونة بشكل فعال وتنفذها عند الحاجة. ومع ذلك، فإنها تفتقر إلى نماذج استدلال معقدة مثل الدفع نحو الهدف أو التخطيط الذهني.
على الرغم من دعمه لاستدعاء العديد من LLM، إلا أنه يفتقر إلى أي تضمين أو تنفيذ RAG. كما يفتقر أيضًا إلى أي بنى جملية للذاكرة أو تنسيق للوكلاء المتعددين.
هذه الوظيفة الأساسية ونقص التكامل ينعكسان في اعتماد Zerepy. لم نرَ أي وكيل فعلي يستخدم هذا الإطار بعد.
! jfKrVvasyMpTHCKaLZGOL1iDN1UqQkngP4aTwhrw.png
استخدام الإطار للبناء
إذا كان كل هذا يبدو تقنيًا ونظريًا للغاية، فلن نلومك. السؤال الأبسط هو "هل يمكنني استخدام هذه الأطر الخاصة ببناء وكلاء ما دون الحاجة إلى كتابة العديد من الشفرات؟".
لتقييم هذه الأطر عمليا، حددنا خمسة أنواع شائعة من الوكلاء الذين يرغب المطورون غالبا في إنشائها. إنها تمثل مستويات مختلفة من التعقيد وتختبر جوانب مختلفة من وظائف كل إطار.
لقد قمنا بتقييم كل إطار بناء بدرجة تصل إلى 5 نقاط لكل نوع من أنواع الوكلاء. وإليك أداءها:
! texgEesLgKZk5FxG1Dv8uWFaehDt7zDrzfEzGeu1.png
العلامات المفتوحة
! O8m4ShXL3jqjBDkDuKi9liuV2S1kBT3x5oqoX8dd.png
عند تقييم هذه الأطر، يولي معظم التحليلات اهتمامًا كبيرًا لمؤشرات GitHub مثل النجوم والفورك. هنا، سنقدم لمحة سريعة عن ما هي هذه المؤشرات، وإلى أي حد تعكس جودة الأطر.
يعمل العلامات النجمية كإشارة واضحة لشعبية المشروع. في الأساس، فهي علامات مرجعية يضعها المطورون على المشاريع التي يجدونها مثيرة أو يرغبون في تتبعها. على الرغم من أن عدد النجوم العالي يدل على وعي واهتمام واسعين، إلا أنه قد يؤدي إلى الإيهام. في بعض الأحيان، قد تتراكم النجوم على المشروع نتيجة للتسويق بدلاً من القيمة التقنية. يجب اعتبار النجوم كدليل اجتماعي بدلاً من معيار قياس الجودة.
يخبرك عدد الفروكات عن عدد المطورين الذين قاموا بإنشاء نسخ لمستودعاتهم الخاصة لبناءها. عادة ما يشير المزيد من الفروكات إلى أن المطورين يستخدمون ويوسعون المشروع بنشاط. وبمعنى آخر، يتطلب الفهم السياقي الأصلي لعدد كبير من الفروكات أن يتم التخلي عنها في النهاية.
تكشف عدد المساهمين عن عدد المطورين المختلفين الذين قدموا فعليا الرموز إلى المشروع. غالبا ما يكون هذا أكثر مغزى من النجوم أو الفروع. يشير عدد المساهمين العاديين الصحيح إلى أن المشروع لديه مجتمع نشط يقوم بصيانته وتحسينه.
ذهبنا خطوة أبعد من ذلك وصممنا مؤشرنا الخاص - نقاط المساهمة. نحن نقيم التاريخ العام لكل مطور ، بما في ذلك مساهمتهم السابقة في مشاريع أخرى ، وتردد نشاطهم وشعبية حساباتهم ، ونخصص درجة لكل مساهم. ثم نقوم بمعدل مساهمي مشروع ما وفقًا للوزن المرتبط بكمية مساهماتهم.
ماذا تعني هذه الأرقام بالنسبة لإطارنا؟
في معظم الحالات ، يمكن تجاهل عدد النجوم. ليست لديهم معنى معتبر في السياق. الاستثناء هو Eliza ، التي كانت في وقت ما أول مستودع اتجاهي في جميع المشاريع على GitHub ، وهو ما يتفق مع كونها نقطة شيرلين لجميع الذكاء الاصطناعي المشفر. بالإضافة إلى ذلك ، فإن مطورين معروفين مثل 0xCygaar قد ساهموا في هذا المشروع. يتم انعكاس هذا أيضًا في عدد المساهمين - بجذبها لعشرة أضعاف مقارنة بالمشاريع الأخرى - جذب Eliza للمساهمين.
بالإضافة إلى ذلك، Daydreams مثير للاهتمام بالنسبة لنا فقط لأنه جذب مطورين عاليين المستوى. كمتأخر يتم إطلاقه بعد ذروة التسويق، لم يستفد من تأثير شبكة إليزا.
ما هو الخطوة التالية؟
إذا كنت مطورًا، نأمل أننا على الأقل قد قدمنا نقطة انطلاق لاختيار الإطار الذي ستبني عليه (إذا كنت بحاجة إليه). بالإضافة إلى ذلك، ستحتاج لاختبار بجدية مدى ملاءمة المنطق الأساسي والتكامل لكل إطار لحالتك الاستخدامية. هذا أمر لا مفر منه.
من وجهة نظر المراقب، من الأهم أن نتذكر أن جميع أطر وكلاء الذكاء الاصطناعي هذه ليست بعمر يتجاوز ثلاثة أشهر. (نعم، يبدو أنها أطول قليلاً.) خلال هذه الفترة، تحولت من التضخيم المفرط إلى ما يُعرف بـ "برج الهواء". هذه هي طبيعة التكنولوجيا. على الرغم من وجود هذه التقلبات، نحن نعتقد أن هذا المجال هو تجربة جديدة مثيرة ودائمة في مجال العملات المشفرة.
ما يهم بعد ذلك هو كيف تنضج هذه الأطر من حيث التكنولوجيا وتحقيق الدخل.
من الناحية التقنية، يمكن للأطر أن تخلق أكبر ميزة لنفسها من خلال جعل الوكلاء قادرين على التفاعل بسلاسة على السلسلة. وهذا هو السبب الرئيسي لاختيار المطورين الأطر الأصلية المشفرة بدلاً من الأطر العامة. بالإضافة إلى ذلك، فإن مشكلة الوكالات وبناء التكنولوجيا الوكالية هي مشكلة تقنية رائدة عالميًا، حيث يحدث كل يوم تطور جديد. يجب أن تستمر الأطر في التطور والتكيف مع هذه التطورات.
كيف يمكن للإطار أن يجعل النقود أمرًا أكثر إثارة. في هذه المرحلة الأولى، كان إنشاء منصة إطلاق مستوحاة من Virtuals أمرًا سهلًا للغاية. ولكننا نعتقد أن هناك الكثير من المساحة للتجارب هنا. نحن نتجه نحو مستقبل يضم ملايين الوكلاء، الذين يعملون بشكل خاص في مجموعة متنوعة من المجالات الفرعية التي يمكن تصورها. يمكن للأدوات التي تساعدهم على التنسيق بشكل فعال أن تستخلص قيمة هائلة من رسوم التداول. كبوابة للبناة، يعتبر الإطار بالطبع الأنسب لاستخلاص هذه القيمة.
في الوقت نفسه، تتنكر تحويل الإطار إلى عملة كمشكلة تحويل العملة في مشروع مفتوح المصدر ومكافأة المساهمين، حيث خلق هؤلاء المساهمون دائمًا بدون مقابل وبجهد كبير. إذا كان فريق قادرًا على كسر كيفية إنشاء اقتصاد مفتوح المصدر مستدام، وفي الوقت نفسه الحفاظ على رمزه الأساسي، فإن تأثيره سيتجاوز بكثير إطار الوكالة.
هذه هي الموضوعات التي نأمل في استكشافها في الأشهر المقبلة.