Lutte de cadres d'agents IA : Eliza, Rig, Daydreams qui l'emporte ?

Question

Auteurs: Shlok Khemani, Oliver Jaros Source: Decentralised.co Traduction: Shanooba, Jinse Finance

L'article d'aujourd'hui est une explication du cadre des mandataires et de notre évaluation de leur niveau de développement. Il s'agit également d'une demande de propositions visant les fondateurs travaillant dans le domaine croisé des devises Internet (cryptographiques) et des mandataires.

Au cours de la dernière année, Decentralised.co a mené une étude approfondie sur le croisement entre la cryptographie et l'intelligence artificielle. Nous avons même développé un produit utilisé par plus de 70 000 personnes pour suivre les agents et l'infrastructure d'IA. Bien que l'engouement autour de ce domaine se soit récemment estompé, l'impact de l'intelligence artificielle sur la technologie et la société est sans précédent depuis l'avènement d'Internet. Si la crypto-monnaie devait devenir la voie financière de l'avenir, comme nous le prévoyons, son entrelacement avec l'intelligence artificielle sera un thème récurrent plutôt qu'occasionnel.

L'une des catégories de projets les plus intéressantes émergent de cette vague est le cadre d'agents d'intelligence artificielle natifs de la cryptographie. Ils constituent une expérience fascinante qui intègre les principes fondamentaux de la blockchain - transfert de valeur sans permission, transparence et incitations cohérentes - dans le développement de l'intelligence artificielle. Leur nature open source nous offre une opportunité rare d'explorer leur fonctionnement interne, non seulement d'analyser leurs promesses, mais aussi de comprendre leur mode de fonctionnement réel.

Dans cet article, nous analysons d'abord le sens réel des cadres d'agents et leur importance. Ensuite, nous abordons un problème évident : pourquoi avons-nous besoin de cadres cryptographiques lorsque des options matures telles que LangChain existent ? À cette fin, nous analysons les principaux cadres cryptographiques et leurs avantages et limites dans différents cas d'utilisation. Enfin, si vous construisez un agent d'intelligence artificielle, nous vous aiderons à décider quel cadre pourrait répondre à vos besoins, ou si vous devriez même utiliser un cadre pour la construction.

Approfondissons cette question.

Abstrait

"Le progrès de la civilisation réside dans l'extension du nombre d'opérations importantes que nous pouvons effectuer sans réfléchir." - Alfred North Whitehead

Pensez à la façon dont vivaient nos ancêtres. Chaque famille devait cultiver sa propre nourriture, fabriquer ses propres vêtements, construire son propre logement. Ils passaient d'innombrables heures sur des tâches de survie de base, ayant à peine le temps pour autre chose. Même il y a deux siècles, près de 90% des gens travaillaient dans le secteur agricole. Aujourd'hui, nous achetons de la nourriture au supermarché, vivons dans des maisons construites par des experts, et portons des vêtements fabriqués dans des usines lointaines. Ce qui était autrefois une tâche qui demandait des efforts de plusieurs générations est devenu un simple échange. Aujourd'hui, seuls 27% de la population mondiale travaillent dans l'agriculture (moins de 5% dans les pays développés).

Lorsque nous commençons à maîtrise une nouvelle technologie, des modèles familiers apparaissent. Nous commençons par comprendre les principes de base - ce qui est efficace, ce qui ne l'est pas, et quels modèles se répètent. Une fois ces modèles devenus clairs, nous les emballons dans des abstractions plus simples, plus rapides et plus fiables. Ces abstractions libèrent du temps et des ressources pour faire face à des défis plus diversifiés et significatifs. Il en va de même pour le développement de logiciels.

Prenons le développement Web comme exemple. Au début, les développeurs devaient écrire tout, de la gestion des requêtes HTTP à la gestion de l'état et à la création de l'interface utilisateur. Ces tâches étaient à la fois complexes et chronophages. Ensuite, des frameworks comme React ont simplifié considérablement ces défis en fournissant des abstractions utiles. Le développement mobile a suivi un chemin similaire. Initialement, les développeurs devaient acquérir une connaissance approfondie et spécifique à la plateforme, jusqu'à l'arrivée d'outils comme React Native et Flutter, qui leur ont permis d'écrire du code une fois et de le déployer n'importe où.

Dans l'apprentissage automatique, des schémas d'abstraction similaires sont apparus. Au début des années 2000, les chercheurs ont découvert le potentiel des GPU dans les charges de travail de l'apprentissage automatique. Initialement, les développeurs devaient lutter avec des primitives graphiques et des langages tels que GLSL, similaire à OpenGL, qui n'étaient pas conçus pour le calcul général. En 2006, Nvidia a lancé CUDA, rendant la programmation GPU plus accessible et apportant la formation en apprentissage automatique à un public de développeurs plus large, tout a changé.

Avec la montée en puissance du développement de l'apprentissage automatique, des frameworks spécialisés sont apparus pour abstraire la complexité de la programmation GPU. TensorFlow et PyTorch permettent aux développeurs de se concentrer sur l'architecture du modèle plutôt que de s'enliser dans le code GPU de bas niveau ou dans les détails de mise en œuvre. Cela accélère l'itération de l'architecture du modèle et la rapide progression de l'IA/ML que nous avons observée ces dernières années.

Maintenant, nous voyons également une évolution similaire avec les agents d'intelligence artificielle - un programme logiciel capable de prendre des décisions et d'agir pour atteindre des objectifs, tout comme un assistant ou un employé humain. Il utilise un modèle de langage de grande envergure comme son "cerveau" et peut utiliser divers outils tels que la recherche sur le web, les appels d'API ou l'accès aux bases de données pour accomplir des tâches.

Pour construire un agent à partir de zéro, un développeur doit écrire un code complexe pour gérer chaque aspect : comment l'agent doit réfléchir, décider de quels outils utiliser et quand, interagir avec ces outils, se souvenir du contexte des interactions précédentes, et décomposer une tâche complexe en étapes gérables. Chaque modèle doit être abordé individuellement, ce qui entraîne un travail répétitif et des résultats incohérents.

C'est là que réside l'intérêt du cadre d'agent d'intelligence artificielle. Tout comme React simplifie le développement Web en traitant les parties délicates de la mise à jour de l'interface utilisateur et de la gestion de l'état, ces cadres résolvent les défis courants de la construction d'agents d'intelligence artificielle. Ils fournissent des composants prêts à l'emploi pour les modèles efficaces que nous découvrons, tels que la construction du processus de décision de l'agent, l'intégration de différents outils et le maintien du contexte dans plusieurs interactions.

Avec des frameworks, les développeurs peuvent se concentrer sur ce qui rend leur agent unique - ses fonctionnalités spécifiques et ses cas d'utilisation - au lieu de reconstruire ces composants de base. Ils peuvent créer des agents d'intelligence artificielle complexes en quelques jours ou semaines au lieu de plusieurs mois, expérimenter plus facilement différentes approches, et s'inspirer des meilleures pratiques découvertes par d'autres développeurs et communautés.

Pour mieux comprendre l'importance du cadre, envisagez un développeur qui construit une agence pour aider les médecins à examiner les rapports médicaux. Sans cadre, ils devraient écrire tout le code à partir de zéro : traiter les pièces jointes d'e-mails, extraire du texte des PDF, entrer correctement le texte dans LLM, gérer l'historique des conversations pour suivre les contenus déjà discutés, et s'assurer que l'agence réponde correctement. Pour des tâches qui ne sont pas spécifiques à leur cas d'utilisation, il s'agit d'une quantité importante de code complexe.

Avec un cadre d'agent, de nombreux de ces blocs de construction peuvent être utilisés directement. Le cadre gère la lecture des e-mails et des PDF, fournit des modèles pour les suggestions de connaissances médicales, gère les flux de conversation et aide même à suivre les détails importants de plusieurs échanges. Les développeurs peuvent se concentrer sur rendre leur agent unique, comme affiner les suggestions d'analyse médicale ou ajouter des contrôles de sécurité spécifiques au diagnostic, au lieu de réinventer des modèles communs. Ce qui aurait initialement pris des mois pour construire à partir de zéro peut maintenant être prototypé en quelques jours.

LangChain est devenu le couteau suisse du développement de l'intelligence artificielle, offrant un ensemble d'outils flexibles pour construire des applications basées sur LLM. Bien qu'il ne soit pas strictement un framework d'agent, il fournit les blocs de construction de base pour la plupart des frameworks d'agent, allant de la chaîne utilisée pour classer les appels LLM au système de mémoire utilisé pour maintenir le contexte. Son vaste écosystème d'intégration et sa documentation riche en font le point de départ privilégié des développeurs souhaitant construire des applications pratiques d'intelligence artificielle.

Ensuite, il y a des cadres multi-agents tels que CrewAI et AutoGen, qui permettent aux développeurs de construire des systèmes dans lesquels plusieurs agents IA travaillent en collaboration, chaque agent ayant son rôle et ses capacités uniques. Ces cadres ne se contentent pas d'exécuter des tâches séquentiellement, mais mettent l'accent sur la collaboration des agents intelligents par le biais de dialogues pour résoudre collectivement les problèmes.

Par exemple, lors de la distribution d'un rapport de recherche, un agent peut résumer sa structure, un autre agent peut recueillir des informations pertinentes, un troisième agent peut commenter et améliorer le projet final. Cela ressemble à la création d'une équipe virtuelle où les agents d'intelligence artificielle peuvent discuter, débattre et améliorer ensemble les solutions. Ce type de travail collaboratif pour atteindre des objectifs de haut niveau dans les systèmes multi-agents est généralement appelé un "cluster" d'agents d'intelligence artificielle.

Bien que AutoGPT ne soit pas un cadre traditionnel, il a introduit le concept d'agents d'intelligence artificielle autonomes. Il montre comment l'intelligence artificielle peut accepter un objectif de haut niveau, le décomposer en sous-tâches et le réaliser de manière autonome avec très peu d'entrées humaines. Malgré ses limites, AutoGPT a déclenché une vague d'innovation en matière d'agents autonomes et a influencé la conception de cadres plus structurés qui ont suivi.

Mais pourquoi le cryptage ?

Tout ce contexte nous amène finalement à l'émergence du cadre d'agents d'intelligence artificielle natives de la cryptographie. À ce stade, vous pourriez vous demander pourquoi Web3 a encore besoin de son propre cadre, alors que nous avons des cadres relativement matures comme Langchain et CrewAI dans Web2? Bien sûr, les développeurs peuvent utiliser ces cadres existants pour construire n'importe quel agent qu'ils veulent? Avec l'industrie ayant tendance à imposer Web3 à tous les récits, ce doute est raisonnable.

À notre avis, il y a trois bonnes raisons à l’existence de frameworks proxy spécifiques au Web3.

Agent financier fonctionnant sur la chaîne

Nous croyons que la plupart des transactions financières futures se dérouleront sur la voie de la blockchain. Cela accélère la demande pour un type d'agents d'intelligence artificielle qui peuvent analyser les données de la chaîne, exécuter des transactions blockchain et gérer des actifs numériques à travers plusieurs protocoles et réseaux. Des robots de trading automatisés capables de détecter des opportunités d'arbitrage aux gestionnaires de portefeuille mettant en œuvre des stratégies de rendement, ces agents dépendent tous de l'intégration profonde des fonctionnalités de la blockchain dans leurs processus métier essentiels.

Les frameworks Web2 traditionnels ne fournissent pas de composants natifs pour ces tâches. Vous devez bricoler des bibliothèques tierces pour interagir avec les contrats intelligents, analyser les événements bruts on-chain et gérer les clés privées - introduisant ainsi de la complexité et des vulnérabilités potentielles. En revanche, les frameworks Web3 dédiés peuvent gérer ces fonctionnalités prêtes à l'emploi, permettant aux développeurs de se concentrer sur la logique et la stratégie de leurs agents plutôt que de lutter avec des pipelines blockchain de bas niveau.

Coopération et incitation natives

La blockchain ne concerne pas seulement les cryptomonnaies. Elle fournit un système d'enregistrement mondial et minimaliste en termes de confiance, et des outils financiers intégrés peuvent renforcer la coordination entre plusieurs agents. Les développeurs peuvent utiliser des primitives on-chain (telles que le staking, la garde et les pools d'incitation) pour coordonner les intérêts de plusieurs agents d'IA, sans dépendre de la réputation hors chaîne ou des bases de données isolées.

Imagine a group of agents collaborating to complete a complex task (e.g., data labeling for training a new model). The performance of each agent can be tracked on the chain, and rewards can be automatically allocated based on their contributions. The transparency and immutability of blockchain-based systems allow for fair compensation, stronger reputation tracking, and real-time evolving incentive schemes.

Le cadre natif de la cryptographie peut incorporer clairement ces fonctionnalités, permettant aux développeurs de concevoir une structure incitative avec des contrats intelligents sans avoir à redessiner la roue à chaque fois qu'ils ont besoin de faire confiance à un proxy ou de payer un autre proxy.

Nouvelles opportunités sur le marché précoce

Bien que des cadres tels que LangChain aient déjà des partages de pensée et des effets de réseau, le domaine des agents d'intelligence artificielle en est encore à ses débuts. Il n'est pas encore clair à quoi ressemblera l'état final de ces systèmes, et il n'existe aucun moyen de verrouiller le marché.

L'économie cryptographique a ouvert de nouvelles possibilités pour la construction, la gestion et la monétisation basées sur des incitations, ces possibilités ne peuvent pas être entièrement reflétées dans l'économie traditionnelle de SaaS ou Web2. Ces expériences précoces peuvent débloquer de nouvelles stratégies de monétisation pour le cadre lui-même, et non seulement pour les agents construits sur le cadre.

Concurrents

ElizaOS est associé à des projets populaires AI16Z et est un framework basé sur Typescript pour créer, déployer et gérer des agents d'IA. Il est conçu comme un système d'exploitation AI amical pour Web3, permettant aux développeurs de construire des agents ayant une personnalité unique, des outils flexibles pour l'interaction avec la blockchain, et une extensibilité facile à travers des systèmes multi-agents.
Rig est un framework d’agent d’IA open source développé par Playgrounds Analytics Inc., construit à l’aide du langage de programmation Rust pour créer des agents d’IA modulaires et évolutifs. Il est associé au projet AI Rig Complex (ARC).
Daydreams est un framework de proxy génératif qui a été créé à l’origine pour créer des proxys autonomes pour les jeux on-chain, mais qui s’est depuis étendu pour effectuer des tâches on-chain.
Pippin est un cadre d'agent d'IA développé par Yohei Nakajima, fondateur de BabyAGI, dans le but d'aider les développeurs à créer des assistants numériques modulaires et autonomes. Yohei a d'abord construit un agent autonome, puis l'a étendu pour en faire un cadre général.
ZerePy est un cadre Python open source conçu pour le déploiement d'agents autonomes sur plusieurs plateformes et chaînes de blocs, mettant l'accent sur l'intégration de l'IA créative et des médias sociaux. Tout comme Pippin, ZerePy était initialement l'agent autonome indépendant Zerebro, qui a ensuite été étendu pour devenir un cadre.

Normes ###

Pour évaluer la force de chaque cadre, nous nous mettons à la place des développeurs qui veulent construire des agents d'IA. Qu'est-ce qui les préoccupe ? Nous pensons qu'il est utile de diviser l'évaluation en trois catégories principales : noyau, fonctionnalité et expérience des développeurs.

Vous pouvez considérer le cœur du framework comme la base de construction de tous les autres agents. Si le cœur est faible, lent ou ne se développe pas continuellement, les agents créés avec ce framework seront soumis aux mêmes limitations. Vous pouvez évaluer le cœur selon les critères suivants :

Boucle de raisonnement centrale : Le cerveau de tout cadre d'agent ; comment il résout les problèmes. Un cadre puissant prend en charge tout, des flux d'entrée/sortie de base aux schémas complexes de chaînes de pensée. Sans une capacité de raisonnement puissante, l'agent ne peut pas décomposer efficacement des tâches complexes ou évaluer plusieurs options pour les simplifier en de simples bots de discussion.
Mécanisme de mémoire : Les agents ont besoin à la fois d'une mémoire à court terme pour mener des dialogues continus et d'un stockage à long terme pour acquérir des connaissances durables. Un bon cadre ne se contente pas de mémoriser - il comprend les relations entre les différentes informations et peut prioriser quelles informations valent la peine d'être conservées et lesquelles méritent d'être oubliées.
Intégration et prise en charge RAG : Les agents modernes doivent utiliser des connaissances externes telles que des documents et des données de marché. Un framework puissant peut facilement intégrer ces informations et les récupérer via RAG en fonction du contexte, permettant ainsi de construire des réponses sur la base de connaissances spécifiques plutôt que de simplement s'appuyer sur l'entraînement du modèle de base.
Configuration personnalisée : La capacité à façonner le mode de communication (ton, politesse et personnalité) des agents de service client est essentielle pour l'engagement des utilisateurs. Un bon cadre peut facilement configurer ces caractéristiques, en reconnaissant que la personnalité des agents de service client influencera considérablement la confiance des utilisateurs.
Coordination multi-agents : un cadre robuste fournit des modèles intégrés pour la collaboration des agents, que ce soit par le biais de conversations structurées, de la délégation de tâches ou d’un système de mémoire partagée. Cela crée une équipe de professionnels, chaque agent exerçant sa capacité unique à travailler ensemble pour résoudre les problèmes.

En plus de la fonctionnalité de base, l’utilité réelle d’un framework est largement déterminée par sa fonctionnalité et son intégration. L’outil étend considérablement les capacités réelles de l’agent. Seuls les agents disposant d’un accès LLM peuvent participer aux conversations, mais en leur accordant l’accès à un navigateur Web, il peut récupérer des informations en temps réel. Connectez-le à votre API de calendrier et il est prêt à planifier des réunions. Chaque nouvel outil augmente la puissance du proxy de manière exponentielle. Du point de vue d’un développeur, plus le nombre d’outils est élevé, plus l’option et la marge d’expérimentation sont grandes.

Nous évaluons les fonctionnalités du cadre natif de cryptage selon trois dimensions :

Support et fonctionnalités des modèles d'IA : Le puissant cadre offre une intégration native avec plusieurs modèles linguistiques, allant de la série GPT d'OpenAI aux solutions de rechange open source telles que Llama et Mistral. Mais il ne s'agit pas seulement de LLM. Le support des autres fonctionnalités d'IA, telles que la conversion texte-voix, l'utilisation du navigateur, la génération d'images et l'inférence de modèles locaux, peut considérablement étendre les fonctionnalités de l'agent. Un support de modèle puissant devient un must pour de nombreux cadres de ce type.
Support de l'infrastructure de base de Web3 : La construction d'un agent cryptographique nécessite une intégration profonde avec l'infrastructure de base de la blockchain. Cela signifie soutenir les composants Web3 nécessaires, tels que des portefeuilles pour la signature des transactions, des RPC pour la communication de la chaîne et des indexeurs pour l'accès aux données. Un cadre puissant devrait s'intégrer aux outils et services de base de tout l'écosystème, des marchés NFT et des protocoles DeFi aux solutions d'identité et aux couches de disponibilité des données.
Couverture de la chaîne : L'infrastructure de base de Web3 détermine ce que les agents peuvent faire, tandis que la couverture de la chaîne détermine où ils peuvent le faire. L'écosystème crypté évolue vers un monstre multichaîne décentralisé, soulignant l'importance d'une couverture de chaîne étendue.

Enfin, même le cadre le plus puissant ne peut être aussi bon que l'expérience des développeurs. Un cadre peut avoir des fonctionnalités de premier ordre, mais s'il est difficile pour les développeurs de l'utiliser efficacement, il ne sera jamais largement adopté.

Le langage utilisé dans le cadre affecte directement qui peut l'utiliser pour la construction. Python domine naturellement le domaine de l'intelligence artificielle et de la science des données, et est donc naturellement choisi comme langage pour les cadres d'intelligence artificielle. Les cadres écrits dans des langages de niche peuvent avoir des avantages uniques, mais peuvent également les isoler de l'écosystème de développement plus large. La prévalence de JavaScript dans le développement Web en fait un concurrent puissant, en particulier pour les cadres intégrés au Web.
Des documents clairs et complets sont la ligne de vie des développeurs adoptant de nouveaux frameworks. Ce n'est pas seulement une référence API, bien que ceux-ci soient également cruciaux. Des documents solides comprennent un aperçu conceptuel expliquant les principes fondamentaux, des tutoriels étape par étape, des exemples de code bien commentés, des guides pédagogiques, des guides de dépannage et des modèles de conception établis.

Résultat

Le tableau ci-dessous résume les performances de chaque framework dans les paramètres que nous venons de définir (classement de 1 à 5).

Bien que discuter des raisons derrière chaque point de données soit au-delà de la portée de cet article, voici quelques impressions saillantes laissées par chaque cadre.

Eliza est le framework le plus abouti de cette liste à ce jour. Compte tenu de la position d'Eliza comme point de contact de l'intelligence artificielle avec l'écosystème cryptographique dans la récente vague de délégués, l'un de ses points forts est la grande quantité de fonctionnalités et d'intégrations prises en charge.

En raison de la popularité qu’elle génère, chaque blockchain et outil de développement se démène pour s’intégrer dans le framework (actuellement, il compte près de 100 intégrations !). ）。 Dans le même temps, Eliza attire plus d’activité de développeurs que la plupart des frameworks. Eliza bénéficie d’effets de réseau très clairs, du moins à court terme. Le framework est écrit en TypeScript, un langage mature qui est utilisé à la fois par les débutants et les développeurs expérimentés, ce qui stimule encore son développement.

Eliza a également excellé en raison du contenu éducatif et des tutoriels riches qu'elle offre aux développeurs pour utiliser ce framework.

Nous avons déjà vu une série d'agents utilisant le framework Eliza, y compris Spore, Eliza (agent) et Pillzumi. La nouvelle version du framework Eliza devrait être publiée dans les semaines à venir.

La méthode de Rig est fondamentalement différente de celle d'Eliza. Elle se distingue par son noyau puissant, léger et performant. Elle prend en charge divers modes de raisonnement, y compris les chaînes de prompts (application séquentielle de prompts), l'orchestration (coordination de plusieurs agents), la logique conditionnelle et la parallélisme (exécution d'opérations simultanées).

Cependant, Rig lui-même n'a pas une intégration aussi riche. Au contraire, il adopte une approche différente, que l'équipe appelle "Poignée d'Arc". Ici, l'équipe d'Arc collabore avec des équipes de haute qualité de Web2 et Web3 pour étendre les fonctionnalités de Rig. Certaines de ces collaborations comprennent le développement d'agents personnalisés avec Soulgraph, ainsi que le développement de fonctionnalités de blockchain avec Listen et Solana Agent Kit.

Cependant, Rig a deux inconvénients. Tout d'abord, il est écrit en Rust, ce qui lui confère d'excellentes performances, mais il est moins connu des développeurs. Deuxièmement, nous n'avons vu qu'un nombre limité de proxies pilotés par Rig dans des applications réelles (AskJimmy étant une exception), ce qui rend difficile l'évaluation de l'adoption réelle par les développeurs.

Avant de commencer Daydreams, le fondateur lordOfAFew était le principal contributeur du cadre Eliza. Cela lui a permis de découvrir la croissance de ce cadre, mais plus important encore, de découvrir certains de ses défauts. Ce qui distingue Daydreams des autres cadres, c'est qu'il se concentre sur le raisonnement en chaîne pour aider les agents à atteindre des objectifs à long terme. Cela signifie que lorsqu'un objectif élevé et complexe est donné, l'agent effectue un raisonnement en plusieurs étapes, propose diverses actions, les accepte ou les rejette en fonction de leur contribution à la réalisation de l'objectif, et poursuit ce processus pour progresser. Cela rend les agents créés avec Daydreams réellement autonomes.

L'expérience des fondateurs dans la construction de projets de jeux a influencé cette approche. Les jeux, en particulier les jeux en ligne, sont un terrain d'entraînement idéal pour former des agents et tester leurs capacités. Il n'est donc pas surprenant que certains des premiers cas d'utilisation de l'agent Daydreams aient eu lieu dans des jeux tels que Pistols, Istarai et PonziLand.

Ce cadre dispose également d'une puissante collaboration multi-agent et de la mise en œuvre de flux de travail d'orchestration.

Comme Daydreams, Pippin est également un nouvel arrivant dans le monde des jeux de cadre. Dans cet article, nous détaillons sa sortie. La vision de Yohei est de faire de l'agent un "être numérique" qui peut fonctionner de manière intelligente et autonome en accédant aux bons outils. Cette vision se reflète dans le noyau simple et élégant de Pippin. En quelques lignes de code seulement, vous pouvez créer un agent complexe qui peut fonctionner de manière autonome, voire écrire son propre code.

L’inconvénient de ce framework est qu’il lui manque même des fonctionnalités de base telles que l’intégration de vecteurs de support et les flux de travail RAG. Il encourage également les développeurs à utiliser Composio, une bibliothèque tierce, pour la plupart des intégrations. Comparé aux autres cadres discutés jusqu’à présent, il n’est tout simplement pas assez mature.

Certains des agents construits avec Pippin incluent Ditto et Telemafia.

Zerepy a une implémentation de base relativement simple. Il choisit efficacement une tâche parmi un ensemble de tâches configurées et l'exécute au besoin. Cependant, il lui manque des modèles de raisonnement complexes tels que la conduite par objectif ou la planification en chaîne de pensée.

Bien qu'il prenne en charge l'appel de raisonnement pour plusieurs LLM, il manque toute implémentation de l'encastrement ou RAG. Il manque également tout langage primitif pour la mémoire ou la coordination multi-agents.

Cette absence de fonctionnalités clés et d'intégration se reflète dans l'adoption de Zerepy. Nous n'avons pas encore vu d'agents réels utilisant ce framework.

Construire avec des frameworks

Si tout cela semble très technique et théorique, nous ne vous en voudrons pas. Une question plus simple serait : "Que puis-je construire avec ces cadres sans avoir à écrire beaucoup de code moi-même ?".

Pour évaluer ces cadres en pratique, nous avons identifié cinq types d'agents couramment souhaités par les développeurs. Ils représentent différentes complexités et testent différents aspects des fonctionnalités de chaque cadre.

Agent Document Chat : testez les fonctionnalités de base de RAG, y compris la gestion des documents, la maintenance du contexte, la précision du référencement et la gestion de la mémoire. Ce test révèle la capacité du framework à naviguer entre une véritable compréhension des documents et une simple correspondance de modèles.
Chatbot : évaluer la cohérence de la mémoire et du comportement. Ce cadre doit maintenir des caractéristiques de personnalité cohérentes, se souvenir des informations clés de la conversation et permettre une configuration personnalisée, transformant essentiellement un chatbot sans état en une entité numérique persistante.
Robot de trading on-chain : en traitant les données du marché en temps réel, en effectuant des transactions inter-chaînes, en analysant le sentiment social et en mettant en œuvre des stratégies de trading pour tester l'intégration externe. Cela révèle comment le framework gère l'infrastructure complexe de la blockchain et les connexions API.
NPC de jeu : Alors que le monde ne commence à s'intéresser aux agents que depuis un an, les agents ont joué un rôle crucial en tant que personnages non-joueurs (NPC) dans les jeux depuis des décennies. Les agents de jeu passent d'agents basés sur des règles à des agents intelligents pilotés par LLM, restant ainsi l'un des principaux cas d'utilisation du cadre. Ici, nous testons la capacité des agents à comprendre l'environnement, à raisonner de manière autonome sur les scénarios et à atteindre des objectifs à long terme.
Assistant vocal : évaluant le traitement en temps réel et l'expérience utilisateur à travers le traitement vocal, le temps de réponse rapide et l'intégration de la plateforme de messagerie. Cela teste si le framework peut prendre en charge des applications vraiment interactives, plutôt que simplement le mode requête-réponse.

Nous avons attribué une note maximale de 5 points à chaque cadre pour chaque type d'agent. Voici leurs performances :

Indicateurs ouverts

! [O8m4ShXL3jqjBDkDuKi9liuV2S1kBT3x5oqoX8dd.png](https ://img.gateio.im/social/moments-b412f7ac9ccf45873411048333e8b850 « 7350972")

Lors de l'évaluation de ces cadres, la plupart des analyses accordent une grande importance aux indicateurs GitHub tels que les étoiles et les forks. Ici, nous allons rapidement présenter ce que sont ces indicateurs et dans quelle mesure ils reflètent la qualité du cadre.

Les favoris servent de signal le plus évident de popularité. Ils sont essentiellement des signets que les développeurs attribuent aux projets qu'ils trouvent intéressants ou qu'ils veulent suivre. Bien qu'un nombre élevé de favoris indique une large reconnaissance et un intérêt, cela peut parfois être trompeur. Les projets peuvent parfois accumuler des favoris grâce au marketing plutôt qu'à une valeur technique. Considérez les favoris comme une preuve sociale plutôt que comme une mesure de qualité.

Le nombre de forks vous indique combien de développeurs ont créé leurs propres copies de la base de code sur lesquelles s’appuyer. Un plus grand nombre de forks est généralement un signe que les développeurs utilisent et étendent activement le projet. C’est-à-dire que de nombreux forks sont finalement abandonnés, de sorte que le nombre initial de forks nécessite un contexte.

Le nombre de contributeurs révèle combien de développeurs différents ont réellement soumis du code au projet. Cela est généralement plus significatif que les étoiles ou les forks. Un nombre sain de contributeurs réguliers indique qu'un projet a une communauté active pour le maintenir et l'améliorer.

Nous sommes allés encore plus loin et avons conçu notre propre indicateur, le score des contributeurs. Nous évaluons l’historique public de chaque développeur, y compris ses contributions passées à d’autres projets, la fréquence d’activité et la popularité de son compte, en attribuant un score à chaque contributeur. Nous faisons ensuite la moyenne de tous les contributeurs à un projet et les pondérons en fonction du nombre de contributions qu’ils apportent.

Que signifient ces chiffres pour notre cadre ?

Dans la plupart des cas, le nombre d'étoiles peut être négligé. Ils ne sont pas un indicateur significatif de l'adoption. L'exception ici est Eliza, qui est devenue un référentiel de tendances n ° 1 sur GitHub, ce qui correspond à son statut de référence pour l'intelligence artificielle cryptée. De plus, des développeurs renommés tels que 0xCygaar ont également contribué au projet. Cela se reflète également dans le nombre de contributeurs - Eliza a attiré 10 fois plus de contributeurs que d'autres projets.

En plus de cela, Daydreams nous intéresse simplement parce qu’il attire des développeurs de grande qualité. En tant que retardataire à se lancer après le pic de battage médiatique, il n’a pas bénéficié des effets de réseau d’Eliza.

Quelle est la prochaine étape ? **

Si vous êtes un développeur, nous espérons avoir au moins fourni un point de départ pour vous aider à choisir le cadre dans lequel vous souhaitez construire (si vous en avez besoin). Cependant, vous devrez toujours vous efforcer de tester si le raisonnement et l'intégration de chaque cadre correspondent à votre cas d'utilisation. Cela est inévitable.

Du point de vue de l'observateur, il est important de se rappeler que tous ces cadres d'agents d'intelligence artificielle n'ont pas encore trois mois. (Oui, ça semble plus long.) Pendant cette période, ils sont passés d'une extrême agitation à ce qu'on appelle "châteaux en l'air". C'est la nature de la technologie. Malgré cette volatilité, nous croyons que ce domaine est une expérience nouvelle, intéressante et durable dans le domaine de la cryptographie.

Ce qui importe ensuite, c’est la façon dont ces cadres mûrissent en termes de technologie et de monétisation.

Du point de vue de la technologie, le cadre peut offrir son plus grand avantage en permettant aux agents d'interagir de manière transparente sur la chaîne. C'est la raison principale pour laquelle les développeurs choisissent un cadre natif de cryptage plutôt qu'un cadre général. De plus, les problèmes de construction d'agents et d'agents sont des problèmes technologiques de pointe à l'échelle mondiale, avec de nouveaux développements chaque jour. Le cadre doit également évoluer en permanence et s'adapter à ces avancées.

Comment monétiser le cadre de manière plus intéressante. À ces débuts, créer une plateforme de lancement inspirée par Virtuals est un fruit facile à atteindre pour le projet. Mais nous pensons qu'il y a beaucoup d'espace pour l'expérimentation ici. Nous nous dirigeons vers un avenir avec des millions d'agents spécialisés dans tous les domaines imaginables. Les outils qui les aident à coordonner efficacement peuvent capturer une valeur énorme des frais de transaction. En tant que portail pour les bâtisseurs, le cadre est bien sûr le mieux placé pour capturer cette valeur.

Dans le même temps, la monétisation des frameworks est également déguisée en une question de monétisation des projets open source et de récompense des contributeurs, qui ont historiquement fait un travail gratuit et ingrat. Si une équipe peut déchiffrer du code sur la façon de créer une économie open source durable tout en conservant sa philosophie de base, les implications iront bien au-delà du cadre de proxy.

Ce sont des sujets que nous espérons explorer dans les mois à venir.

Voir l'original