La disputa por el marco de agentes de IA: ¿Quién es superior entre Eliza, Rig y Daydreams?

Question

Autores: Shlok Khemani, Oliver Jaros Fuente: Decentralised.co Traducción: Shanooba, Golden Finance

El artículo de hoy es una explicación del marco de agencia y nuestra evaluación de su nivel de desarrollo. También es una solicitud para propuestas dirigida a los fundadores que trabajan en el cruce de la trayectoria de la moneda en Internet (criptomoneda) y la agencia.

Durante el año pasado, Decentralised.co ha estado investigando a fondo el campo interdisciplinario de la criptografía y la inteligencia artificial. Incluso hemos construido un producto utilizado por más de 70,000 personas para rastrear agentes de inteligencia artificial e infraestructura de agentes. Aunque la reciente fiebre en torno a este campo ha disminuido en las últimas semanas, el impacto de la inteligencia artificial en la tecnología y la sociedad es algo sin precedentes desde la llegada de Internet. Si las criptomonedas van a ser la senda financiera del futuro, como hemos predicho, su entrelazamiento con la inteligencia artificial será un tema recurrente en lugar de algo pasajero.

Uno de los tipos de proyectos más interesantes que han surgido de esta ola es el marco de agentes de inteligencia artificial nativos de cifrado. Son un experimento fascinante que lleva los principios fundamentales de blockchain, como la transferencia de valor sin permiso, la transparencia y los incentivos consistentes, al desarrollo de la inteligencia artificial. Su naturaleza de código abierto nos brinda una rara oportunidad de explorar su funcionamiento interno, no solo para analizar sus promesas, sino también para comprender cómo realmente funcionan.

En este artículo, primero analizamos el significado real de los marcos de proxy y su importancia. Luego abordamos una pregunta obvia: cuando existen opciones maduras como LangChain, ¿por qué necesitamos marcos de cifrado nativos? Para ello, analizamos los principales marcos de cifrado nativos y sus ventajas y limitaciones en diferentes casos de uso. Por último, si estás construyendo un agente de inteligencia artificial, te ayudaremos a decidir qué marco podría adaptarse a tus necesidades. O si debes usar un marco para la construcción.

Vamos a profundizar.

Resumen

"El progreso de la civilización radica en la expansión de la cantidad de operaciones importantes que podemos llevar a cabo sin pensarlo." - Alfred North Whitehead

Piensa en cómo vivían nuestros antepasados. Cada familia tenía que cultivar sus propios alimentos, hacer su propia ropa, construir su propia vivienda. Pasaban incontables horas en tareas básicas de supervivencia, con apenas tiempo para cualquier otra cosa. Incluso hace dos siglos, cerca del 90% de la población trabajaba en agricultura. Hoy en día, compramos alimentos en supermercados, vivimos en casas construidas por expertos y vestimos ropa producida en fábricas lejanas. Tareas que solían llevar el esfuerzo de generaciones enteras se han convertido en simples transacciones. Actualmente, solo el 27% de la población mundial trabaja en agricultura (en países desarrollados, este porcentaje es inferior al 5%).

Cuando comenzamos a dominar una nueva tecnología, aparecen patrones familiares. Primero entendemos los principios básicos: qué es efectivo, qué no lo es y qué patrones emergen constantemente. Una vez que estos patrones se vuelven claros, los empaquetamos en abstracciones más fáciles, más rápidas y más confiables. Estas abstracciones liberan tiempo y recursos para enfrentar desafíos más diversos y significativos. Lo mismo ocurre con la construcción de software.

Tomemos el desarrollo web como ejemplo. Inicialmente, los desarrolladores tenían que escribir todo desde cero: manejar las solicitudes HTTP, administrar el estado y crear la interfaz de usuario, tareas complejas y que consumían mucho tiempo. Luego surgieron marcos como React, que simplificaron enormemente estos desafíos al proporcionar abstracciones útiles. El desarrollo móvil también siguió un camino similar. Al principio, los desarrolladores necesitaban un conocimiento profundo y específico de la plataforma, hasta que surgieron herramientas como React Native y Flutter, que les permitieron escribir código una vez y desplegarlo en cualquier lugar.

En el aprendizaje automático también aparece un patrón de abstracción similar. A principios de la década de 2000, los investigadores descubrieron el potencial de las GPU en las cargas de trabajo de ML. Inicialmente, los desarrolladores tuvieron que luchar con los elementos gráficos y lenguajes como GLSL, que no estaban diseñados para cálculos generales. En 2006, NVIDIA lanzó CUDA, lo que hizo que la programación de GPU fuera más accesible y llevó el entrenamiento de ML a una audiencia más amplia, cambiando todo.

Con el impulso creciente del desarrollo de ML, han surgido marcos especializados para abstraer la complejidad de la programación de GPU. TensorFlow y PyTorch permiten a los desarrolladores centrarse en la arquitectura del modelo en lugar de verse atrapados en el fango de código de GPU de nivel inferior o en detalles de implementación. Esto acelera la iteración de la arquitectura del modelo y el rápido avance de la IA/ML que hemos visto en los últimos años.

Ahora estamos viendo una evolución similar en los agentes de inteligencia artificial: un programa de software capaz de tomar decisiones y acciones para lograr objetivos, al igual que un asistente humano o un empleado. Utiliza un gran modelo de lenguaje como su 'cerebro' y puede utilizar diferentes herramientas, como buscar en la web, realizar llamadas a API o acceder a bases de datos para completar tareas.

Para construir un agente desde cero, un desarrollador debe escribir código complejo para manejar cada aspecto: cómo piensa el agente, cómo decide qué herramientas usar y cuándo usarlas, cómo interactuar con estas herramientas, cómo recordar el contexto de interacciones anteriores, y cómo dividir tareas grandes en pasos manejables. Cada patrón debe ser abordado individualmente, lo que conduce a trabajos repetitivos y resultados inconsistentes.

Aquí es donde brilla el marco de agentes de inteligencia artificial. Al igual que React simplifica el desarrollo web al manejar las partes complicadas de la actualización de la interfaz de usuario y la gestión del estado, estos marcos abordan los desafíos comunes en la construcción de agentes de inteligencia artificial. Proporcionan componentes listos para usar para los patrones efectivos que hemos descubierto, como construir el proceso de toma de decisiones del agente, integrar diferentes herramientas y mantener el contexto en múltiples interacciones.

Con el marco, los desarrolladores pueden centrarse en hacer que sus agentes sean únicos, en lugar de reconstruir estos componentes básicos. Pueden crear agentes de inteligencia artificial complejos en cuestión de días o semanas en lugar de meses, probar diferentes enfoques con más facilidad y aprovechar las mejores prácticas descubiertas por otros desarrolladores y comunidades.

Para comprender mejor la importancia de los marcos, considere a un desarrollador que construye un asistente para ayudar a los médicos a revisar informes médicos. Sin un marco, tendrían que escribir todo el código desde cero: manejar archivos adjuntos de correo electrónico, extraer texto de PDF, ingresar texto en LLM en el formato correcto, administrar el historial de conversaciones para rastrear los temas discutidos y asegurarse de que el asistente responda adecuadamente. Para tareas que no son exclusivas de su caso de uso específico, esto implica una gran cantidad de código complejo.

Con el marco de proxy, muchos de estos bloques de construcción se pueden utilizar directamente. El marco maneja la lectura de correos electrónicos y PDF, proporciona un patrón para construir sugerencias de conocimientos médicos, gestiona el flujo de conversaciones e incluso ayuda a hacer un seguimiento de los detalles importantes en múltiples interacciones. Los desarrolladores pueden centrarse en hacer que su agente se destaque, como ajustar sugerencias de análisis médico o agregar controles de seguridad específicos para diagnósticos, en lugar de reinventar patrones comunes. Lo que originalmente podría haber llevado meses construir desde cero, ahora se puede completar en cuestión de días con el diseño de prototipos.

LangChain se ha convertido en la navaja suiza del desarrollo de inteligencia artificial, proporcionando un paquete de herramientas flexible para construir aplicaciones basadas en LLM. Aunque estrictamente no es un marco de agente, proporciona los bloques de construcción básicos para la mayoría de los marcos de agentes, desde cadenas utilizadas para ordenar llamadas LLM hasta sistemas de memoria utilizados para mantener el contexto. Su amplio ecosistema de integración y su extensa documentación lo convierten en el punto de partida preferido para los desarrolladores que desean construir aplicaciones prácticas de inteligencia artificial.

Luego están los marcos multiagente como CrewAI y AutoGen, que permiten a los desarrolladores construir sistemas en los que múltiples agentes de IA trabajan en conjunto, cada uno con su propio papel y habilidades únicas. Estos marcos no solo ejecutan tareas en secuencia, sino que hacen hincapié en la colaboración de los agentes a través del diálogo para resolver problemas juntos.

Por ejemplo, al asignar un informe de investigación, un agente puede resumir su estructura, otro agente puede recopilar información relevante, y un tercer agente puede revisar y mejorar el borrador final. Es como formar un equipo virtual, donde los agentes de inteligencia artificial pueden discutir, debatir y mejorar juntos las soluciones. Este tipo de colaboración para lograr objetivos de alto nivel en sistemas multiagentes suele denominarse 'enjambre' de agentes de inteligencia artificial.

Aunque AutoGPT no es un marco tradicional, ha sentado las bases del concepto de agentes de inteligencia artificial autónomos. Muestra cómo la inteligencia artificial puede aceptar un objetivo de alto nivel, descomponerlo en subtareas y completarlo de forma independiente con muy poco aporte humano. A pesar de sus limitaciones, AutoGPT ha desencadenado una ola de innovación en agentes autónomos y ha influido en el diseño de marcos más estructurados que le siguieron.

Pero ¿por qué criptografía?

Todo este contexto nos lleva finalmente al surgimiento del marco de inteligencia artificial nativa de criptografía. En este momento, es posible que te preguntes, ¿por qué Web3 necesita su propio marco cuando ya tenemos marcos relativamente maduros como Langchain y CrewAI en Web2? Por supuesto, ¿los desarrolladores pueden utilizar estos marcos existentes para construir cualquier agente que deseen? Dado que la industria tiende a imponer Web3 en todas y cada una de las narrativas, esta sospecha es comprensible.

Creemos que la existencia de un marco de agente específico de Web3 tiene tres razones suficientes.

Agente financiero en cadena

Creemos que en el futuro, la mayoría de las transacciones financieras se llevarán a cabo en la cadena de bloques. Esto acelera la demanda de un tipo de agentes de inteligencia artificial que pueden analizar datos en la cadena, ejecutar transacciones en la cadena de bloques y administrar activos digitales a través de múltiples protocolos y redes. Desde robots de trading automatizados que pueden detectar oportunidades de arbitraje hasta gestores de carteras que ejecutan estrategias de rendimiento, estos agentes dependen de la profunda integración de las funcionalidades de la cadena de bloques en sus flujos de trabajo centrales.

Los marcos tradicionales de Web2 no proporcionan componentes nativos para estas tareas. Debe juntar bibliotecas de terceros para interactuar con contratos inteligentes, analizar eventos en la cadena original y manejar la gestión de claves privadas, lo que introduce complejidad y posibles vulnerabilidades. Por el contrario, los marcos especializados de Web3 pueden manejar estas funciones listas para usar, lo que permite a los desarrolladores centrarse en la lógica y estrategia de sus contratos en lugar de lidiar con la lucha de bajo nivel de la cadena de bloques.

Coordinación nativa e incentivos

La cadena de bloques no solo implica moneda digital. Proporcionan un sistema de registro global y de confianza mínima, con herramientas financieras integradas que pueden mejorar la coordinación entre múltiples agentes. Los desarrolladores pueden utilizar primitivas en cadena (como el staking, la custodia y los incentivos de pool) para coordinar los intereses de múltiples agentes de IA, en lugar de depender de la reputación fuera de la cadena o de bases de datos aisladas.

Imagina un grupo de agentes colaborando para completar una tarea compleja (por ejemplo, etiquetar datos para entrenar un nuevo modelo). El rendimiento de cada agente se puede rastrear en la cadena y las recompensas se asignan automáticamente en función de su contribución. La transparencia y la inmutabilidad de los sistemas basados en blockchain permiten una compensación justa, un seguimiento de la reputación más sólido y programas de incentivos en tiempo real en constante evolución.

El marco nativo de la criptografía puede incrustar explícitamente estas funciones, permitiendo a los desarrolladores diseñar una estructura de incentivos con contratos inteligentes sin tener que rediseñar la rueda cada vez que necesiten delegar confianza o pagar a otro delegado.

Nuevas oportunidades en el mercado temprano

Aunque marcos como LangChain ya tienen intercambio de ideas y efecto de red, el campo de agentes de inteligencia artificial todavía está en una etapa inicial. Actualmente no está claro cómo será el estado final de estos sistemas, y no hay una forma de asegurar el mercado.

La economía criptográfica de incentivos ha abierto nuevas posibilidades para la construcción, gestión y monetización de marcos, posibilidades que no se pueden mapear completamente a la economía tradicional de SaaS o Web2. Estos experimentos en una etapa temprana pueden desbloquear nuevas estrategias de monetización para el marco en sí, en lugar de solo construir sobre el marco.

Competidor

ElizaOS está asociado con el popular proyecto AI16Z y es un marco basado en Typescript para crear, implementar y administrar agentes de IA. Está diseñado como un sistema operativo de agente de IA compatible con Web3, que permite a los desarrolladores crear proxies con personalidades únicas, herramientas flexibles para interacciones de blockchain y fácilmente escalable con un sistema multiagente. Rig es un marco de agente de IA de código abierto desarrollado por Playgrounds Analytics Inc., construido con el lenguaje de programación Rust, utilizado para crear agentes de IA modulares y escalables. Está asociado con el proyecto AI Rig Complex (ARC).
Daydreams es un marco de proxy generativo que se creó originalmente para crear proxies autónomos para juegos en cadena, pero desde entonces se ha expandido para realizar tareas en cadena.
Pippin es un marco de agencia de IA desarrollado por Yohei Nakajima, fundador de BabyAGI, para ayudar a los desarrolladores a crear asistentes digitales modulares y autónomos. Yohei primero creó un agente independiente y luego lo extendió a un marco de propósito general.
ZerePy es un marco de Python de código abierto diseñado para implementar agentes autónomos en múltiples plataformas y cadenas de bloques, con un enfoque en la IA creativa y la integración de las redes sociales. Al igual que Pippin, Zerepy comenzó como una agencia independiente, Zerebro, que desde entonces se ha expandido hasta convertirse en un marco.

estándar

Para evaluar la fortaleza de cada marco, nos ponemos en el lugar de los desarrolladores que desean construir agentes de IA. ¿Qué les importaría? Creemos que es útil dividir la evaluación en tres categorías principales: núcleo, funcionalidad y experiencia del desarrollador.

Puede considerar el núcleo del marco como la base para construir todos los demás agentes. Si el núcleo es débil, lento o no se desarrolla continuamente, los agentes creados con este marco estarán sujetos a las mismas limitaciones. Puede evaluar el núcleo según los siguientes criterios:

Bucle de razonamiento central: el cerebro de cualquier marco de agente; cómo aborda los problemas. Un marco fuerte admite todo, desde flujos de entrada y salida básicos hasta patrones complejos como cadenas de pensamientos. Sin una capacidad de razonamiento sólida, el agente no puede descomponer eficazmente tareas complejas o evaluar múltiples opciones, lo que las simplifica en elegantes chatbots.
Mecanismo de memoria: Los agentes necesitan tanto memoria a corto plazo para mantener conversaciones continuas, como almacenamiento a largo plazo para adquirir conocimientos duraderos. Un buen marco no solo recuerda, sino que también comprende las relaciones entre diferentes informaciones y puede priorizar qué información merece ser retenida y cuál merece ser olvidada.
Soporte de incrustación y RAG: Los agentes modernos necesitan utilizar conocimientos externos, como documentos y datos de mercado. Un marco sólido puede incrustar fácilmente esta información y recuperarla según el contexto a través de RAG, lo que permite construir respuestas basadas en conocimientos específicos en lugar de depender únicamente del entrenamiento del modelo base.
Configuración personalizada: La capacidad de dar forma a la forma de comunicarse de los agentes de servicio al cliente (tono, cortesía y personalidad) es crucial para la participación del usuario. Un buen marco puede configurar fácilmente estas características, y reconocer la personalidad de los agentes de servicio al cliente puede tener un impacto significativo en la confianza del usuario.
Coordinación multiagente: El marco potente proporciona un patrón incorporado para la colaboración entre agentes, ya sea a través de diálogos estructurados, asignación de tareas o sistemas de memoria compartida. Esto puede crear equipos profesionales en los que cada agente aporte sus habilidades únicas para resolver problemas juntos.

Además de la funcionalidad central, la utilidad real del marco depende en gran medida de sus funciones e integración. Las herramientas amplían enormemente la funcionalidad real del agente. Un agente con solo acceso LLM puede participar en conversaciones, pero si se le otorga acceso al navegador web, puede recuperar información en tiempo real. Conéctelo a su API de calendario y podrá programar reuniones. Cada nueva herramienta duplica la funcionalidad del agente. Desde la perspectiva de un desarrollador, cuantas más herramientas haya, mayor será la variedad de opciones y el alcance experimental.

Evaluamos las funciones del marco criptográfico nativo desde tres dimensiones:

Soporte y funcionalidades del modelo de IA: El potente marco proporciona integración nativa con varios modelos de lenguaje, desde la serie GPT de OpenAI hasta alternativas de código abierto como Llama y Mistral. Pero esto no se limita al LLM. El soporte para funciones de IA adicionales, como la conversión de texto a voz, el uso del navegador, la generación de imágenes y el razonamiento del modelo local, puede ampliar enormemente las capacidades del agente. El sólido soporte de modelos está convirtiéndose en un requisito indispensable para muchos marcos de este tipo.
Soporte de infraestructura Web3: Construir un proxy cifrado requiere una integración profunda con la infraestructura de la cadena de bloques. Esto implica soportar componentes Web3 necesarios, como carteras para firmar transacciones, RPC para la comunicación de la cadena y indexadores para el acceso a datos. Un marco sólido debe integrarse con herramientas y servicios básicos de todo el ecosistema, desde mercados NFT y protocolos DeFi hasta soluciones de identidad y capas de disponibilidad de datos.
Cobertura de la cadena: El soporte de la infraestructura Web3 determina lo que los agentes pueden hacer, mientras que la cobertura de la cadena determina dónde pueden hacerlo. El ecosistema de las criptomonedas se está convirtiendo en un gigante descentralizado y multicadena, lo que pone de manifiesto la importancia de una amplia cobertura de la cadena.

Por último, incluso el marco más poderoso solo puede ser tan bueno como la experiencia del desarrollador. Un marco puede tener funciones de primera clase, pero si los desarrolladores tienen dificultades para usarlo de manera efectiva, nunca será ampliamente adoptado.

El lenguaje utilizado en el marco afecta directamente a quién puede construirlo. Python tiene una posición dominante en el campo de la inteligencia artificial y la ciencia de datos, por lo que naturalmente se convierte en la elección de los marcos de inteligencia artificial. Los marcos escritos en lenguajes de nicho pueden tener ventajas únicas, pero pueden aislarse del ecosistema de desarrolladores más amplio. La ubicuidad de JavaScript en el desarrollo web lo convierte en otro competidor fuerte, especialmente para marcos orientados a la integración web.
La documentación clara y completa es el alma de los desarrolladores que adoptan un nuevo marco. No se trata solo de referencias a la API, aunque también son cruciales. La sólida documentación incluye una descripción general conceptual que explica los principios básicos, tutoriales paso a paso, código de muestra bien anotado, tutoriales educativos, guías de solución de problemas y patrones de diseño establecidos.

Resultado

La siguiente tabla resume el rendimiento de cada marco en los parámetros que acabamos de definir (clasificación 1-5).

Aunque discutir las razones detrás de cada punto de datos está más allá del alcance de este artículo, aquí hay algunas impresiones destacadas que cada marco nos dejó.

Eliza es el marco más maduro en esta lista hasta la fecha. Dado que el marco de Eliza se ha convertido en un punto de referencia para la interacción de la inteligencia artificial con el ecosistema criptográfico en la reciente ola de agentes, una de sus características destacadas es la gran cantidad de características y integraciones que admite.

Debido a su prominencia, cada blockchain y herramienta de desarrollo compiten por integrarse en este marco (¡actualmente tiene casi 100 integraciones!). Al mismo tiempo, Eliza también atrae más actividad de desarrolladores que la mayoría de los marcos. Eliza se beneficia al menos a corto plazo de algunos efectos de red muy claros. El marco está escrito en TypeScript, que es un lenguaje maduro utilizado tanto por principiantes como por desarrolladores experimentados, lo que impulsa aún más su desarrollo.

Eliza se destacó también por el abundante contenido educativo y tutoriales que ofrece a los desarrolladores que utilizan este marco.

Hemos visto una serie de agentes que utilizan el marco de Eliza, incluidos Spore, Eliza (agente) y Pillzumi. Se espera que la nueva versión del marco de Eliza se lance en las próximas semanas.

El método de Rig es fundamentalmente diferente al de Eliza. Destaca por tener un núcleo potente, ligero y de alto rendimiento. Admite varios modos de razonamiento, incluidas las cadenas de pistas (aplicación secuencial de pistas), la orquestación (coordinación de múltiples agentes), la lógica condicional y la simultaneidad (ejecución concurrente de operaciones).

Sin embargo, Rig en sí no tiene una integración tan rica. En cambio, adopta un enfoque diferente que el equipo llama "Apretón de manos Arc". Aquí, el equipo de Arc colabora con equipos de alta calidad de Web2 y Web3 para ampliar las funcionalidades de Rig. Algunas de estas colaboraciones incluyen trabajar con Soulgraph en el desarrollo de personalización de agentes, así como colaborar con Listen y Solana Agent Kit en el desarrollo de funciones de cadena de bloques.

Sin embargo, Rig tiene dos desventajas. En primer lugar, está escrito en Rust, que aunque tiene un rendimiento excelente, es menos conocido por los desarrolladores. En segundo lugar, solo hemos visto un número limitado de agentes impulsados por Rig en aplicaciones reales (AskJimmy es una excepción), lo que dificulta la evaluación de la verdadera adopción por parte de los desarrolladores.

Antes de comenzar con Daydreams, el fundador lordOfAFew fue el principal contribuyente al marco de Eliza. Esto le permitió conocer el crecimiento del marco, y lo que es más importante, conocer algunas de sus deficiencias. La diferencia de Daydreams con otros marcos radica en su enfoque en el razonamiento encadenado para ayudar a los agentes a alcanzar objetivos a largo plazo. Esto significa que, al tener un objetivo de alto nivel y complejo, los agentes realizan un razonamiento de múltiples pasos, proponen diversas acciones, las aceptan o las descartan según si contribuyen o no al logro del objetivo, y continúan este proceso para avanzar. Esto hace que los agentes creados con Daydreams sean verdaderamente autónomos.

La experiencia del fundador en la creación de proyectos de juegos influye en este enfoque. Los juegos, especialmente los juegos en cadena, son un caldo de cultivo ideal para entrenar a los proxies y poner a prueba sus habilidades. No es de extrañar que algunos de los primeros casos de uso de los proxies Daydreams fueran en juegos como Pistols, Istarai y PonziLand.

El marco también cuenta con potentes implementaciones de flujo de trabajo de orquestación y colaboración multiagente.

Al igual que Daydreams, Pippin también es un recién llegado en el mundo de los juegos de marcos. En este artículo, detallamos su lanzamiento. La visión central de Yohei es hacer que los agentes sean una 'presencia digital', capaces de operar de forma inteligente y autónoma mediante el acceso a las herramientas adecuadas. Esta visión se refleja en el núcleo simple y elegante de Pippin. Con solo unas pocas líneas de código, se puede crear un agente complejo que puede operar de manera autónoma e incluso escribir su propio código.

La desventaja de este marco es que carece incluso de características básicas como la incrustación de vectores de soporte y los flujos de trabajo RAG. También anima a los desarrolladores a utilizar Composio, una biblioteca de terceros, para la mayoría de las integraciones. En comparación con los otros marcos discutidos hasta ahora, simplemente no está lo suficientemente maduro.

Algunos de los agentes construidos con Pippin incluyen Ditto y Telemafia.

Zerepy tiene una implementación central relativamente simple. Eficientemente selecciona una tarea de un conjunto de tareas configuradas y la ejecuta cuando es necesario. Sin embargo, carece de patrones de razonamiento complejos como la planificación impulsada por objetivos o la cadena de pensamiento.

Si bien admite llamadas de inferencia a varios LLM, carece de cualquier incrustación o implementación de RAG. También carece de primitivas para la memoria o la coordinación multiagente.

Esta falta de funcionalidad central integrada se refleja en la adopción de Zerepy. Aún no hemos visto a ningún agente real que utilice este marco en línea.

Construido utilizando un marco

Si todo esto suena muy técnico y teórico, no te culparemos. Una pregunta más simple sería "¿Qué tipo de agentes puedo construir con estos marcos sin tener que escribir un montón de código yo mismo?".

Para evaluar estos marcos en la práctica, identificamos cinco tipos comunes de agentes que los desarrolladores a menudo quieren construir. Representan diferentes niveles de complejidad y ponen a prueba varios aspectos de la funcionalidad de cada marco.

Agente de chat de documentos: Prueba de las funciones centrales RAG, incluida la manipulación de documentos, el mantenimiento del contexto, la precisión de las citas y la gestión de la memoria. Esta prueba revela la capacidad del marco para navegar entre la comprensión real de documentos y la coincidencia de patrones simples.
Chatbot: Evaluar la coherencia del sistema de memoria y el comportamiento. El marco debe mantener características de personalidad consistentes, recordar información clave en la conversación y permitir la configuración de la personalidad, transformando fundamentalmente al chatbot sin estado en una entidad digital persistente.
Bots de trading on-chain: Ponga a prueba las integraciones externas mediante el procesamiento de datos de mercado en tiempo real, la realización de transacciones entre cadenas, el análisis del sentimiento social y la implementación de estrategias de trading. Esto revela cómo el marco maneja la compleja infraestructura de blockchain y las conexiones API.
NPC del juego: Aunque el mundo solo ha comenzado a prestar atención a los agentes en el último año, durante décadas, los agentes como personajes no jugadores (NPC) han desempeñado un papel crucial en los juegos. Los agentes de juego están evolucionando de agentes basados en reglas a agentes inteligentes impulsados por LLM, y siguen siendo un caso de uso principal en el marco. Aquí probamos la capacidad de los agentes para comprender el entorno, razonar escenarios de forma autónoma y lograr objetivos a largo plazo.
Asistente de voz: Evaluar el procesamiento en tiempo real y la experiencia del usuario a través del procesamiento de voz, el tiempo de respuesta rápido y la integración de la plataforma de mensajería. Esto prueba si el marco puede soportar aplicaciones verdaderamente interactivas en lugar de simplemente el modo de solicitud-respuesta.

Damos una calificación de 5 puntos para cada tipo de agente para cada marco. Aquí está su rendimiento:

Métricas de código abierto

Al evaluar estos marcos, la mayoría de los análisis prestan mucha atención a las métricas de GitHub, como estrellas y bifurcaciones. Aquí, presentaremos rápidamente qué son estas métricas y en qué medida indican la calidad del marco.

Las estrellas sirven como la señal más visible de popularidad. Básicamente, son marcadores que los desarrolladores colocan en proyectos que les resultan interesantes o que desean seguir. Aunque un alto número de estrellas indica un amplio conocimiento e interés, también puede ser engañoso. A veces, los proyectos acumulan estrellas a través del marketing en lugar de valor técnico. Es importante ver las estrellas como una prueba social, no como un estándar de calidad.

El número de bifurcaciones indica cuántos desarrolladores han creado sus propias copias del código base para construir. Más bifurcaciones suelen ser una señal de que los desarrolladores están utilizando y ampliando activamente el proyecto. Es decir, muchas bifurcaciones finalmente se abandonan, por lo que el número original de bifurcaciones requiere contexto.

La cantidad de contribuyentes revela cuántos desarrolladores diferentes realmente han enviado código al proyecto. Esto suele ser más significativo que las estrellas o los forks. Una cantidad saludable de contribuyentes regulares indica que el proyecto tiene una comunidad activa que lo mantiene y lo mejora.

Vamos un paso más allá y diseñamos nuestro propio indicador: el Puntaje del Colaborador. Evaluamos el historial público de cada desarrollador, incluyendo sus contribuciones pasadas a otros proyectos, la frecuencia de actividad y la popularidad de sus cuentas, para asignar un puntaje a cada colaborador. Luego promediamos a todos los colaboradores de un proyecto y ponderamos según la cantidad de contribuciones que han hecho.

¿Qué significan estos números para nuestra estructura?

En la mayoría de los casos, el número de estrellas es insignificante. No son un indicador significativo de adopción. La excepción aquí es Eliza, que en un momento dado se convirtió en el repositorio de tendencias número uno de todos los proyectos en GitHub, lo que coincide con el punto de Schelling en el que se convirtió en todo IA criptográfica. Además, desarrolladores conocidos como 0xCygaar han contribuido al proyecto. Esto también se refleja en el número de colaboradores, 10 veces más que otros proyectos, y Eliza atrae a los colaboradores.

Además, Daydreams es interesante para nosotros simplemente porque atrae a desarrolladores de alta calidad. Como un rezagado lanzado después del pico de la especulación, no se benefició del efecto de red de Eliza.

¿Qué sigue? **

Si eres un desarrollador, esperamos haber proporcionado al menos un punto de partida para que elijas qué marco (si es necesario) construir. Además, todavía debes esforzarte por probar si la lógica central y la integración de cada marco son adecuadas para tu caso de uso. Esto es inevitable.

Desde la perspectiva de un observador, es importante recordar que todos estos marcos proxy de IA tienen menos de tres meses de antigüedad. (Sí, se siente más largo). Durante este tiempo, pasaron de ser exagerados a ser llamados "castillos en el cielo". Esa es la naturaleza de la tecnología. A pesar de esta volatilidad, creemos que este espacio es un nuevo experimento interesante y duradero en el espacio de las criptomonedas.

Lo siguiente importante es cómo estos marcos maduran en términos técnicos y de monetización.

En términos de tecnología, la mayor ventaja que los frameworks pueden crear para sí mismos es permitir que los proxies interactúen sin problemas en la cadena. Esta es la razón número uno por la que los desarrolladores eligen marcos cripto-nativos en lugar de los genéricos. Además, las tecnologías de proxies y creación de proxies son problemas tecnológicos de vanguardia en todo el mundo, con nuevos desarrollos que ocurren todos los días. El marco también debe evolucionar y adaptarse a estos acontecimientos.

Es más interesante cómo se monetizan los marcos. En estos primeros días, la creación de una plataforma de lanzamiento inspirada en los virtuales fue una fruta madura del proyecto. Pero creemos que hay mucho espacio para la experimentación aquí. Nos estamos moviendo hacia un futuro con millones de proxies que se especializan en todos los nichos imaginables. Las herramientas que les ayudan a coordinarse de manera efectiva pueden capturar un enorme valor de las tarifas de transacción. Como puerta de entrada para los constructores, los marcos son sin duda los más adecuados para capturar estos valores.

Al mismo tiempo, la monetización de los frameworks también se disfraza como una cuestión de monetización de proyectos de código abierto y de recompensar a los colaboradores, que históricamente han hecho un trabajo gratuito e ingrato. Si un equipo puede descifrar el código sobre cómo crear una economía de código abierto sostenible mientras mantiene su espíritu básico, las implicaciones irán mucho más allá del marco de proxy.

Estos son temas que esperamos explorar en los próximos meses.

ELIZA-3.22%

Ver originales