Борьба за фреймворк искусственного интеллекта: кто из Eliza, Rig, Daydreams более успешен

Автор: Шлок Кхемани, Оливер Ярос Источник: Decentralised.co Перевод: Шан Оуба, GoldFinance

Сегодняшняя статья посвящена объяснению агентских фреймворков и нашей оценке их уровня развития. Это также запрос на предложение, целью которого является привлечение основателей, работающих в области криптовалют и агентов в сфере интернет-валюты.

В течение прошедшего года Decentralised.co глубоко изучал пересечение областей криптографии и искусственного интеллекта. Мы даже создали продукт, который используют более 70 000 человек, для отслеживания агентов и инфраструктуры искусственного интеллекта. Несмотря на то, что последние несколько недель пыл вокруг этой области улегся, влияние искусственного интеллекта на технологии и общество является непреходящим явлением, которого мы не видели с момента появления интернета. Если криптовалюта действительно станет основой финансового будущего, как мы предсказываем, то взаимодействие криптовалюты с искусственным интеллектом станет повторяющейся темой, а не единоразовым событием.

Одним из наиболее интересных категорий проектов, возникших из этой волны, является фреймворк криптонативного искусственного интеллекта. Они представляют собой увлекательный эксперимент, который внедряет основные принципы блокчейна - безразрешимый перевод стоимости, прозрачность и однородное поощрение - в разработку искусственного интеллекта. Их открытая природа предоставляет нам уникальную возможность исследовать их внутреннее устройство, анализировать не только их обещания, но и их фактический способ работы.

В этой статье мы сначала анализируем фактическое значение агентских фреймворков и их важность. Затем мы решаем очевидную проблему: почему нам нужен шифрованный родной фреймворк, когда существуют зрелые варианты, такие как LangChain? Для этого мы анализируем ведущие шифрованные родные фреймворки и их преимущества и ограничения в различных сценариях использования. Наконец, если вы строите искусственного интеллектного агента, мы поможем вам определить, какой фреймворк может быть подходящим для ваших потребностей. Или же вам следует использовать фреймворк для создания.

Давайте углубимся в это.

Абстракция

Прогресс цивилизации заключается в увеличении количества важных операций, которые мы можем выполнять без раздумий. - Альфред Норт Уайтхед

Подумайте о том, как жили наши предки. Каждая семья должна была выращивать свою пищу, шить свою одежду, строить свое жилье. Они тратили бесчисленные часы на основные задачи выживания и практически не имели времени на что-то еще. Даже два века назад почти 90% людей работали в сельском хозяйстве. Сегодня мы покупаем продукты в супермаркете, живем в домах, построенных специалистами, и носим одежду, произведенную на отдаленных фабриках. Задача, которая когда-то требовала усилий нескольких поколений, стала простой сделкой. В настоящее время только 27% населения мира работает в сельском хозяйстве (в развитых странах это число снизилось до менее 5%).

Когда мы начинаем осваивать новую технологию, появляется знакомый шаблон. Сначала мы понимаем основные принципы - что эффективно, что неэффективно и какие шаблоны постоянно повторяются. Как только эти шаблоны становятся ясными, мы упаковываем их в более простые, более быстрые и более надежные абстракции. Эти абстракции освобождают время и ресурсы для решения более разнообразных и содержательных вызовов. Точно так же строится программное обеспечение.

! cfpYG94rSxhzdHHC3T4K0tAk7UApcvUMQoqb5hCa.png

На примере веб-разработки. В ранние времена разработчики должны были писать все с нуля - обрабатывать HTTP-запросы, управлять состоянием и создавать пользовательский интерфейс - эти задачи были как сложные, так и затратные по времени. Затем появились фреймворки, такие как React, которые значительно упростили эти вызовы, предоставив полезные абстракции. Мобильная разработка также следует похожему пути. Изначально разработчики требовали глубоких, специфичных для платформы знаний, пока не появились инструменты, такие как React Native и Flutter, позволяющие им писать код один раз и развертывать его в любом месте.

В машинном обучении также появились аналогичные абстрактные шаблоны. В начале 2000-х исследователи обнаружили потенциал GPU в рабочей нагрузке ML. Сначала разработчикам приходилось бороться с графическими примитивами и языками, такими как GLSL, похожими на OpenGL - эти инструменты не предназначены для общего вычисления. В 2006 году NVIDIA представила CUDA, сделав программирование GPU более доступным и приведя обучение ML к более широкому кругу разработчиков, что изменило все.

С развитием разработки ML появились специальные фреймворки, которые абстрагируют сложность программирования GPU. TensorFlow и PyTorch позволяют разработчикам сосредоточиться на архитектуре модели, а не углубляться в низкоуровневый код GPU или детали реализации. Это ускоряет итерации архитектуры модели и способствует быстрому прогрессу в области искусственного интеллекта и машинного обучения, который мы видим в последние несколько лет.

Мы сейчас видим, что агенты искусственного интеллекта также проходят аналогичную эволюцию - программное обеспечение, способное принимать решения и действовать для достижения целей, подобно человеческому помощнику или сотруднику. Оно использует крупномасштабные языковые модели в качестве своего «мозга» и может использовать различные инструменты, такие как поиск в Интернете, вызовы API или доступ к базе данных, чтобы выполнить задачу.

Для того чтобы построить агента с нуля, разработчику необходимо написать сложный код для обработки каждого аспекта: как агент думает, как принимает решение о том, какие инструменты использовать и когда, как взаимодействовать с этими инструментами, как запомнить контекст ранних взаимодействий и как разбить крупную задачу на управляемые шаги. Каждый шаблон должен быть решен отдельно, что приводит к повторению работы и несогласованным результатам.

Именно здесь на помощь приходит прокси-фреймворк ИИ. Точно так же, как React упрощает веб-разработку, обрабатывая сложные части обновлений пользовательского интерфейса и управления состоянием, эти фреймворки решают общие проблемы при создании агентов ИИ. Они предоставляют готовые компоненты для эффективных шаблонов, которые мы обнаружили, например, как структурировать процесс принятия решений агентом, интегрировать различные инструменты и поддерживать контекст в нескольких взаимодействиях.

С использованием фреймворка разработчики могут сосредоточиться на делании своего агента уникальным — на его конкретных функциях и случаях использования — вместо того чтобы снова и снова строить эти базовые компоненты. Они могут создавать сложные агенты искусственного интеллекта за несколько дней или недель, а не за несколько месяцев, более легко попробовать различные подходы, а также черпать вдохновение из лучших практик, обнаруженных другими разработчиками и сообществом.

Для лучшего понимания важности фреймворка рассмотрим разработчика, который строит агента для помощи врачам в проверке медицинских отчетов. Без фреймворка им пришлось бы писать весь код с нуля: обрабатывать вложения в электронной почте, извлекать текст из PDF, правильно форматировать текст для ввода в LLM, управлять историей диалогов для отслеживания обсужденного и гарантировать, что агент реагирует адекватно. Для задач, не уникальных для их конкретного случая, это означает большое количество сложного кода.

Используя фреймворк агентов, многие из этих строительных блоков можно использовать напрямую. Этот фреймворк обрабатывает чтение электронной почты и PDF, предоставляет шаблоны для создания медицинских знаний, управляет потоком диалога, даже помогает отслеживать важные детали в нескольких обменах. Разработчики могут сосредоточиться на делании своего агента уникальным, например, настройке медицинских аналитических подсказок или добавлении определенных проверок безопасности для диагностики, а не на изобретении общих шаблонов. То, что изначально могло занять несколько месяцев для полного создания с нуля, теперь можно сделать за несколько дней при проектировании прототипа.

LangChain стал швейцарским армейским ножом в разработке искусственного интеллекта, предоставляя гибкий инструментарий для создания приложений на базе LLM. Хотя он строго говоря не является фреймворком агента, но обеспечивает основные строительные блоки для создания большинства фреймворков агента, начиная от цепочки для сортировки вызовов LLM до системы памяти для поддержания контекста. Его обширная экосистема интеграции и обширная документация делают его предпочтительным стартовым пунктом для разработчиков, желающих создать практичные приложения искусственного интеллекта.

Затем есть такие мультиагентные фреймворки, как CrewAI и AutoGen, которые позволяют разработчикам строить системы, в которых несколько ИИ-агентов сотрудничают, каждый агент имеет свою уникальную роль и способности. Эти фреймворки не выполняют задачи просто по порядку, а подчеркивают сотрудничество агентов через диалог для совместного решения проблем.

! SXYgyuC4qnpplO0idJXnSanSo3OXAp1TMMrHtspG.png

Например, при распределении исследовательского отчета один агент может изложить его структуру, другой - собрать соответствующую информацию, а третий - прокомментировать и улучшить окончательный черновик. Это похоже на формирование виртуальной команды, в которой агенты искусственного интеллекта могут обсуждать, дискутировать и вместе улучшать решения. Такой совместный подход к достижению высокоуровневых целей в многоагентных системах часто называется «кластером» агентов искусственного интеллекта.

AutoGPT, хотя и не является традиционной системой, но открывает концепцию автономного искусственного интеллекта. Он демонстрирует, как искусственный интеллект может принять высокоуровневую цель, разбить ее на подзадачи и самостоятельно завершить ее с минимальным участием человека. Несмотря на свои ограничения, AutoGPT вызвал волну инноваций в области автономных агентов и повлиял на разработку более структурированных фреймворков впоследствии.

Но почему именно шифрование?

Вся эта история в конечном итоге привела нас к появлению фреймворка для искусственного интеллекта в области криптографии. Возможно, сейчас вы спрашиваете, зачем Web3 нужен свой собственный фреймворк, когда у нас уже есть относительно зрелые фреймворки, такие как Langchain и CrewAI, в рамках Web2? Разработчики могут использовать эти существующие фреймворки для создания любых агентов, которые им нужны? Учитывая склонность отрасли навязывать Web3 любые и все повествования, этот скептицизм вполне оправдан.

Мы считаем, что существует три веских причины для наличия специфической агентской структуры Web3.

Финансовые агенты, работающие на цепи

Мы считаем, что в будущем большая часть финансовых сделок будет проводиться на платформе блокчейна. Это ускоряет спрос на определенный тип агентов искусственного интеллекта, которые могут анализировать данные на цепи, выполнять транзакции на блокчейне и управлять цифровыми активами через несколько протоколов и сетей. От автоматизированных торговых роботов, способных выявлять арбитражные возможности, до портфельных менеджеров, принимающих решения о стратегии доходов, все эти агенты зависят от глубокой интеграции функций блокчейна в свои основные бизнес-процессы.

! UgKQjpORqg52fRAWEK0NlemKNxv7W03vfqHNYVkj.png

Традиционные веб-фреймворки Web2 не предоставляют нативных компонентов для этих задач. Вам придется собирать сторонние библиотеки для взаимодействия с смарт-контрактами, анализа событий на основной цепи и управления закрытыми ключами - что вводит сложности и потенциальные уязвимости. Вместо этого, специализированные веб-фреймворки Web3 могут автоматически обрабатывать эти функции, позволяя разработчикам сосредоточиться на логике и стратегии своих агентов, а не бороться с низкоуровневыми блокчейн-каналами.

Нативная координация и мотивация

Блокчейн касается не только цифровых валют. Он предоставляет глобальную систему записей с минимальным доверием, встроенные финансовые инструменты могут усилить координацию между множеством агентов. Разработчики могут использовать онлайн-примитивы (такие как залог, кастодиальное хранение и инцентивные пулы) для координации интересов нескольких искусственных интеллектов, не полагаясь на оффчейн-репутацию или изолированные базы данных.

Представьте себе группу агентов, сотрудничающих для выполнения сложной задачи (например, разметка данных для обучения новой модели). Производительность каждого агента может отслеживаться на цепочке и автоматически распределяться награды в зависимости от вклада. Прозрачность и неизменяемость системы на основе блокчейна позволяют обеспечивать справедливую оплату, более надежное отслеживание репутации и стимулы к развитию в реальном времени.

Криптографический фреймворк может явно встраивать эти функции, позволяя разработчикам использовать интеллектуальные контракты для создания инцентивной структуры, не пересоздавая колесо при каждой необходимости доверенного агента или оплаты другому агенту.

Новые возможности на раннем рынке

Хотя фреймворкам, таким как LangChain, уже присущи концепции совместного использования и сетевого эффекта, область искусственных интеллектуальных агентов все еще находится на раннем этапе развития. В настоящее время неясно, каким будет окончательное состояние этих систем, и нет способа зафиксировать рынок.

Экономика криптовалют открывает новые возможности для построения, управления и монетизации на основе стимулирования, которые невозможно полностью отразить в традиционной экономике SaaS или Web2. Эксперименты на этапе раннего развития могут разблокировать новые стратегии монетизации для самой системы, а не только для построенных на ней агентов.

Конкуренты

ElizaOS связана с популярным проектом AI16Z и представляет собой фреймворк на основе Typescript для создания, развертывания и управления агентами ИИ. Он разработан как Web3-дружественная операционная система для агентов с искусственным интеллектом, позволяющая разработчикам создавать прокси с уникальными личностями, гибкими инструментами для взаимодействия с блокчейном и легко масштабируемой с помощью мультиагентной системы. Rig - это среда искусственного интеллекта с открытым исходным кодом, разработанная Playgrounds Analytics Inc., построенная на языке программирования Rust, предназначенная для создания модульных и масштабируемых агентов искусственного интеллекта. Он связан с проектом AI Rig Complex (ARC). Daydreams - это фреймворк для генерации агентов, который изначально был разработан для создания автономных агентов в онлайн-играх, но затем был расширен для выполнения задач в сети.
Pippin - это фреймворк AI-агента, разработанный основателем BabyAGI Йохеем Накадзима, который призван помочь разработчикам создавать модульных и автономных цифровых помощников. Сначала Йохей создал отдельного агента, а затем расширил его до универсального фреймворка.
ZerePy - это открытый фреймворк на Python, который предназначен для развертывания автономных агентов на различных платформах и блокчейне, с акцентом на интеграцию творческого искусственного интеллекта и социальных медиа. Подобно Pippin, Zerepy изначально являлся автономным агентом Zerebro, который затем был расширен до фреймворка.

стандарт

Для оценки силы каждой структуры мы стоим на точке зрения разработчиков, которые хотят создать AI-агентов. Что их волнует? Мы считаем, что оценка на троечку очень полезна: ядро, функции и опыт разработчика.

Вы можете рассматривать ядро фреймворка как основу для создания всех остальных агентов. Если ядро слабое, медленное или не постоянно развивается, то агенты, созданные с использованием этого фреймворка, также будут ограничены. Ядро можно оценить по следующим критериям:

Цикл основного рассуждения: мозг любой агентской структуры; как он решает проблемы. Мощная структура поддерживает все, начиная с простого ввода-вывода, до сложных шаблонов, таких как цепочка мыслей. Без мощной способности рассуждения агент не сможет эффективно разбираться с комплексными задачами или оценивать несколько вариантов, чтобы упростить их до блестящего чат-бота.
Механизм памяти: Агентам нужна как краткосрочная память для проведения непрерывных диалогов, так и долгосрочное хранение для получения постоянных знаний. Хорошие фреймворки не просто запоминают - они понимают отношения между различной информацией и могут определить, какую информацию стоит сохранить, а какую - забыть.
Встраивание и поддержка RAG: Современные агенты должны использовать внешние знания, такие как документы и рыночные данные. Мощный фреймворк может легко встраивать эту информацию и, используя RAG, извлекать эту информацию в контексте, таким образом, строить ответы на основе конкретных знаний, а не просто полагаться на обучение базовых моделей.
Персонализированная настройка: Важной является способность формировать способ общения сотрудников службы поддержки (тон, этикет и характер), так как это существенно влияет на участие пользователей. Хорошая структура может легко настраивать эти особенности, осознание индивидуальности сотрудников службы поддержки значительно влияет на доверие пользователей.
Координация с участием нескольких агентов: Надежная структура предоставляет встроенные шаблоны для совместной работы агентов, будь то структурированные беседы, делегирование задач или система общей памяти. Это создает команду профессионалов, каждый из которых проявляет свою уникальную способность работать вместе для решения проблем.

Помимо основной функции, реальная полезность рамки во многом зависит от ее функциональности и интеграции. Инструменты значительно расширяют реальные возможности агента. Агент с доступом только к LLM может участвовать в разговоре, но если ему предоставить доступ к веб-браузеру, он может получать информацию в реальном времени. Подключив его к вашему API календаря, он может назначать встречи. Каждый новый инструмент удваивает возможности агента. С точки зрения разработчика, чем больше инструментов, тем больше вариантов и экспериментального диапазона.

Мы оцениваем функциональность криптографического фреймворка с трех точек зрения:

Поддержка и функциональные возможности модели искусственного интеллекта: Мощный фреймворк обеспечивает нативную интеграцию с различными языковыми моделями - от серии GPT от OpenAI до открытых альтернатив, таких как Llama и Mistral. Но здесь не только LLM. Поддержка других функций и возможностей искусственного интеллекта, таких как текст в речь, использование в браузере, генерация изображений и локальный вывод моделей, может значительно расширить возможности агента. Мощная поддержка моделей становится неотъемлемым условием многих подобных фреймворков.
Поддержка инфраструктуры Web3: Для создания криптографических агентов необходимо глубокое интегрирование с инфраструктурой блокчейна. Это означает поддержку необходимых компонентов Web3, таких как кошельки для подписи транзакций, RPC для связи с цепочкой и индексаторы для доступа к данным. Мощный фреймворк должен интегрироваться с основными инструментами и сервисами всей экосистемы, начиная от рынка NFT и протоколов DeFi до решений для идентификации и уровня доступности данных.
ПОКРЫТИЕ ЦЕПИ: Поддержка инфраструктуры Web3 определяет, что агенты могут делать, а покрытие цепи определяет, где они могут это делать. Криптовалютная экосистема развивается в огромное децентрализованное множество цепей, что подчеркивает важность широкого охвата цепей.

В конечном итоге, даже самая мощная структура может быть так же хороша, как опыт разработчика. Структура может иметь первоклассные функции, но если разработчику трудно эффективно ею пользоваться, она никогда не будет широко принята.

Язык, используемый в структуре, напрямую влияет на то, кто может его использовать для построения. Python доминирует в области искусственного интеллекта и науки о данных, поэтому естественным образом становится выбором для фреймворков искусственного интеллекта. Фреймворки, написанные на малоизвестных языках, могут иметь уникальные преимущества, но могут оторвать себя от более широкой экосистемы разработчиков. JavaScript благодаря своей распространенности в веб-разработке становится еще одним мощным конкурентом, особенно для фреймворков, ориентированных на веб-интеграцию.
Четкая и всесторонняя документация - это жизненная линия для разработчиков, принимающих новые фреймворки. Это не только справочник API, хотя они также крайне важны. Мощная документация включает в себя обзор концепций, объясняющих основные принципы, пошаговые руководства, примеры кода с хорошими комментариями, обучающие уроки, руководство по устранению неполадок и установленные шаблоны проектирования.

Результат

В таблице ниже приведено суммарное рейтингование каждой структуры по определенным нами параметрам (рейтинг от 1 до 5).

! QTbxg0nhpjbbKbgJdAE0VDDYvQN3qF5biJlLAxNq.png

Хотя обсуждение причин за каждой точкой данных выходит за рамки этой статьи, ниже приведены некоторые выдающиеся впечатления, оставленные каждой структурой.

Eliza является самым зрелым фреймворком в этом списке на сегодняшний день. Учитывая, что фреймворк Eliza стал точкой контакта искусственного интеллекта в недавнем взлете криптовалютного экосистемы, его выдающейся особенностью является большое количество поддерживаемых функций и интеграций.

! ZK8bWvOX185Ygh0O1vGd5JaLPrIjlTgHtKXkXlkm.png

Из-за своей известности каждый блокчейн и инструмент разработки стараются интегрировать себя в эту структуру (на данный момент у нее почти 100 интеграций!). В то же время Eliza также привлекает больше активности разработчиков, чем большинство других структур. Eliza как минимум в краткосрочной перспективе имеет явные сетевые эффекты. Эта структура написана на TypeScript, который является зрелым языком, используемым как начинающими, так и опытными разработчиками, что дальше способствует ее развитию.

Eliza также выделяется благодаря обширному образовательному контенту и учебным пособиям, предоставляемым разработчикам для использования этой платформы.

Мы уже видели ряд агентов, использующих фреймворк Eliza, включая Spore, Eliza (агент) и Pillzumi. Новая версия фреймворка Eliza ожидается в ближайшие недели.

Подход Рига в корне отличается от подхода Элизы. Он отличается мощным, легким и высокопроизводительным ядром. Он поддерживает различные режимы вывода, включая цепочку реплик (последовательное применение подсказок), оркестрацию (координацию нескольких агентов), условную логику и параллелизм (параллельное выполнение операций).

Однако сам Rig не имеет такого обширного интеграционного набора. Вместо этого он использует другой подход, который команда называет "Arc Handshake". Здесь команда Arc сотрудничает с различными качественными командами из Web2 и Web3 для расширения функциональности Rig. Некоторые из этих партнерств включают сотрудничество с Soulgraph по разработке персонализированных агентов, а также с Listen и Solana Agent Kit по разработке функций блокчейна.

Тем не менее, у Rig есть два недостатка. Во-первых, он написан на Rust, и хотя он обладает отличной производительностью, его знают относительно мало разработчиков. Во-вторых, мы видели ограниченное количество агентов, работающих на основе Rig в реальных приложениях (за исключением AskJimmy), что затрудняет оценку реальной ситуации с принятием разработчиками.

Перед тем, как начать Daydreams, lordOfAFew, основатель, был основным участником фреймворка Eliza. Это позволило ему познакомиться с ростом этого фреймворка, а, что более важно, с некоторыми недостатками. Отличие Daydreams от других фреймворков заключается в том, что он фокусируется на цепочке мыслей для рассуждения с целью помочь агентам достичь долгосрочных целей. Это означает, что когда у агента есть высокоуровневая и сложная цель, он проводит многоэтапное рассуждение, выдвигает различные действия, принимает или отклоняет их в зависимости от того, помогут ли они достичь цели, и продолжает этот процесс для продвижения вперед. Это делает агентов, созданных с использованием Daydreams, по-настоящему автономными.

Основатель оказал влияние на этот подход своим опытом в создании игровых проектов. Игры, особенно цепочечные, являются идеальной почвой для тренировки агентов и проверки их способностей. Неудивительно, что некоторые из ранних применений агента Daydreams были в играх типа Pistols, Istarai и PonziLand.

Эта платформа также обладает мощной реализацией многопосреднического сотрудничества и оркестровки рабочих процессов.

Как и в случае с Daydreams, Pippin также поздно начинает обрамлять игры. Мы подробно описали его релиз в этом посте. В основе видения Йохэя лежит идея о том, чтобы агенты были «цифровым присутствием», которое может работать интеллектуально и автономно, имея доступ к нужным инструментам. Это видение воплощено в простом, но элегантном ядре Пиппина. С помощью всего нескольких строк кода вы можете создать сложный агент, который может работать автономно или даже писать код для себя.

! MAHfGrrIS2Xy6VWc4t47Sxn3wWWKjZDbLKoRAGAb.png

Недостатком этой рамки является то, что в ней даже отсутствуют такие базовые функции, как векторные вложения и рабочий процесс RAG. Он также поощряет разработчиков использовать стороннюю библиотеку Composio для большинства интеграций. По сравнению с другими обсуждаемыми до сих пор рамками, она совершенно недостаточно зрелая.

Некоторые прокси, построенные с использованием Pippin, включают Ditto и Telemafia.

Zerepy имеет относительно простую основную реализацию. Он эффективно выбирает одну задачу из набора настроенных задач и выполняет ее при необходимости. Однако ему не хватает сложных режимов рассуждения, таких как направленное на цель или планирование цепочки мыслей.

Несмотря на то, что он поддерживает вызовы вывода для нескольких LLM, в нем отсутствует внедрение или реализация RAG. В нем также отсутствуют какие-либо примитивы для памяти или координации нескольких агентов.

Это отражается на уровне принятия Zerepy отсутствием основных функций и интеграцией. Мы еще не видели ни одного реального агента, использующего эту платформу.

! jfKrVvasyMpTHCKaLZGOL1iDN1UqQkngP4aTwhrw.png

Использование фреймворка для построения

Если все это звучит слишком технически и теоретически, мы не виним вас. Более простой вопрос: “Могу ли я использовать эти фреймворки для создания какого-то агента, не писать массу кода самому?”.

Для оценки этих структур в практике мы определили пять распространенных типов агентов, которые разработчики часто хотят создавать. Они представляют различную сложность и тестируют различные аспекты функциональности каждой структуры.

Document Chat Agent: Протестируйте основные функции RAG, включая обработку документов, обслуживание контекста, точность ссылок и управление памятью. Этот тест показывает способность платформы перемещаться между истинным пониманием документов и простым сопоставлением шаблонов.
** Чат-бот: ** Оценка системы памяти и согласованности поведения. Эта структура должна сохранять согласованные индивидуальные характеристики, запоминать ключевую информацию в разговоре и позволять настройку личности, по существу превращая бесстатусного чат-бота в постоянную цифровую сущность.
Торговый робот на цепи: он проводит тестирование нагрузки внешних интеграций, обрабатывая реальные рыночные данные, осуществляя межцепочные сделки, анализируя социальное настроение и применяя торговые стратегии. Это показывает, какая сложная инфраструктура блокчейна и API соединения обрабатывается в этой рамке.
NPC игры: Несмотря на то, что мир начал обращать внимание на агентов только в прошлом году, агенты как неконтролируемые игроки в играх играли ключевую роль десятилетиями. Агенты игр развиваются от агентов, основанных на правилах, к интеллектуальным агентам, управляемым LLM, и остаются основным примером использования фреймворка. Здесь мы проверяем способность агентов понимать среду, самостоятельно делать выводы о сценариях и достигать долгосрочных целей.
Голосовой помощник: Оценка реального времени обработки и пользовательского опыта на основе обработки речи, быстрого времени ответа и интеграции с платформой передачи сообщений. Это тестирует, может ли фреймворк поддерживать по-настоящему интерактивные приложения, а не только простую модель запроса-ответа.

Мы дали оценку от 1 до 5 для каждого фреймворка по каждому типу агента. Вот их производительность:

! [texgEesLgKZk5FxG1Dv8uWFaehDt7zDrzfEzGeu1.png](https://img.gateio.im/social/moments-321762592d50c41aa7fb3b003016197f «7350971 )

Метрики с открытым исходным кодом

! O8m4ShXL3jqjBDkDuKi9liuV2S1kBT3x5oqoX8dd.png

При оценке этих фреймворков большинство аналитиков уделяют большое внимание метрикам GitHub, таким как звезды и вилки. Здесь мы вкратце рассмотрим, что это за метрики и в какой степени они указывают на качество фреймворка.

Звезды служат наиболее явным сигналом популярности. Они в сущности являются закладками, которые разработчики ставят на проекты, которые, по их мнению, интересны или требуют отслеживания. Хотя большое количество звезд указывает на широкое распространение осведомленности и интерес, это может привести к заблуждению. Иногда проекты накапливают звезды скорее через маркетинг, чем благодаря технической ценности. Следует рассматривать звезды как социальное подтверждение, а не как стандарт качества.

Число форков показывает, сколько разработчиков создали копию своего репозитория кода для развития на его основе. Большее количество форков обычно указывает на активное использование и расширение проекта. Другими словами, многие форки в конечном итоге оказываются заброшенными, поэтому исходное число форков требует контекста.

Количество участников показывает, сколько разных разработчиков на самом деле отправили код в проект. Часто это имеет больше смысла, чем звезда или вилка. Здоровое регулярное количество участников указывает на то, что у проекта есть активное сообщество, которое поддерживает и улучшает его.

Мы шагнули дальше и разработали собственный показатель - балл участника. Мы оцениваем открытую историю каждого разработчика, включая их прошлый вклад в другие проекты, частоту активности и популярность их учетной записи, чтобы назначить балл каждому участнику. Затем мы находим среднее значение всех участников проекта и взвешиваем их в зависимости от количества их вкладов.

Что эти числа означают для нашей структуры?

В большинстве случаев количество звезд можно игнорировать. Они не являются существенным показателем принятия. Исключением является Eliza, которая в своё время стала самым популярным хранилищем тенденций на GitHub, что соответствует её статусу точки Шерлинга для всех криптографических искусственных интеллектов. Кроме того, известные разработчики, такие как 0xCygaar, также внесли свой вклад в этот проект. Это также отражается в количестве участников - Eliza привлекла в 10 раз больше участников, чем другие проекты.

Кроме того, для нас интересны мечты наяву только потому, что они привлекают качественных разработчиков. Как новичок, запущенный после пика популярности, он не получил выгоды от сетевого эффекта Eliza.

Что дальше? **

Если вы разработчик, мы надеемся, что хотя бы сможем предоставить вам отправную точку для выбора фреймворка (если вам это нужно). Тем не менее, вам все равно придется усердно тестировать, подходит ли основное рассуждение и интеграция каждого фреймворка для вашего использования. Это неизбежно.

С точки зрения наблюдателя важно помнить, что все эти фреймворки искусственного интеллекта не старше трех месяцев. (Да, они чувствуют себя дольше.) За это время они прошли путь от чрезмерной рекламы до так называемых «замков в небе». Вот в чем суть технологии. Несмотря на эту волатильность, мы верим, что это интересный и долговременный новый эксперимент в области криптографии.

Далее важно, как эти структуры зреют в техническом и монетизационном аспектах.

По техническим аспектам, основное преимущество, которое фреймворк может создать для себя, заключается в том, что он позволяет агентам взаимодействовать на цепи без проблем. Это является первостепенной причиной выбора разработчиками криптографического нативного фреймворка, а не универсального фреймворка. Кроме того, проблемы агентов и технологии построения агентов являются ведущими техническими вопросами во всем мире, и каждый день появляются новые разработки. Фреймворк также должен постоянно развиваться и адаптироваться к этим изменениям.

Как рамка может сделать монетизацию более интересной. В эти ранние дни создание стартовой платформы, вдохновленной Virtuals, является легкодоступным плодом проекта. Но мы считаем, что здесь есть много места для экспериментов. Мы движемся к будущему со множеством миллионов агентов, специализирующихся на различных областях, которые можно себе представить. Инструменты, помогающие им эффективно координироваться, могут извлечь огромную ценность из комиссий за сделки. Как ворота для строителей, рамка, конечно, наилучшим образом подходит для извлечения этой ценности.

В то же время вопрос монетизации фреймворка маскируется как проблема монетизации проектов с открытым исходным кодом и вознаграждение вкладчиков, которые исторически занимаются бесплатной, неблагодарной работой. Если команда сможет раскроить, как создать устойчивую открытую экономику, сохраняя в то же время код своего базового духа, ее влияние будет значительно превышать рамки агентского фреймворка.

Это темы, которые мы надеемся исследовать в течение следующих нескольких месяцев.

ELIZA-4.76%

Посмотреть Оригинал

Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».