Perebutan Kerangka AI Agent: Eliza, Rig, Daydreams siapakah yang lebih unggul

Penulis: Shlok Khemani, Oliver Jaros Sumber: Decentralised.co Terjemahan: Shanooba, Golden Finance

Artikel hari ini adalah penjelasan tentang kerangka agen, serta evaluasi perkembangan mereka. Ini juga permintaan proposal untuk para pendiri yang bekerja di bidang lintas mata uang internet (kripto) dan agen.

Selama setahun terakhir, Decentralised.co telah mendalami bidang perpotongan kripto dan kecerdasan buatan. Bahkan kami telah membangun produk yang digunakan oleh lebih dari 70.000 orang, untuk melacak agen kecerdasan buatan dan infrastruktur agen. Meskipun kegilaan di sekitar bidang ini telah mereda dalam beberapa minggu terakhir, dampak kecerdasan buatan terhadap teknologi dan masyarakat adalah sesuatu yang belum pernah kita lihat sejak internet diciptakan. Jika mata uang kripto akan menjadi jalur keuangan masa depan, seperti yang kami prediksi, maka keterkaitannya dengan kecerdasan buatan akan menjadi tema yang muncul berulang kali, bukan hanya sekali saja.

Salah satu kategori proyek yang menarik yang muncul dari gelombang ini adalah kerangka agen kecerdasan buatan asli kripto. Mereka adalah eksperimen yang menarik, membawa prinsip inti blockchain - transfer nilai tanpa izin, transparansi, dan insentif yang konsisten - ke dalam pengembangan kecerdasan buatan. Sifat sumber terbuka mereka memberi kita kesempatan langka untuk melihat bagaimana mereka beroperasi, tidak hanya menganalisis janji-janji mereka, tetapi juga cara kerja mereka secara aktual.

Dalam artikel ini, pertama-tama kami menganalisis makna sebenarnya dari kerangka agen serta pentingnya. Kemudian, kami menangani masalah yang jelas: mengapa kita perlu kerangka asli terenkripsi ketika pilihan matang seperti LangChain sudah ada? Dengan ini, kami menganalisis kerangka asli terenkripsi terkemuka dan keunggulan serta keterbatasannya dalam berbagai kasus penggunaan. Terakhir, jika Anda sedang membangun agen kecerdasan buatan, kami akan membantu Anda memutuskan kerangka mana yang mungkin cocok dengan kebutuhan Anda. Atau apakah Anda harus menggunakan kerangka untuk membangun.

Mari kita telusuri lebih lanjut.

Abstrak

"Kemajuan peradaban terletak pada peningkatan jumlah tindakan penting yang dapat kita lakukan tanpa berpikir panjang." - Alfred North Whitehead

Bayangkan bagaimana nenek moyang kita hidup. Setiap keluarga harus menanam makanan mereka sendiri, membuat pakaian mereka sendiri, dan membangun tempat tinggal mereka sendiri. Mereka menghabiskan begitu banyak waktu untuk tugas-tugas dasar kelangsungan hidup, hampir tidak ada waktu untuk hal lain. Bahkan dua abad yang lalu, hampir 90% orang bekerja di bidang pertanian. Hari ini, kita membeli makanan dari supermarket, tinggal di rumah yang dibangun oleh para ahli, dan mengenakan pakaian yang diproduksi di pabrik-pabrik jauh. Tugas yang memakan waktu beberapa generasi telah berubah menjadi transaksi sederhana. Saat ini, hanya 27% populasi global yang bekerja di sektor pertanian (di negara maju, angkanya turun di bawah 5%).

Ketika kita mulai menguasai sebuah teknologi baru, pola yang akrab akan muncul. Pertama, kita memahami prinsip-prinsip dasar - apa yang efektif, apa yang tidak, dan pola-pola mana yang terus muncul. Begitu pola-pola ini menjadi jelas, kita mengemasnya ke dalam abstraksi yang lebih mudah, lebih cepat, dan lebih dapat diandalkan. Abstraksi ini membebaskan waktu dan sumber daya untuk mengatasi tantangan yang lebih beragam dan bermakna. Hal yang sama berlaku dalam membangun perangkat lunak.

cfpYG94rSxhzdHHC3T4K0tAk7UApcvUMQoqb5hCa.png

Sebagai contoh pengembangan web. Pada awalnya, pengembang perlu menulis segalanya dari awal - menangani permintaan HTTP, mengelola status, dan membuat UI - tugas-tugas ini rumit dan memakan waktu. Kemudian muncul kerangka kerja seperti React yang sangat mempermudah tantangan ini dengan menyediakan abstraksi yang berguna. Pengembangan mobile juga mengikuti jalur yang serupa. Pada awalnya, pengembang memerlukan pengetahuan yang dalam dan spesifik terkait platform, sampai munculnya alat seperti React Native dan Flutter, yang memungkinkan mereka menulis kode sekali dan mendeploy di mana saja.

Pola abstraksi serupa juga muncul dalam pembelajaran mesin. Pada awal tahun 2000-an, para peneliti menemukan potensi GPU dalam beban kerja ML. Awalnya, pengembang harus berurusan dengan elemen grafis dan bahasa seperti GLSL OpenGL - alat-alat tersebut tidak dirancang untuk komputasi umum. Pada tahun 2006, Nvidia memperkenalkan CUDA, membuat pemrograman GPU menjadi lebih mudah dan membawa pelatihan ML ke lebih banyak pengembang, semuanya berubah.

Dengan meningkatnya momentum pengembangan ML, muncul kerangka kerja khusus untuk mengabstraksi kompleksitas pemrograman GPU. TensorFlow dan PyTorch memungkinkan pengembang untuk fokus pada arsitektur model, bukan terjebak dalam kode GPU tingkat rendah atau detail implementasi. Ini mempercepat iterasi arsitektur model, serta kemajuan cepat yang kita lihat dalam AI/ML selama beberapa tahun terakhir.

Sekarang kita melihat evolusi agen kecerdasan buatan yang mirip - sebuah perangkat lunak yang mampu membuat keputusan dan bertindak untuk mencapai tujuan, seperti asisten atau karyawan manusia. Ini menggunakan model bahasa berukuran besar sebagai 'otak'nya, dan dapat menggunakan berbagai alat, seperti menjelajahi web, melakukan panggilan API, atau mengakses basis data untuk menyelesaikan tugas.

Untuk membangun agen dari awal, pengembang harus menulis kode kompleks untuk menangani setiap aspek: bagaimana agen memikirkan masalah, bagaimana memutuskan penggunaan alat apa dan kapan, bagaimana berinteraksi dengan alat-alat tersebut, bagaimana mengingat konteks interaksi awal, dan bagaimana memecah tugas besar menjadi langkah-langkah yang dapat dikelola. Setiap pola harus diselesaikan secara terpisah, menyebabkan pekerjaan berulang dan hasil yang tidak konsisten.

Ini adalah tempat di mana kerangka agen kecerdasan buatan digunakan. Sama seperti React menyederhanakan pengembangan web dengan menangani bagian yang rumit dari pembaruan UI dan manajemen status, kerangka-kerangka ini mengatasi tantangan umum dalam membangun agen kecerdasan buatan. Mereka menyediakan komponen siap pakai untuk pola efektif yang kami temukan, seperti bagaimana membangun proses keputusan agen, mengintegrasikan berbagai alat, dan menjaga konteks dalam beberapa interaksi.

Dengan menggunakan kerangka kerja, pengembang dapat fokus pada aspek unik dari agennya - fungsionalitas dan kasus penggunaannya - daripada membangun ulang komponen dasar tersebut. Mereka dapat membuat agen kecerdasan buatan yang kompleks dalam beberapa hari atau minggu, bukan dalam beberapa bulan, lebih mudah mencoba pendekatan yang berbeda, dan mengadopsi praktik terbaik yang ditemukan oleh pengembang lain dan komunitas.

Untuk lebih memahami pentingnya kerangka kerja, pertimbangkan pengembang yang membangun agen untuk membantu dokter meninjau laporan medis. Jika tanpa kerangka kerja, mereka perlu menulis ulang semua kode dari awal: mengelola lampiran email, mengekstrak teks dari PDF, memasukkan teks ke LLM dengan format yang benar, mengelola riwayat percakapan untuk melacak konten yang sudah dibahas, dan memastikan agen memberikan respons yang tepat. Untuk tugas yang bukan merupakan kasus penggunaan khususnya, ini merupakan sejumlah kode yang kompleks.

Dengan kerangka agen, banyak blok bangunan ini dapat digunakan langsung. Kerangka ini menangani pembacaan email dan PDF, menyediakan pola untuk membangun petunjuk pengetahuan medis, mengelola alur percakapan, bahkan membantu melacak detail penting dari beberapa percakapan. Pengembang dapat fokus pada membuat agennya menjadi berbeda, seperti menyempurnakan petunjuk analisis medis atau menambahkan pemeriksaan keamanan khusus untuk diagnosis, daripada menciptakan pola umum dari awal. Konten yang mungkin awalnya memerlukan beberapa bulan untuk dibangun dari awal, sekarang dapat diselesaikan dalam beberapa hari untuk prototipe.

LangChain telah menjadi Swiss Army knife untuk pengembangan kecerdasan buatan, menyediakan toolkit yang fleksibel untuk membangun aplikasi berbasis LLM. Meskipun bukan kerangka agen secara ketat, namun menyediakan blok dasar untuk membangun sebagian besar kerangka agen, mulai dari rantai untuk pengurutan panggilan LLM hingga sistem memori untuk memelihara konteks. Ekosistem integrasi yang luas dan dokumentasi yang kaya menjadikannya titik awal yang disukai oleh pengembang yang ingin membangun aplikasi kecerdasan buatan yang berguna.

Kemudian ada kerangka multi-agent seperti CrewAI dan AutoGen yang memungkinkan pengembang membangun sistem di mana beberapa agen kecerdasan buatan dapat bekerja sama, masing-masing dengan peran dan kemampuan uniknya. Kerangka-kerangka ini tidak hanya mengeksekusi tugas secara berurutan, tetapi menekankan kerja sama agen kecerdasan melalui percakapan untuk bersama-sama menyelesaikan masalah.

SXYgyuC4qnpplO0idJXnSanSo3OXAp1TMMrHtspG.png

Misalnya, ketika mengalokasikan laporan penelitian, satu agen mungkin menguraikan strukturnya, agen lain mungkin mengumpulkan informasi terkait, dan agen ketiga mungkin memberikan komentar dan menyempurnakan draf akhir. Ini seperti membentuk tim virtual di mana agen kecerdasan buatan dapat berdiskusi, berdebat, dan bersama-sama meningkatkan solusi. Cara kerja kolaboratif ini untuk mencapai tujuan tingkat tinggi dalam sistem multi-agen yang disebut sebagai 'klaster' agen kecerdasan buatan.

AutoGPT, meskipun bukan kerangka tradisional, namun menciptakan konsep agen kecerdasan buatan mandiri. Ini menunjukkan bagaimana kecerdasan buatan menerima tujuan tingkat tinggi, memecahkannya menjadi tugas-tugas anak, dan menyelesaikannya secara mandiri dengan sedikit masukan manusia. Meskipun memiliki keterbatasan, AutoGPT telah memicu gelombang inovasi agen mandiri dan memengaruhi desain kerangka yang lebih terstruktur di masa yang akan datang.

Tapi mengapa ini terenkripsi?

Semua latar belakang ini pada akhirnya membawa kita pada munculnya kerangka kerja proxy AI crypto-native. Pada titik ini, Anda mungkin bertanya-tanya, mengapa Web3 membutuhkan kerangka kerjanya sendiri ketika kita memiliki kerangka kerja yang relatif matang seperti Langchain dan CrewAI di Web2? Tentunya, pengembang dapat menggunakan kerangka kerja yang ada ini untuk membangun proxy apa pun yang mereka inginkan? Kecurigaan ini dibenarkan mengingat kecenderungan industri untuk memaksakan Web3 pada setiap dan semua narasi.

Kami percaya, ada tiga alasan yang memadai untuk keberadaan kerangka agen khusus Web3.

Agen Keuangan yang Berjalan di Atas Rantai

Kami percaya bahwa sebagian besar transaksi keuangan di masa depan akan dilakukan di atas jalur blockchain. Hal ini mempercepat permintaan untuk jenis agen kecerdasan buatan yang dapat menganalisis data blockchain, menjalankan transaksi blockchain, serta mengelola aset digital melintasi berbagai protokol dan jaringan. Mulai dari robot perdagangan otomatis yang dapat mendeteksi peluang arbitrase hingga manajer portofolio investasi yang melaksanakan strategi penghasilan, semua agen ini bergantung pada integrasi mendalam fungsionalitas blockchain dalam alur kerja inti mereka.

UgKQjpORqg52fRAWEK0NlemKNxv7W03vfqHNYVkj.png

Kerangka Web2 tradisional tidak menyediakan komponen asli untuk tugas-tugas ini. Anda harus merangkai pustaka pihak ketiga untuk berinteraksi dengan kontrak pintar, menganalisis peristiwa rantai yang asli, dan mengelola kunci pribadi - yang memperkenalkan kompleksitas dan kerentanan potensial. Sebaliknya, kerangka Web3 khusus dapat menangani fungsi-fungsi ini secara siap pakai, memungkinkan pengembang untuk fokus pada logika dan strategi agennya, bukan bertarung dengan saluran rantai blok tingkat rendah.

Koordinasi dan insentif asli

Blockchain tidak hanya melibatkan mata uang digital. Mereka menyediakan sistem pencatatan global yang minim kepercayaan, dengan alat keuangan bawaan yang dapat meningkatkan koordinasi multi-agen. Pengembang dapat menggunakan primitif on-chain (seperti penyetoran, kustodian, dan kolam insentif) untuk mengkoordinasikan kepentingan multi-agen AI, bukan bergantung pada reputasi off-chain atau database terisolasi.

Bayangkan sekelompok agen bekerja sama untuk menyelesaikan tugas kompleks (misalnya, melakukan pelabelan data untuk melatih model baru). Kinerja setiap agen dapat dilacak secara transparan di rantai, dan hadiah dapat dialokasikan secara otomatis berdasarkan kontribusi. Transparansi dan ketahanan sistem berbasis blockchain memungkinkan pembagian imbalan yang adil, pelacakan reputasi yang lebih kuat, dan skema insentif yang berkembang secara real-time.

Kerangka asli kriptografi dapat disematkan secara eksplisit dengan fungsi-fungsi ini, memungkinkan pengembang menggunakan desain kontrak pintar untuk struktur insentif tanpa perlu mendesain ulang roda setiap kali diperlukan untuk memercayakan atau membayar ke agen lain.

Peluang baru di pasar awal

Meskipun kerangka seperti LangChain memiliki konsep berbagi pikiran dan efek jaringan, namun domain agen kecerdasan buatan masih dalam tahap awal. Saat ini belum jelas bagaimana akhir dari sistem-sistem ini akan terlihat, dan tidak ada cara untuk mengunci pasar.

Ekonomi kripto mendorong pembangunan, pengelolaan, dan cara monetisasi berbasis insentif membuka kemungkinan baru yang tidak sepenuhnya dapat dipetakan ke ekonomi SaaS atau Web2 tradisional. Eksperimen pada tahap awal ini dapat membuka strategi monetisasi baru bagi kerangka itu sendiri, bukan hanya agen yang dibangun di atas kerangka.

Pesaing

  1. ElizaOS terkait dengan proyek populer AI16Z, adalah kerangka kerja berbasis Typescript yang digunakan untuk membuat, mendeploy, dan mengelola agen AI. Ini dirancang sebagai sistem operasi agen AI yang ramah Web3, memungkinkan pengembang membangun agen dengan kepribadian unik, alat yang fleksibel untuk interaksi blockchain, dan mudah diperluas melalui sistem multi-agen.
  2. Rig adalah kerangka kerja agen AI sumber terbuka yang dikembangkan oleh Playgrounds Analytics Inc., dibangun menggunakan bahasa pemrograman Rust untuk membuat agen AI modular dan terukur. Ini terkait dengan proyek (ARC) AI Rig Complex. Daydreams adalah kerangka agen generatif yang awalnya dibuat untuk menciptakan agen otonom untuk permainan berbasis rantai, tetapi kemudian diperluas untuk menjalankan tugas di rantai.
  3. Pippin adalah kerangka agen kecerdasan buatan BabyAGI yang dikembangkan oleh pendiri Yohei Nakajima, yang bertujuan untuk membantu pengembang menciptakan asisten digital modular dan otonom. Yohei pertama-tama membangun agen mandiri, kemudian memperluasnya menjadi kerangka umum.
  4. ZerePy adalah kerangka kerja Python sumber terbuka yang dirancang untuk implementasi agen mandiri melintasi berbagai platform dan blockchain, dengan fokus pada integrasi kecerdasan buatan kreatif dan media sosial. Seperti Pippin, Zerepy awalnya adalah agen independen Zerebro, yang kemudian berkembang menjadi sebuah kerangka kerja.

Standar

Untuk mengevaluasi kekuatan setiap kerangka kerja, mari kita tempatkan diri kita pada posisi pengembang yang ingin membangun agen AI. Apa yang akan mereka pedulikan? Kami pikir berguna untuk membagi penilaian menjadi tiga kategori utama: Inti, Fitur, dan Pengalaman Pengembang.

Anda dapat menganggap inti kerangka sebagai dasar untuk membangun semua agen lainnya. Jika inti lemah, lambat, atau tidak berkembang, maka agen yang dibuat dengan kerangka ini akan mengalami batasan yang sama. Inti dapat dievaluasi berdasarkan kriteria berikut:

  1. Siklus Pemikiran Inti: Otak dari kerangka agen apa pun; bagaimana itu memecahkan masalah. Kerangka yang kuat mendukung segalanya mulai dari aliran masukan-keluaran dasar hingga pola pikir yang kompleks. Tanpa kemampuan penalaran yang kuat, agen tidak dapat efektif dalam mendekomposisi tugas yang kompleks atau mengevaluasi beberapa pilihan, sehingga menyederhanakannya menjadi mesin obrolan yang menawan.
  2. Mekanisme Memori: Agensi memerlukan memori jangka pendek untuk berkomunikasi secara berkelanjutan, serta memerlukan penyimpanan jangka panjang untuk memperoleh pengetahuan yang bertahan lama. Kerangka yang baik tidak hanya mengingat - mereka memahami hubungan antara informasi yang berbeda, dan dapat memprioritaskan informasi mana yang layak disimpan, dan mana yang harus dilupakan.
  3. Penyematan dan dukungan RAG: Agen modern harus menggunakan pengetahuan eksternal, seperti dokumentasi dan data pasar. Kerangka kerja yang kuat memudahkan untuk menanamkan informasi ini dan mengambilnya secara kontekstual melalui RAG, mendasarkan tanggapan pada pengetahuan tertentu, daripada hanya mengandalkan pelatihan model dasar.
  4. Konfigurasi Kepribadian: Kemampuan untuk membentuk cara komunikasi agen layanan pelanggan (tonasi, etiket, dan kepribadian) sangat penting untuk keterlibatan pengguna. Kerangka yang baik dapat dengan mudah mengkonfigurasi fitur-fitur ini, menyadari bahwa kepribadian agen layanan pelanggan akan signifikan mempengaruhi kepercayaan pengguna.
  5. Koordinasi Multi-Agen: Kerangka kerja yang kuat menyediakan pola bawaan untuk kerjasama agen, baik melalui percakapan terstruktur, penugasan tugas, maupun sistem memori bersama. Ini dapat menciptakan tim profesional di mana setiap agen dapat menggunakan kemampuannya yang unik untuk memecahkan masalah bersama.

Selain fungsi inti, manfaat praktis kerangka kerja sangat bergantung pada fungsionalitas dan integrasinya. Alat secara signifikan memperluas fungsi agen. Agen yang hanya memiliki akses LLM dapat berpartisipasi dalam percakapan, tetapi jika diberi izin untuk mengakses browser web, maka bisa mendapatkan informasi real-time. Menghubungkannya ke API kalender Anda, maka dapat mengatur pertemuan. Setiap alat baru secara signifikan meningkatkan fungsionalitas agen. Dari sudut pandang pengembang, semakin banyak alat yang ada, semakin besar pilihan dan cakupan eksperimen.

Kami mengevaluasi fungsi kerangka kerja asli kripto dari tiga dimensi:

  1. Dukungan dan Fungsi Model Kecerdasan Buatan (AI): Kerangka kerja yang kuat menyediakan integrasi asli dengan berbagai model bahasa - mulai dari seri GPT OpenAI hingga solusi pengganti sumber terbuka seperti Llama dan Mistral. Namun ini bukan hanya tentang LLM. Dukungan untuk fungsi AI lainnya seperti konversi teks ke suara, penggunaan browser, pembangkitan gambar, dan inferensi model lokal dapat secara signifikan memperluas fungsionalitas agen. Dukungan model yang kuat sedang menjadi syarat penting bagi banyak kerangka kerja semacam ini.
  2. Dukungan Infrastruktur Web3: Membangun agen kripto memerlukan integrasi yang mendalam dengan infrastruktur blockchain. Ini berarti mendukung komponen Web3 yang diperlukan, seperti dompet untuk menandatangani transaksi, RPC untuk komunikasi rantai, dan indeks untuk mengakses data. Kerangka kerja yang kuat harus terintegrasi dengan alat dan layanan dasar seluruh ekosistem, mulai dari pasar NFT dan protokol DeFi hingga solusi identitas dan lapisan ketersediaan data.
  3. Penutupan Rantai: Dukungan infrastruktur dasar Web3 menentukan apa yang dapat dilakukan agen, sementara penutupan rantai menentukan di mana mereka dapat beroperasi. Ekosistem kripto sedang berkembang menjadi sesuatu yang terdesentralisasi dan multi-rantai yang besar, menekankan pentingnya cakupan rantai yang luas.

Terakhir, bahkan kerangka terkuat pun hanya sebaik pengalaman pengembang. Sebuah kerangka dapat memiliki fitur kelas satu, tetapi jika pengembang kesulitan menggunakan dengan efektif, itu tidak akan pernah diterima secara luas.

  1. Bahasa yang digunakan dalam kerangka kerja secara langsung mempengaruhi siapa yang dapat menggunakannya untuk membangun. Python mendominasi dalam bidang kecerdasan buatan dan ilmu data, sehingga secara alami menjadi pilihan kerangka kerja kecerdasan buatan. Kerangka kerja yang ditulis dengan bahasa yang kurang populer mungkin memiliki keunggulan unik, tetapi dapat membuatnya terisolasi dari ekosistem pengembang yang lebih luas. Ketersebaran JavaScript dalam pengembangan web membuatnya menjadi pesaing yang kuat lainnya, terutama bagi kerangka kerja yang ditujukan untuk integrasi web. Dokumen yang jelas dan komprehensif adalah nyawa bagi pengembang yang mengadopsi kerangka kerja baru. Ini bukan hanya referensi API, meskipun hal-hal tersebut juga sangat penting. Dokumen yang kuat meliputi ringkasan konsep inti, tutorial langkah demi langkah, kode contoh yang terkomentari dengan baik, tutorial pendidikan, panduan pemecahan masalah, dan pola desain yang telah mapan.

Hasil

Tabel di bawah ini merangkum kinerja masing-masing kerangka dalam parameter yang baru saja kita tentukan (peringkat 1-5).

! QTbxg0nhpjbbKbgJdAE0VDDYvQN3qF5biJlLAxNq.png

Meskipun membahas alasan di balik setiap titik data melebihi lingkup artikel ini, berikut adalah beberapa impresi menonjol yang ditinggalkan oleh setiap kerangka.

Eliza adalah kerangka kerja paling matang dalam daftar ini sejauh ini. Mengingat kerangka kerja Eliza telah menjadi titik silang kecerdasan buatan dalam gelombang agen terbaru dalam ekosistem kripto, salah satu fitur unggulannya adalah banyaknya fitur dan integrasi yang didukung.

ZK8bWvOX185Ygh0O1vGd5JaLPrIjlTgHtKXkXlkm.png

Karena popularitasnya, setiap blockchain dan alat pengembangan berlomba-lomba untuk mengintegrasikan diri ke dalam kerangka kerja ini (saat ini memiliki hampir 100 integrasi!). Pada saat yang sama, Eliza juga menarik lebih banyak aktivitas pengembang daripada kebanyakan kerangka lainnya. Eliza setidaknya dalam jangka pendek mendapat manfaat dari beberapa efek jaringan yang sangat jelas. Kerangka kerja ini ditulis menggunakan TypeScript, yang merupakan bahasa yang matang dan digunakan baik oleh pemula maupun pengembang berpengalaman, yang lebih lanjut mendorong perkembangannya.

Eliza juga menonjol karena konten pendidikan dan panduan kaya yang diberikan kepada pengembang untuk menggunakan kerangka kerja ini.

Kami telah melihat serangkaian agen menggunakan kerangka Eliza, termasuk Spore, Eliza (agen), dan Pillzumi. Versi terbaru kerangka Eliza diharapkan akan dirilis dalam beberapa minggu mendatang.

Metode Rig sangat berbeda dengan metode Eliza. Ini unggul dengan inti yang kuat, ringan, dan kinerja tinggi. Ini mendukung berbagai mode penalaran, termasuk rantai petunjuk (aplikasi berurutan petunjuk), pengaturan (koordinasi agen ganda), logika kondisional, dan paralelisme (operasi eksekusi bersamaan).

Namun, Rig itu sendiri tidak memiliki integrasi yang sangat kaya. Sebaliknya, itu mengadopsi pendekatan yang berbeda yang tim sebut sebagai "Arc Handshake". Di sini, tim Arc bekerja sama dengan berbagai tim berkualitas tinggi dari Web2 dan Web3 untuk memperluas fungsionalitas Rig. Beberapa kolaborasi termasuk bermitra dengan Soulgraph untuk mengembangkan agen kepribadian, serta bermitra dengan Listen dan Solana Agent Kit untuk mengembangkan fitur blockchain.

Meskipun demikian, Rig memiliki dua kelemahan. Pertama-tama, ini ditulis dalam Rust, dan meskipun sangat berkinerja, relatif sedikit pengembang yang mengenalnya. Kedua, kami hanya melihat sejumlah agen bertenaga rig dalam aplikasi dunia nyata (dengan pengecualian AskJimmy), yang membuatnya sulit untuk menilai adopsi pengembang nyata.

Sebelum memulai Daydreams, pendiri lordOfAFew adalah kontributor utama kerangka Eliza. Ini mengeksposnya pada pertumbuhan kerangka kerja dan, yang lebih penting, pada beberapa kekurangannya. Apa yang membedakan Daydreams dari kerangka kerja lain adalah bahwa ia berfokus pada penalaran rantai pikiran untuk membantu agen mencapai tujuan jangka panjang. Ini berarti bahwa ketika diberi tujuan tingkat tinggi dan kompleks, agen terlibat dalam penalaran multi-langkah, mengusulkan berbagai tindakan, menerima atau membuangnya berdasarkan apakah mereka berkontribusi untuk mencapai tujuan, dan melanjutkan proses untuk membuat kemajuan. Ini membuat proxy yang dibuat dengan Daydreams benar-benar otonom.

Pengaruh latar belakang pendiri dalam membangun proyek game mempengaruhi metode ini. Game, khususnya game berbasis rantai, adalah tempat yang ideal untuk melatih agen dan menguji kemampuannya. Tidak mengherankan, beberapa kasus penggunaan awal dari agen Daydreams adalah dalam game seperti Pistols, Istarai, dan PonziLand.

Kerangka ini juga memiliki implementasi kerja sama multi-agensi yang kuat dan alur kerja komposisi yang kuat.

Seperti Daydreams, Pippin juga merupakan pendatang baru dalam permainan kerangka. Kami merincikan peluncurannya dalam artikel ini. Inti dari visi Yohei adalah membuat agen menjadi 'entitas digital', yang dapat berjalan secara cerdas dan mandiri dengan mengakses alat yang tepat. Visi ini tercermin dalam inti sederhana dan elegan dari Pippin. Hanya dengan beberapa baris kode, Anda dapat membuat agen kompleks yang dapat berjalan sendiri, bahkan menulis kode untuk dirinya sendiri.

MAHfGrrIS2Xy6VWc4t47Sxn3wWWKjZDbLKoRAGAb.png

Kekurangan kerangka kerja ini adalah, bahkan kurangnya fitur dasar seperti dukungan untuk vektor pendukung dan alur kerja RAG. Itu juga mendorong pengembang untuk menggunakan pustaka pihak ketiga Composio untuk sebagian besar integrasi. Dibandingkan dengan kerangka kerja lain yang telah dibahas sejauh ini, itu sama sekali tidak cukup matang.

Beberapa agen yang dibangun dengan Pippin termasuk Ditto dan Telemafia.

Zerepy memiliki implementasi inti yang relatif sederhana. Ini efektif memilih satu tugas dari kumpulan tugas yang dikonfigurasi dan menjalankannya saat diperlukan. Namun, itu kurang dalam pola penalaran kompleks seperti yang ditemukan dalam penggerak target atau perencanaan rantai pemikiran.

Meskipun mendukung panggilan inferensi ke beberapa LLM, itu kekurangan implementasi penyisipan atau RAG. Itu juga kekurangan bahasa alami untuk memori atau koordinasi agen multipel.

Kekurangan fitur inti dan integrasi ini tercermin dalam adopsi Zerepy. Kami belum melihat agen nyata yang menggunakan kerangka kerja ini.

! jfKrVvasyMpTHCKaLZGOL1iDN1UqQkngP4aTwhrw.png

menggunakan kerangka untuk membangun

Jika semua ini terdengar sangat teknis dan teoritis, kami tidak akan menyalahkan Anda. Pertanyaan yang lebih sederhana adalah “Apa yang dapat saya bangun dengan kerangka kerja ini tanpa harus menulis banyak kode sendiri?”.

Untuk mengevaluasi kerangka kerja ini dalam praktiknya, kami telah mengidentifikasi lima jenis agen umum yang sering ingin dibangun oleh pengembang. Mereka mewakili berbagai tingkat kompleksitas dan menguji berbagai aspek fungsionalitas masing-masing kerangka kerja.

  1. **代理聊天文档:**Menguji fitur inti RAG, termasuk pemrosesan dokumen, mempertahankan konteks, keakuratan kutipan, dan manajemen memori. Pengujian ini mengungkapkan kemampuan kerangka dalam navigasi antara pemahaman dokumen yang sebenarnya dan pencocokan pola sederhana.
  2. Bot Obrolan: Evaluasi sistem memori dan konsistensi perilaku. Kerangka ini harus menjaga karakteristik kepribadian yang konsisten, mengingat informasi penting dalam percakapan, dan memungkinkan konfigurasi kepribadian, secara mendasar mengubah bot obrolan tanpa status menjadi entitas digital yang persisten.
  3. Robot Perdagangan On-Chain: Melalui pemrosesan data pasar real-time, melakukan perdagangan lintas-rantai, menganalisis sentimen sosial, dan menerapkan strategi perdagangan untuk menguji tekanan integrasi eksternal. Ini mengungkapkan bagaimana kerangka kerja menangani infrastruktur blockchain yang kompleks dan koneksi API.
  4. NPC Game: Meskipun dunia baru saja mulai memperhatikan agen dalam setahun terakhir, agen telah memainkan peran penting sebagai karakter non-pemain dalam game selama puluhan tahun (NPC). Agen game sedang bertransisi dari agen berbasis aturan menjadi agen cerdas yang didorong oleh LLM, dan tetap menjadi kasus penggunaan utama dari kerangka kerja. Di sini, kami menguji kemampuan agen untuk memahami lingkungan, melakukan penalaran mandiri tentang situasi, dan mencapai tujuan jangka panjang.
  5. Asisten Suara: Mengevaluasi pemrosesan real-time dan pengalaman pengguna melalui pemrosesan suara, waktu respons cepat, dan integrasi platform pesan. Ini menguji apakah kerangka dapat mendukung aplikasi interaktif sejati, bukan hanya mode permintaan-respons yang sederhana.

Kami memberikan peringkat 5 bintang penuh untuk setiap kerangka kerja berdasarkan jenis agen. Berikut adalah kinerjanya:

texgEesLgKZk5FxG1Dv8uWFaehDt7zDrzfEzGeu1.png

Indikator Sumber Terbuka

O8m4ShXL3jqjBDkDuKi9liuV2S1kBT3x5oqoX8dd.png

Dalam mengevaluasi kerangka kerja ini, sebagian besar analisis sangat memperhatikan metrik GitHub, seperti stars dan fork. Di sini, kami akan dengan cepat mengenalkan apa itu metrik ini dan sejauh mana mereka mencerminkan kualitas kerangka kerja.

Bintang adalah sinyal popularitas yang paling jelas. Pada dasarnya, mereka adalah bookmark yang diberikan oleh pengembang untuk proyek yang menarik bagi mereka atau ingin mereka lacak. Meskipun jumlah bintang tinggi menunjukkan kesadaran dan minat yang luas, namun hal itu bisa menyesatkan. Terkadang proyek mengumpulkan bintang melalui pemasaran daripada nilai teknis. Pertimbangkan bintang sebagai bukti sosial, bukan sebagai standar pengukuran kualitas.

Fork count tells you how many developers have created a copy of their code repository to build on it. More forks usually indicate that developers are actively using and extending the project. That is, many forks are eventually abandoned, so the original fork count needs context.

Jumlah kontributor mengungkapkan berapa banyak pengembang yang berbeda yang benar-benar mengirimkan kode ke proyek tersebut. Ini biasanya lebih bermakna daripada bintang atau fork. Jumlah kontributor reguler yang sehat menunjukkan bahwa proyek tersebut memiliki komunitas aktif yang menjaga dan meningkatkannya.

Kami melangkah lebih jauh dengan merancang indikator kami sendiri - Skor Kontributor. Kami mengevaluasi sejarah publik setiap pengembang, termasuk kontribusi mereka ke proyek lain di masa lalu, frekuensi aktivitas, dan seberapa populer akun mereka, untuk membuat penilaian terhadap setiap kontributor. Kemudian, kami menghitung rata-rata semua kontributor proyek dan memberikan bobot berdasarkan jumlah kontribusi yang mereka buat.

Apa arti angka-angka ini bagi kerangka kerja kami?

Dalam kebanyakan kasus, jumlah bintang dapat diabaikan. Mereka bukan indikator yang bermakna dalam keadaan tertentu. Salah satu pengecualian di sini adalah Eliza, yang pada satu titik menjadi repositori tren nomor satu di GitHub di antara semua proyek, sesuai dengan statusnya sebagai titik Sheryl untuk semua kecerdasan buatan kripto. Selain itu, kontribusi dari pengembang terkenal seperti 0xCygaar juga telah diberikan kepada proyek ini. Ini juga tercermin dalam jumlah kontributor - Eliza menarik 10 kali lipat lebih banyak kontributor daripada proyek lain.

Selain itu, Daydreams menarik bagi kami karena menarik pengembang berkualitas tinggi. Sebagai pengikut yang diluncurkan setelah puncak hype, ia tidak mendapat manfaat dari efek jaringan Eliza.

Apa langkah selanjutnya?

Jika Anda seorang pengembang, kami harap kami setidaknya menyediakan titik awal bagi Anda untuk memilih kerangka kerja mana yang akan dibangun (jika perlu). Selain itu, Anda masih harus bekerja keras untuk menguji apakah inferensi inti dan integrasi setiap kerangka kerja cocok untuk kasus penggunaan Anda. Itu tidak bisa dihindari.

Dari sudut pandang pengamat, yang penting diingat adalah bahwa semua kerangka agen kecerdasan buatan ini tidak lebih dari tiga bulan. (Ya, terasa lebih lama.) Selama periode ini, mereka berubah dari hype ekstrim menjadi yang disebut 'istana di udara'. Itulah sifat teknologi. Meskipun ada fluktuasi seperti itu, kami percaya bahwa domain ini adalah eksperimen baru yang menarik dan berkelanjutan di dunia kripto.

Yang penting selanjutnya adalah bagaimana kerangka kerja ini berkembang dalam hal teknis dan moneter.

Dalam hal teknologi, keuntungan terbesar yang dapat dibuat kerangka kerja untuk diri mereka sendiri adalah memungkinkan proxy untuk berinteraksi dengan mulus secara on-chain. Ini adalah alasan nomor satu mengapa pengembang memilih kerangka kerja crypto-native daripada yang generik. Selain itu, teknologi pembuatan proxy dan proxy adalah masalah teknologi mutakhir di seluruh dunia, dengan perkembangan baru terjadi setiap hari. Kerangka kerja juga harus berevolusi dan beradaptasi dengan perkembangan ini.

Bagaimana kerangka dapat diuangkan lebih menarik. Pada tahap-tahap awal ini, menciptakan platform peluncuran yang terinspirasi oleh Virtuals adalah buah yang dapat dipetik dari proyek ini. Namun kami percaya bahwa ada banyak ruang eksperimen di sini. Kami menuju ke masa depan dengan ratusan juta agen yang secara khusus terlibat dalam berbagai bidang subspesialisasi yang dapat dibayangkan. Alat bantu yang membantu mereka berkoordinasi secara efektif dapat menangkap nilai yang besar dari biaya transaksi. Sebagai gerbang para pembangun, kerangka tentu saja paling cocok untuk menangkap nilai-nilai ini.

Pada saat yang sama, moneterisasi kerangka juga menyamar sebagai masalah moneterisasi proyek sumber terbuka dan penghargaan kontributor, para kontributor ini selalu melakukan pekerjaan gratis dan tidak dihargai. Jika sebuah tim dapat mengatasi bagaimana menciptakan ekonomi sumber terbuka yang berkelanjutan, sambil mempertahankan kode inti, dampaknya akan jauh melampaui kerangka agen.

Ini adalah tema-tema yang ingin kami jelajahi dalam beberapa bulan mendatang.

Lihat Asli
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate.io
Komunitas
Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)