Yapay zeka özerk ajanlarının envanteri, yapım, uygulama ve değerlendirmenin tam kapsamı, Ulusal Halk Kongresi Hapishanesinden Wen Jirong tarafından yazılan 32 sayfalık genel bakış
Bu makale, bu alanın gelişiminin kapsamlı bir şekilde anlaşılması ve gelecekteki araştırmalara ilham verilmesi açısından büyük önem taşıyan büyük dil modeli (LLM) tabanlı etmenlerin oluşturulması, potansiyel uygulaması ve değerlendirilmesine kapsamlı bir giriş sağlar.
Resim kaynağı: Sınırsız Yapay Zeka tarafından oluşturulmuştur
Günümüzün yapay zeka çağında, otonom ajanlar, yapay genel zekaya (AGI) doğru umut verici bir yol olarak görülüyor. Otonom etmen olarak adlandırılan ajan, otonom planlama ve talimatlar yoluyla görevleri tamamlama yeteneğine sahiptir. Erken gelişim paradigmalarında, aracının eylemlerini belirleyen politika fonksiyonuna, çevre etkileşiminde kademeli olarak geliştirilen buluşsal yöntemler hakimdir.
Bununla birlikte, kısıtlamasız açık alan ortamlarında, otonom etmenlerin insan düzeyindeki yeterlilikle hareket etmesi genellikle zordur.
Büyük dil modellerinin (LLM) son yıllardaki büyük başarısı, insan benzeri zekaya ulaşma potansiyelini göstermiştir. Bu nedenle, güçlü yetenekleri sayesinde LLM, otonom etmenler oluşturmada çekirdek koordinatör olarak giderek daha fazla kullanılıyor ve çeşitli yapay zeka etmenleri art arda ortaya çıkıyor. Bu aracılar, insan benzeri karar verme süreçlerini taklit ederek daha karmaşık ve uyarlanabilir yapay zeka sistemlerine yönelik uygun bir yol sunar.
*Araç aracıları, simüle edilmiş aracılar, genel aracılar ve etki alanı aracıları dahil olmak üzere LLM tabanlı özerk aracıların listesi. *
Bu aşamada, ortaya çıkan LLM tabanlı otonom etmenlerin bütünsel bir analizinin yapılması oldukça önemli olup, bu alanın gelişim durumunun tam olarak anlaşılması ve gelecekteki araştırmalara ilham verilmesi büyük önem taşımaktadır.
Bu makalede, Çin'in Renmin Üniversitesi'ndeki Hillhouse Yapay Zeka Okulu'ndan araştırmacılar, LLM tabanlı özerk etmenlerin yapımı, uygulanması ve değerlendirilmesinin üç yönüne odaklanan kapsamlı bir araştırma yürüttüler.
Kağıt adresi:
Aracının inşası için, aracının niteliklerini temsil eden konfigürasyon modülü, geçmiş bilgileri depolayan bellek modülü, gelecekteki eylem stratejilerini formüle etmek için planlama modülü ve eylem olmak üzere dört bölümden oluşan birleşik bir çerçeve önerdiler. Planlama kararlarını yürütmek için modül. Araştırmacılar, tipik etmen modüllerini tanıttıktan sonra, etmenlerin farklı uygulama senaryolarına uyarlanabilirliğini geliştirmek için yaygın olarak kullanılan ince ayar stratejilerini de özetlemektedir.
Araştırmacılar daha sonra otonom etmenlerin potansiyel uygulamalarını özetleyerek sosyal bilimler, doğa bilimleri ve mühendislik alanlarına nasıl fayda sağlayabileceklerini araştırıyorlar. Son olarak, öznel ve nesnel değerlendirme stratejileri de dahil olmak üzere, özerk etmenlere yönelik değerlendirme yöntemleri tartışılmaktadır. Aşağıdaki şekil makalenin genel yapısını göstermektedir.
Kaynak:
LLM'ye dayalı otonom acentelerin inşası
LLM tabanlı otonom aracıyı daha verimli hale getirmek için dikkate alınması gereken iki husus vardır: birincisi, aracının LLM'yi daha iyi kullanabilmesi için ne tür bir mimari tasarlanmalıdır; ikincisi, parametrelerin etkili bir şekilde nasıl öğrenileceği.
Aracı mimarisi tasarımı: Bu makale, önceki çalışmalarda önerilen mimariyi özetlemek için birleşik bir çerçeve önermektedir. Profil oluşturma modülü, bellek modülü, planlama modülü ve eylem modülünden oluşan genel yapı Şekil 2'de gösterilmektedir.
Özetle analiz modülü, etmenin hangi rolde olduğunu belirlemeyi amaçlar; bellek ve planlama modülü, etmeni dinamik bir ortama yerleştirerek, etmenin geçmiş davranışlarını hatırlamasını ve gelecekteki eylemleri planlamasını sağlar; Kararlar somut çıktılara dönüştürülür. Bu modüllerden analiz modülü hafıza ve planlama modüllerini, bu üç modül birlikte aksiyon modülünü etkiler.
Analiz Modülü
Otonom aracılar, programcılar, öğretmenler ve alan uzmanları gibi belirli roller aracılığıyla görevleri yerine getirir. Analiz modülü, aracının rolünün ne olduğunu belirtmeyi amaçlar ve bu bilgi genellikle LLM davranışını etkilemek için giriş istemlerine yazılır. Mevcut çalışmalarda, etmen profilleri oluşturmak için yaygın olarak kullanılan üç strateji vardır: el yapımı yöntemler; Yüksek Lisans oluşturma yöntemleri; veri kümesi hizalama yöntemleri.
Bellek modülü
Bellek modülleri yapay zeka aracılarının yapımında çok önemli bir rol oynar. Çevreden algılanan bilgileri ezberler ve kaydedilen hafızayı ajanın gelecekteki eylemlerini kolaylaştırmak için kullanır. Bellek modülleri, temsilcilerin deneyim kazanmasına, kişisel gelişimi gerçekleştirmesine ve görevleri daha tutarlı, makul ve etkili bir şekilde tamamlamasına yardımcı olabilir.
Planlama Modülü
İnsanlar karmaşık bir görevle karşı karşıya kaldıklarında, önce onu basit alt görevlere bölerler, sonra her bir alt görevi tek tek çözerler. Planlama modülü, LLM tabanlı aracıya karmaşık görevleri çözmek için gereken düşünme ve planlama yeteneklerini sağlayarak aracıyı daha kapsamlı, güçlü ve güvenilir hale getirir. Bu makale iki planlama modülü sunmaktadır: geri bildirimsiz planlama ve geri bildirimli planlama.
Eylem Modülü
Eylem modülü, vekilin kararını belirli bir sonuç çıktısına dönüştürmeyi amaçlamaktadır. Doğrudan çevre ile etkileşime girer ve aracının görevleri tamamlamadaki etkinliğini belirler. Bu bölümde eylem hedefi, politika, eylem alanı ve eylem etkisi perspektifinden tanıtılmaktadır.
Yukarıdaki 4 bölüme ek olarak, bu bölüm aynı zamanda örneklerden öğrenme, çevresel geri bildirimden öğrenme ve etkileşimli insan geri bildiriminden öğrenme dahil olmak üzere aracının öğrenme stratejilerini de tanıtmaktadır.
Tablo 1'de önceki çalışmalarla taksonomimiz arasındaki yazışmalar listelenmektedir:
LLM tabanlı otonom acente uygulaması
Bu bölüm, yüksek lisans tabanlı özerk etmenlerin üç farklı alandaki dönüştürücü etkisini araştırıyor: sosyal bilimler, doğa bilimleri ve mühendislik.
Örneğin, LLM tabanlı aracılar binalar, köprüler, barajlar, yollar vb. gibi karmaşık yapıları tasarlamak ve optimize etmek için kullanılabilir. Daha önce bazı araştırmacılar, insan mimarların ve yapay zeka temsilcilerinin 3 boyutlu simülasyonlarda yapısal ortamlar oluşturmak için birlikte çalıştığı etkileşimli bir çerçeve önermişti. Etkileşimli aracılar, doğal dil talimatlarını anlayabilir, modülleri yerleştirebilir, tavsiye isteyebilir ve insan geri bildirimlerini dahil ederek mühendislik tasarımında insan-makine işbirliğinin potansiyelini gösterebilir.
Örneğin bilgisayar bilimi ve yazılım mühendisliğinde yüksek lisans tabanlı aracılar kodlama, test etme, hata ayıklama ve belge oluşturmayı otomatikleştirme potansiyeli sunar. Bazı araştırmacılar, yazılım geliştirme yaşam döngüsünü tamamlamak için birden fazla aracının doğal dil diyalogu yoluyla iletişim kurduğu ve işbirliği yaptığı uçtan uca bir çerçeve olan ChatDev'i önerdi; ToolBench, otomatik kod tamamlama ve kod önerme gibi görevler için kullanılabilir; MetaGPT, ürün yöneticisi, mimar, proje yöneticisi ve mühendis rolünü oynayabilir, kod üretimini dahili olarak denetleyebilir ve son çıktı kodunun kalitesini vb. iyileştirebilir.
Aşağıdaki tabloda LLM tabanlı otonom aracıların temsili uygulamaları gösterilmektedir:
Özerk Aracıların Yüksek Lisans Tabanlı Değerlendirmesi
Bu makale yaygın olarak kullanılan iki değerlendirme stratejisini tanıtmaktadır: öznel değerlendirme ve nesnel değerlendirme.
Sübjektif değerlendirme, insanların LLM tabanlı ajanları etkileşim ve puanlama gibi çeşitli yollarla test etme yeteneğini ifade eder. Bu durumda, değerlendirmeye katılan kişiler çoğunlukla kitle kaynak platformları aracılığıyla işe alınır; bazı araştırmacılar, kitle kaynak kullanan personelin bireysel yetenek farklılıkları nedeniyle istikrarsız olduğuna inanmaktadır, bu nedenle değerlendirme için uzman açıklamaları da kullanılmaktadır.
Ayrıca bazı güncel çalışmalarda LLM aracılarını subjektif değerlendirici olarak kullanabiliriz. Örneğin ChemCrow çalışmasında uatorGPT, hem görevin başarılı bir şekilde tamamlanmasını hem de temeldeki düşünce sürecinin doğruluğunu dikkate alan bir derecelendirme atayarak deneysel sonuçları değerlendirir. Diğer bir örnek ise Chat'in, modelin üretim sonuçlarını tartışma yoluyla değerlendirmek için LLM tabanlı, çok temsilcili bir hakem ekibi oluşturmasıdır.
Objektif değerlendirmenin, LLM tabanlı otonom aracıların yeteneklerini değerlendirmek için niceliksel ölçümlerin kullanımını ifade eden subjektif değerlendirmeye göre birçok avantajı vardır. Bu bölüm, objektif değerlendirme yöntemlerini ölçümler, stratejiler ve kıyaslamalar perspektifinden gözden geçirmekte ve sentezlemektedir.
Kullanım değerlendirmesi sırasında bu iki yöntemi birleştirebiliriz.
Tablo 3, önceki çalışmalar ile bu değerlendirme stratejileri arasındaki yazışmayı özetlemektedir:
Daha fazla bilgi için lütfen orijinal makaleye bakın.
View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
Yapay zeka özerk ajanlarının envanteri, yapım, uygulama ve değerlendirmenin tam kapsamı, Ulusal Halk Kongresi Hapishanesinden Wen Jirong tarafından yazılan 32 sayfalık genel bakış
Editör: Du Wei, Chen Ping
Günümüzün yapay zeka çağında, otonom ajanlar, yapay genel zekaya (AGI) doğru umut verici bir yol olarak görülüyor. Otonom etmen olarak adlandırılan ajan, otonom planlama ve talimatlar yoluyla görevleri tamamlama yeteneğine sahiptir. Erken gelişim paradigmalarında, aracının eylemlerini belirleyen politika fonksiyonuna, çevre etkileşiminde kademeli olarak geliştirilen buluşsal yöntemler hakimdir.
Bununla birlikte, kısıtlamasız açık alan ortamlarında, otonom etmenlerin insan düzeyindeki yeterlilikle hareket etmesi genellikle zordur.
Büyük dil modellerinin (LLM) son yıllardaki büyük başarısı, insan benzeri zekaya ulaşma potansiyelini göstermiştir. Bu nedenle, güçlü yetenekleri sayesinde LLM, otonom etmenler oluşturmada çekirdek koordinatör olarak giderek daha fazla kullanılıyor ve çeşitli yapay zeka etmenleri art arda ortaya çıkıyor. Bu aracılar, insan benzeri karar verme süreçlerini taklit ederek daha karmaşık ve uyarlanabilir yapay zeka sistemlerine yönelik uygun bir yol sunar.
Bu aşamada, ortaya çıkan LLM tabanlı otonom etmenlerin bütünsel bir analizinin yapılması oldukça önemli olup, bu alanın gelişim durumunun tam olarak anlaşılması ve gelecekteki araştırmalara ilham verilmesi büyük önem taşımaktadır.
Bu makalede, Çin'in Renmin Üniversitesi'ndeki Hillhouse Yapay Zeka Okulu'ndan araştırmacılar, LLM tabanlı özerk etmenlerin yapımı, uygulanması ve değerlendirilmesinin üç yönüne odaklanan kapsamlı bir araştırma yürüttüler.
Aracının inşası için, aracının niteliklerini temsil eden konfigürasyon modülü, geçmiş bilgileri depolayan bellek modülü, gelecekteki eylem stratejilerini formüle etmek için planlama modülü ve eylem olmak üzere dört bölümden oluşan birleşik bir çerçeve önerdiler. Planlama kararlarını yürütmek için modül. Araştırmacılar, tipik etmen modüllerini tanıttıktan sonra, etmenlerin farklı uygulama senaryolarına uyarlanabilirliğini geliştirmek için yaygın olarak kullanılan ince ayar stratejilerini de özetlemektedir.
Araştırmacılar daha sonra otonom etmenlerin potansiyel uygulamalarını özetleyerek sosyal bilimler, doğa bilimleri ve mühendislik alanlarına nasıl fayda sağlayabileceklerini araştırıyorlar. Son olarak, öznel ve nesnel değerlendirme stratejileri de dahil olmak üzere, özerk etmenlere yönelik değerlendirme yöntemleri tartışılmaktadır. Aşağıdaki şekil makalenin genel yapısını göstermektedir.
LLM'ye dayalı otonom acentelerin inşası
LLM tabanlı otonom aracıyı daha verimli hale getirmek için dikkate alınması gereken iki husus vardır: birincisi, aracının LLM'yi daha iyi kullanabilmesi için ne tür bir mimari tasarlanmalıdır; ikincisi, parametrelerin etkili bir şekilde nasıl öğrenileceği.
Aracı mimarisi tasarımı: Bu makale, önceki çalışmalarda önerilen mimariyi özetlemek için birleşik bir çerçeve önermektedir. Profil oluşturma modülü, bellek modülü, planlama modülü ve eylem modülünden oluşan genel yapı Şekil 2'de gösterilmektedir.
Analiz Modülü
Otonom aracılar, programcılar, öğretmenler ve alan uzmanları gibi belirli roller aracılığıyla görevleri yerine getirir. Analiz modülü, aracının rolünün ne olduğunu belirtmeyi amaçlar ve bu bilgi genellikle LLM davranışını etkilemek için giriş istemlerine yazılır. Mevcut çalışmalarda, etmen profilleri oluşturmak için yaygın olarak kullanılan üç strateji vardır: el yapımı yöntemler; Yüksek Lisans oluşturma yöntemleri; veri kümesi hizalama yöntemleri.
Bellek modülü
Bellek modülleri yapay zeka aracılarının yapımında çok önemli bir rol oynar. Çevreden algılanan bilgileri ezberler ve kaydedilen hafızayı ajanın gelecekteki eylemlerini kolaylaştırmak için kullanır. Bellek modülleri, temsilcilerin deneyim kazanmasına, kişisel gelişimi gerçekleştirmesine ve görevleri daha tutarlı, makul ve etkili bir şekilde tamamlamasına yardımcı olabilir.
Planlama Modülü
İnsanlar karmaşık bir görevle karşı karşıya kaldıklarında, önce onu basit alt görevlere bölerler, sonra her bir alt görevi tek tek çözerler. Planlama modülü, LLM tabanlı aracıya karmaşık görevleri çözmek için gereken düşünme ve planlama yeteneklerini sağlayarak aracıyı daha kapsamlı, güçlü ve güvenilir hale getirir. Bu makale iki planlama modülü sunmaktadır: geri bildirimsiz planlama ve geri bildirimli planlama.
Eylem Modülü
Eylem modülü, vekilin kararını belirli bir sonuç çıktısına dönüştürmeyi amaçlamaktadır. Doğrudan çevre ile etkileşime girer ve aracının görevleri tamamlamadaki etkinliğini belirler. Bu bölümde eylem hedefi, politika, eylem alanı ve eylem etkisi perspektifinden tanıtılmaktadır.
Yukarıdaki 4 bölüme ek olarak, bu bölüm aynı zamanda örneklerden öğrenme, çevresel geri bildirimden öğrenme ve etkileşimli insan geri bildiriminden öğrenme dahil olmak üzere aracının öğrenme stratejilerini de tanıtmaktadır.
Tablo 1'de önceki çalışmalarla taksonomimiz arasındaki yazışmalar listelenmektedir:
Bu bölüm, yüksek lisans tabanlı özerk etmenlerin üç farklı alandaki dönüştürücü etkisini araştırıyor: sosyal bilimler, doğa bilimleri ve mühendislik.
Örneğin bilgisayar bilimi ve yazılım mühendisliğinde yüksek lisans tabanlı aracılar kodlama, test etme, hata ayıklama ve belge oluşturmayı otomatikleştirme potansiyeli sunar. Bazı araştırmacılar, yazılım geliştirme yaşam döngüsünü tamamlamak için birden fazla aracının doğal dil diyalogu yoluyla iletişim kurduğu ve işbirliği yaptığı uçtan uca bir çerçeve olan ChatDev'i önerdi; ToolBench, otomatik kod tamamlama ve kod önerme gibi görevler için kullanılabilir; MetaGPT, ürün yöneticisi, mimar, proje yöneticisi ve mühendis rolünü oynayabilir, kod üretimini dahili olarak denetleyebilir ve son çıktı kodunun kalitesini vb. iyileştirebilir.
Aşağıdaki tabloda LLM tabanlı otonom aracıların temsili uygulamaları gösterilmektedir:
Bu makale yaygın olarak kullanılan iki değerlendirme stratejisini tanıtmaktadır: öznel değerlendirme ve nesnel değerlendirme.
Sübjektif değerlendirme, insanların LLM tabanlı ajanları etkileşim ve puanlama gibi çeşitli yollarla test etme yeteneğini ifade eder. Bu durumda, değerlendirmeye katılan kişiler çoğunlukla kitle kaynak platformları aracılığıyla işe alınır; bazı araştırmacılar, kitle kaynak kullanan personelin bireysel yetenek farklılıkları nedeniyle istikrarsız olduğuna inanmaktadır, bu nedenle değerlendirme için uzman açıklamaları da kullanılmaktadır.
Ayrıca bazı güncel çalışmalarda LLM aracılarını subjektif değerlendirici olarak kullanabiliriz. Örneğin ChemCrow çalışmasında uatorGPT, hem görevin başarılı bir şekilde tamamlanmasını hem de temeldeki düşünce sürecinin doğruluğunu dikkate alan bir derecelendirme atayarak deneysel sonuçları değerlendirir. Diğer bir örnek ise Chat'in, modelin üretim sonuçlarını tartışma yoluyla değerlendirmek için LLM tabanlı, çok temsilcili bir hakem ekibi oluşturmasıdır.
Objektif değerlendirmenin, LLM tabanlı otonom aracıların yeteneklerini değerlendirmek için niceliksel ölçümlerin kullanımını ifade eden subjektif değerlendirmeye göre birçok avantajı vardır. Bu bölüm, objektif değerlendirme yöntemlerini ölçümler, stratejiler ve kıyaslamalar perspektifinden gözden geçirmekte ve sentezlemektedir.
Kullanım değerlendirmesi sırasında bu iki yöntemi birleştirebiliriz.
Tablo 3, önceki çalışmalar ile bu değerlendirme stratejileri arasındaki yazışmayı özetlemektedir: