AI自主智能體大盤點，構建、應用、評估全覆蓋，人大高瓴文繼榮等32頁綜述

巴比特_

2023-08-28 06:23:21

**編輯：**杜偉、陳萍

本文全面介紹了基於大語言模型（LLM）的智能體的構建、潛在應用和評估，為全面了解該領域的發展以及啟發未來的研究具有重要意義。

圖片來源：由無界AI‌ 生成

在當今的AI 時代，自主智能體被認為是通向通用人工智能（AGI）的一條有前途的道路。所謂自主智能體，即能夠通過自主規劃和指令來完成任務。在早期的開發範式中，決定智能體行動的策略功能是以啟發式為主的，並在環境交互中逐步得到完善。

不過，在不受約束的開放域環境中，自主智能體的行動往往很難企及人類水平的熟練程度。

隨著近年來大語言模型（LLM）取得了巨大成功，並展現出了實現類人智能的潛力。因而得益於強大的能力，LLM 越來越多地被用作創建自主智能體的核心協調者，並先後出現花樣繁多的AI 智能體。這些智能體通過模仿類人的決策過程，為更複雜和適應性更強的AI 系統提供了一條可行性路徑。

*基於LLM 的自主智能體一覽，包括工具智能體、模擬智能體、通用智能體和領域智能體。 *

在現階段，對已經出現的基於LLM 的自主智能體進行整體分析非常重要，並對全面了解該領域的發展現狀以及啟發未來的研究具有重要意義。

本文中，來自中國人民大學高瓴人工智能學院的研究者對基於LLM 的自主智能體展開了全面調研，並著眼於它們的構建、應用和評估三個方面。

論文地址：

對於智能體的構建，他們提出了一個由四部分組成的統一框架，分別是表示智能體屬性的配置模塊、存儲歷史信息的記憶模塊、制定未來行動策略的規劃模塊和執行規劃決定的行動模塊。在介紹了典型的智能體模塊之後，研究者還總結了常用的微調策略，通過這些策略來增強智能體對不同應用場景的適應性。

接下來研究者概述了自主智能體的潛在應用，探討它們如何對社會科學、自然科學和工程學領域產生增益。最後討論了自主智能體的評估方法，包括主觀和客觀評估策略。下圖為文章整體架構。

圖源：

基於LLM 的自主智能體構建

為了讓基於LLM 的自主智能體更加高效，有兩個方面需要考慮：首先是應該設計怎樣的架構使得智能體能更好的利用LLM；其次是如何有效地學習參數。

智能體架構設計：本文提出了一個統一的框架來總結之前研究中提出的架構，整體結構如圖2 所示，它由分析（profiling）模塊、記憶模塊、規劃模塊以及動作模塊組成。

總結而言，分析模塊旨在識別智能體是什麼角色；記憶和規劃模塊可將智能體置於動態環境中，使智能體能夠回憶過去的行為併計劃未來的行動；動作模塊負責將智能體的決策轉化為具體的輸出。在這些模塊中，分析模塊影響記憶和規劃模塊，這三個模塊共同影響動作模塊。

分析模塊

自主智能體通過特定角色來執行任務，例如程序員、教師和領域專家。分析模塊旨在表明智能體的角色是什麼，這些信息通常被寫入輸入提示中以影響LLM 行為。在現有的工作中，有三種常用的策略來生成智能體配置文件：手工製作方法；LLM-generation 方法；數據集對齊方法。

記憶模塊

記憶模塊在AI 智能體的構建中起著非常重要的作用。它記憶從環境中感知到的信息，並利用記錄的記憶來促進智能體未來的動作。記憶模塊可以幫助智能體積累經驗、實現自我進化，並以更加一致、合理、有效的方式完成任務。

規劃模塊

當人類面臨複雜任務時，他們首先將其分解為簡單的子任務，然後逐一解決每個子任務。規劃模塊賦予基於LLM 的智能體解決複雜任務時需要的思考和規劃能力，使智能體更加全面、強大、可靠。本文介紹了兩種規劃模塊：沒有反饋的規劃以及有反饋的規劃。

動作模塊

動作模塊旨在將智能體的決策轉化為具體的結果輸出。它直接與環境交互，決定智能體完成任務的有效性。本節從動作目標、策略、動作空間和動作影響來介紹。

除了上述4 個部分外，本章還介紹了智能體的學習策略，包括從示例中學習、從環境反饋中學習、從交互的人類反饋中學習。

表1 列出了之前的工作和本文的分類法之間的對應關係：

基於LLM 的自主智能體應用

本章探討了基於LLM 的自主智能體在三個不同領域的變革性影響：社會科學、自然科學和工程。

例如基於LLM 的智能體可用於設計和優化複雜結構，如建築物、橋樑、水壩、道路等。此前，有研究者提出了一個交互式框架，人類建築師和AI 智能體協同辦公在3D 模擬中構建結構環境。交互式智能體可以理解自然語言指令、放置模塊、尋求建議並結合人類反饋，顯示出工程設計中人機協作的潛力。

又比如在計算機科學和軟件工程領域，基於LLM 的智能體提供了自動化編碼、測試、調試和文檔生成的潛力。有研究者提出了ChatDev ，這是一個端到端的框架，其中多個智能體通過自然語言對話進行溝通和協作，以完成軟件開發生命週期；ToolBench 可以用於代碼自動補全和代碼推薦等任務； MetaGPT 可以扮演產品經理、架構師、項目經理和工程師等角色，內部監督代碼生成並提高最終輸出代碼的質量等等。

下表為基於LLM 的自主智能體的代表性應用：

基於LLM 的自主智能體評估