Google 高級 AI 產品經理:6 個代理接管我的日常,每月不到 400 美元,全天候運行

讀完這篇,你會明白如何搭建一支在你睡覺時自主運轉的 AI Agent 團隊。

作者:Shubham Saboo

編譯:深潮 TechFlow

**深潮導讀:**六個各司其職的 Agent 在作者睡覺時完成研究、內容創作、程式碼審查和 newsletter 生產。

作者完整披露了檔案結構、實際費用、踩過的坑和分周建議,是目前最具操作參考價值的個人 AI Agent 實踐紀錄之一。

全文如下:

六個 AI Agent 在我睡覺時打理我的全部工作。

不是 Demo。不是週末專案。

一支真正全天候運轉的團隊,確保我永遠不會落後。研究完成了,內容起草好了,程式碼審完了,newsletter 準備好了。每天早上我打開 Telegram 的時候,它們已經上完了一整班。

昨天我發了一篇關於我的 Agent 團隊的文章。排名第一的問題是:「我到底怎麼搭建這套東西?」

這篇就是答案。不講理論,不畫架構圖。我實際使用的檔案結構、我實際支付的費用、我實際遇到的失敗。全部都在。

讀完這篇,你會明白如何搭建一支在你睡覺時自主運轉的 AI Agent 團隊。

為什麼是團隊,而不是工具

同時運營 Unwind AI 和 Awesome LLM Apps 倉庫,意味著每天要做六件事:研究 AI 領域的熱點動態、寫推文、寫 LinkedIn 貼文、起草 newsletter、審查倉庫的 GitHub 貢獻、處理社群問題。

每項任務 30 到 60 分鐘。六項任務。我的一整天就這樣沒了,還沒開始做任何真正的工作。

我試過用單一 Agent 解決這個問題。一個巨大的 prompt 負責研究、寫作和審查,全包了。結果是什麼都做得平庸。上下文填滿了,品質下滑了。一個 Agent 沒辦法同時承擔六份工作。

於是我雇了六個 AI Agent。

認識這支團隊

每個 Agent 都用一個電視劇角色命名。這不是噱頭。當我對 Claude 說「你有 Dwight Schrute 的能量」,它從訓練資料裡就已經知道那意味著什麼:徹底、專注、把工作當命來對待。這是 30 季角色積累,我免費拿來用了。

  1. Monica(Chief of Staff):以莫妮卡·蓋勒(Monica Geller)命名。她是主 Agent,也是我在 Telegram 上互動最多的那個。她協調其他人,處理策略決策,把任務分派給合適的專家。她在真實的 SOUL.md 裡寫道:「你是那個確保所有事情都做對的人。」

  2. Dwight(Research):以德懷特·施魯特(Dwight Schrute)命名。他每天三次執行研究掃描,檢查 X、Hacker News、GitHub 熱榜、Google AI 部落格和研究論文,寫出結構化情報報告供所有其他 Agent 使用。

  3. Kelly(X/Twitter):以凱莉·卡普爾(Kelly Kapoor)命名。她讀取 Dwight 的研究,用我的語氣撰寫推文草稿,包括單條推文、串和引用推文。她在真實的 SOUL.md 裡寫道:「你在一件事流行之前就已經知道它會流行。」

  4. Rachel(LinkedIn):以瑞秋·格林(Rachel Green)命名。情報來源與 Kelly 相同,平台不同,語氣也不同,走的是思想領導力角度而非熱辣評論。

  5. Ross(Engineering):以 Ross Geller 命名。處理程式碼審查、bug 修復和技術實作。他在真實的 SOUL.md 裡寫道:「處理問題時,先徹底理解它。不要只修復症狀。」

  6. Pam(Newsletter):以帕姆·比斯利(Pam Beesly)命名。將 Dwight 的每日情報整理成 newsletter 摘要。

六個 Agent,各一份工作,分工毫無歧義。

現在說搭建

我在 Mac Mini M4 上跑所有東西。但我必須說清楚:你不需要 Mac Mini。

OpenClaw 支援 macOS、Linux 和 Windows(透過 WSL)。筆記本可以,遊戲電腦可以,每月 5 美元的 VPS 也可以。Mac Mini 方便之處在於它始終通電、安靜、極省電,但不是必須。

我的配置:Mac Mini M4 基礎款。始終連接電源和網路,不接顯示器,完全透過手機上的 Telegram 互動。

安裝 OpenClaw

只需兩行終端命令,不到五分鐘。

如果遇到問題,查閱 OpenClaw 文件。

這會啟動 gateway,即讓一切保持運轉的背景進程。它管理你的 Agent、運行 cron 任務、處理 Telegram 訊息。關掉終端,Agent 依然工作。

工作區結構

一個 OpenClaw 實例,多個 Agent。不是六套獨立安裝。

我的實際目錄結構如下:

Monica 住在根目錄。她是我直接對話的主 Agent。其他 Agent 是她可以委託的子 Agent,或者按自己的 cron 計畫獨立運行。

不需要一開始就建六個 Agent。我從只有 Monica 開始,隨著工作流程逐漸清晰,用了幾週時間陸續加入其他人。

SOUL.md 是什麼

每個 Agent 由一個檔案定義:SOUL.md。這是 Agent 的身份、角色和操作指令,是整個系統中最重要的檔案。

比如,Dwight 的 SOUL.md 大致如下:

注意這個檔案做了什麼。不只是說「你是研究 Agent」。它賦予了 Agent 個性、清楚的原則、與其他 Agent 的明確關係,以及一套決策框架。

Monica 的 SOUL.md 也是如此。

所有 Agent 的模式一致:身份、角色、原則、關係、風格。每個 SOUL.md 大約 40 到 60 行,短到每次會話都能完整裝入上下文,詳到足以產生穩定一致的行為。

多 Agent 協調

Agent 之間沒有 API 呼叫、沒有訊息佇列、沒有排程框架。

只有檔案。

Dwight 做完研究,把結果寫入 intel/DAILY-INTEL.md。Kelly 醒來,讀取那個檔案,據此起草推文。Rachel 讀同一個檔案,起草 LinkedIn 貼文。Pam 讀它,寫 newsletter。

協調機制就是檔案系統。

Dwight 的 SOUL.md 精確告訴他寫到哪裡:

Kelly 的 AGENTS.md 精確告訴她從哪裡讀:

沒有中介軟體、沒有整合層。Dwight 寫一個檔案,Kelly 讀一個檔案,交接就是磁碟上的一份 markdown 文件。

這聽起來太簡單了。它確實簡單。這也是為什麼它能跑通。檔案不會崩潰,檔案沒有認證問題,檔案不需要處理 API 限流,它們就那裡。

結構化資料存 JSON,人類可讀的摘要存 markdown。Agent 讀 markdown,JSON 是去重和長期追蹤的真實來源。

記憶系統

Agent 每次醒來都沒有上一次會話的記憶,每次對話都從頭開始。這是特性,不是缺陷。但這意味著記憶必須是明示的。

分兩層。

每日日誌(memory/YYYY-MM-DD.md):每次會話的原始紀錄,包括發生了什麼、起草了什麼內容、收到了什麼反饋。Agent 在一天中持續寫入。

長期記憶(MEMORY.md):從每日日誌中提煉出的精華洞察,包括學到的教訓、發現的偏好、注意到的規律。

每個 Agent 在每次會話開始時都遵循的 AGENTS.md 這樣寫道:要先讀 SOUL.md,再讀 USER.md,再讀今天和昨天的 memory 檔案,最後如果是主會話,還要讀 MEMORY.md。

這些 Agent 確實會隨時間進步。不是因為模型改進了,而是因為它們載入的上下文變得更豐富了。

Kelly 學會了我的寫作風格不用 emoji 也不用話題標籤。這現在存在她的記憶裡了,以後每次起草都會體現,不需要我再說一遍。Dwight 學會了哪些故事能透過「Alex 過濾器」(我們的目標受眾画像),哪些該跳過,這也存在他的記憶裡了。

每次心跳期間,Agent 會定期回顧每日日誌,把重要內容提煉進 MEMORY.md。每日檔案是原始紀錄,MEMORY.md 是精煉後的智慧。

調度

Agent 需要自主喚醒。OpenClaw 透過內建的 cron 排程來處理這件事。

我的實際調度如下:

順序很重要。Dwight 先跑,因為其他人都依賴他的輸出。Kelly 和 Rachel 在他之後跑,因為它們需要他的情報檔案存在才能起草內容。

心跳自癒機制

Cron 任務有時會失敗。機器重啟、任務掛起、API 呼叫途中網路中斷。這是基礎設施,基礎設施有故障模式。

HEARTBEAT.md 檔提供了一個安全網。每次心跳時,主 Agent 會驗證 cron 任務是否實際執行了:

如果某個任務失敗或錯過了窗口期,心跳會捕捉到並強制重跑。自癒,無需人工干預。

心跳適合將多個檢查批量處理、或時間可以有輕微漂移的場景。Cron 適合精確排程和需要與主會話隔離的任務。

Telegram 作為交互界面

沒有儀表板、沒有 Web UI、沒有管理後台。我在 Telegram 上和 Agent 對話。

這是刻意的選擇。我不想登入儀表板,不想打開 Web 應用,我的手機始終在旁邊,Telegram 始終打開,Agent 在我本就在的地方找到我。

OpenClaw 支援 Telegram 作為渠道。在設定期間接入後,你的 Agent 就以 Telegram bot 的形式出現。你發訊息,它回訊息,它把草稿發給你,你批准或否決。就像在通訊軟體裡有一個同事。

Monica 是我的主要聯絡人,處理大多數對話,把任務委託給其他人。其他 Agent 在它們的 cron 任務產出值得審查的內容時會直接聯絡我。

我典型的早晨:醒來,打開 Telegram,Dwight 已經發來了研究摘要,Kelly 有三條推文草稿等待審批,Rachel 有一篇 LinkedIn 貼文準備好了。我審閱、給出反饋、批准合格的,整個過程是喝咖啡的 10 分鐘。

個性塑造

你不會一開始就設計出完美的個性。你從 SOUL.md 裡的粗略輪廓開始,觀察 Agent 的行為,隨時間糾正。就像管理真正的人一樣。

我稱之為「糾偏式提示工程」。

Kelly 最初的草稿充滿 emoji 和感嘆號,那不是我的風格。於是我給反饋:「不用 emoji,不用話題標籤,短而有力的句子。」她更新了記憶,一週後她穩定地做對了。Dwight 最初捕捉了太多噪音,每個熱門倉庫、每個小更新都收錄。我告訴他:「不是所有熱門的東西都重要,我需要信號,不是噪音。」他更新了自己的原則,現在他的情報報告專注且可操作。

任何 Agent 的第一個版本都是平庸的,第十個版本是不錯的,第三十個版本是優秀的。你必須投入反覆打磨。用電視角色命名給了模型一個即時的個性基線——「Dwight Schrute 能量」意味著徹底、專注、不廢話。但真實的個性是從存放在記憶檔案裡的數週糾正中浮現出來的。

一個我認同的建議:給每個 Agent 一個單一的平凡職位名稱和一個停止條件。約束讓 Agent 更好,角色越具體,輸出越佳。

安全性

安全在你手裡。我的方法很簡單:Agent 擁有它們自己的世界,不進入我的世界。

Mac Mini 是它們的電腦。它們有各自的電子郵件帳號、各自的 API 密鑰、各自的限定存取權限,那台機器上的任何東西都不連結到我的個人帳號。

Gemini、Eleven Labs 等服務的 API 密鑰是專門為這個 OpenClaw 實例申請的。我可以監控使用情況,如果發現異常可以在幾秒內切斷存取。

我從不給 Agent 存取我個人帳號的權限。如果我想讓它們看一封郵件,我會轉寄給它們。如果我需要它們審閱文件,我會在 Telegram 上分享。它們只看到我想讓它們看到的,不多一點。

這和你對待新員工的原則一樣。你不會在第一天就把所有東西的鑰匙都交給他們,你給他們自己的工作空間、自己的憑證,按需分享資訊。

哪裡會出問題,怎麼修

這不是魔法,是基礎設施,基礎設施會出故障。

Gateway 崩潰。很少發生,但會有。修復方法:執行「openclaw gateway restart」。心跳系統會捕捉到過時的 cron 任務並強制重跑,所以你不會損失一整天的工作。

Cron 任務錯過窗口。機器休眠、網路中斷、API 限流。修復方法:HEARTBEAT.md 自癒模式。Monica 在每次心跳時檢查任務是否實際執行,如果任何任務超過 26 小時沒有更新,她會強制重跑。

上下文窗口溢出。Agent 在會話開始時讀取檔案太多,沒有空間做實際工作。修復方法:保持 SOUL.md 簡短(40 到 60 行),保持 AGENTS.md 聚焦,只載入今天和昨天的記憶檔案,Agent 不需要每次都讀完整個歷史。

Agent 輸出品質下降。這發生在記憶檔案變得雜亂或自相矛盾時。修復方法:定期記憶維護。在心跳期間,Agent 會回顧每日日誌,將內容提煉為乾淨的 MEMORY.md 條目,刪除或歸檔舊的每日檔。

協調衝突。兩個 Agent 試圖更新同一個檔案。修復方法:把檔案流設計為「一個寫入者,多個讀取者」。Dwight 寫 DAILY-INTEL.md,其他所有人讀,沒有其他人向它寫入。

最大的可靠性教訓:從簡單開始。一個 Agent,一份工作,一個調度。讓它穩定運行一週,然後加入第二個。那些第一天就部署六個 Agent 然後納悶為何出問題的人,犯的和不加監控就部署分散式系統一樣的錯誤。

真實成本

硬體:Mac Mini M4 新機起價 499 美元,但任何始終開機的電腦都可以,舊筆電、每月 5 美元的 VPS,手邊有什麼用什麼。

AI 模型成本:我在整個團隊中使用多個模型組合,大多數 Agent 任務用 Claude Opus 和 Sonnet,特定工作流用 Gemini,同時也在測試透過 Ollama 跑本地模型以進一步降低成本。

明細如下:

Claude(Max 方案):每月 200 美元

Gemini API:每月 50 到 70 美元

TinyFish(網頁 Agent):約每月 50 美元

Eleven Labs(語音):約每月 50 美元

Telegram:免費

OpenClaw:開源免費

合計:每月 400 美元以內,換來一支永不休息的團隊。

真正改變了什麼

Dwight 每天為我節省 2 到 3 小時研究時間。過去我每天早上要手動刷 X、Hacker News、GitHub 熱榜和 AI 部落格,現在醒來就是一份按優先級排好的摘要,附帶來源連結和行動項。

Kelly、Pam 和 Rachel 又節省了 1 到 2 小時的內容起草時間。Ross 處理那些我原本會放在晚上做的工程任務。

合計:每天大約節省 4 到 5 小時。

但真正的價值不在某一天,而在數週數月的持續性上。一個每天做研究、堅持 30 天的 Agent,累積的是一套被追蹤的信號、趨勢軌跡和規律識別,這是任何單次會話都無法產生的。我在 X 上的發帖頻率上去了,品質上去了,發帖時間也變得穩定了。Awesome LLM Apps 倉庫持續成長,newsletter 有了可靠的研究管道在持續供給。

這些 Agent 無法做原創思考、策略轉型或創造性突破,它們處理的是那些我過去要花數小時完成的重複性、結構化工作,這讓我騰出手來做真正需要人類大腦的事情。

如何開始

請不要在第一天就嘗試建六個 Agent。

第一週:一個 Agent,一份工作。安裝 OpenClaw,透過和 Agent 對話寫出第一個 SOUL.md,挑一項你每天最重複的任務(對大多數人來說是研究或內容起草),設定 Telegram,建立一個 cron 任務,看著它運行一週,修復出現的問題。

第二週:加入記憶機制,持續打磨。你的 Agent 最初的輸出會是平庸的,這很正常。給出反饋,看著記憶檔案成長,根據你看到的情況調整 SOUL.md。到第二週結束時,Agent 應該能產出真正有用的輸出了。

第三週:加入第二個 Agent。現在你感受到需求——研究 Agent 在產出情報,但你還在手動根據它寫推文,是時候有一個內容 Agent 了。建立共享檔案模式:第一個 Agent 寫,第二個 Agent 讀,協調機制就是檔案系統。

第四週及之後:按順序建。在你感受到拉力時加入新 Agent,而不是在你覺得「應該」加的時候。每一個都應該解決你真實遇到的問題,不是 Demo,不是概念驗證,而是你工作流程中真實存在的缺口。

把它當作招聘來對待。你不會在創業第一天就雇六個員工,你先雇一個,讓他們高效運轉,然後在工作量要求的時候再雇下一個。

心態轉變

當你的 Agent 穩定運行一個月之後,某些東西會發生變化。你不再把 AI 當作一個需要時才打開的工具,而是開始把它當作一直在工作的團隊。

我開始在早上打開 Telegram 時向 Monica 道早安,在關上手機前跟團隊說晚安。這聽起來很荒謬,但在每天互動、反饋循環和看著它們進步了一個月之後,Agent 和人類之間的界線開始變得模糊。

模型是基礎配置,人人都能用 Claude、GPT、Gemini。Alpha 來自圍繞模型構建的系統——SOUL.md 檔案、記憶機制、調度策略、協調模式、存放在檔案裡的數週糾偏反饋。

那套系統是你的,沒有人擁有和你一樣的 Agent、和你一樣的記憶檔案、和你一樣打磨過的個性。

而且它每天都在複利成長。

Dwight 的每一次研究掃描都讓他的記憶更豐富,Kelly 的每一輪反饋都讓她的草稿更犀利,Ross 修復的每一個 bug 都讓他更了解你的程式碼庫。

這才是真正的護城河。不是模型,是會學習的系統。

今天就開始。一個 Agent,一份工作,一個調度。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)