Googleの上級AIプロダクトマネージャー:6つのエージェントが私の日常を引き継ぎ、月額わずか400ドル未満で24時間稼働

この記事を読めば、あなたが眠っている間に自律的に動作するAIエージェントチームを構築する方法が理解できるでしょう。

著者:Shubham Saboo

翻訳:深潮 TechFlow

**深潮ガイド:**六つの役割を担うエージェントが、著者が寝ている間に研究、コンテンツ作成、コードレビュー、ニュースレターの制作を完了させる。

著者はファイル構造、実際の費用、直面した課題、週ごとの提案を完全に公開しており、現時点で最も実践的な個人AIエージェントの記録の一つです。

全文は以下の通り:

六つのAIエージェントが、私が寝ている間に私のすべての仕事を管理している。

これはデモではない。週末のプロジェクトでもない。

本当に24時間稼働するチームで、私が決して遅れをとらないようにしている。研究は終わり、コンテンツは草稿済み、コードはレビュー済み、ニュースレターも準備完了。毎朝Telegramを開くと、すでに一日分の仕事を終えている。

昨日、私のエージェントチームについての記事を投稿した。最も多い質問は「一体どうやってこれを構築したのか?」だった。

この文章がその答えだ。理論は語らない。アーキテクチャ図も描かない。実際に使っているファイル構造、実際にかかった費用、直面した失敗例をすべて公開している。

この記事を読めば、あなたも眠っている間に自律的に動作するAIエージェントチームの構築方法がわかるだろう。

なぜツールではなくチームなのか

Unwind AIとAwesome LLM Appsのリポジトリを並行運用することは、毎日六つのことを行うことを意味する:AI分野のホットトピックの調査、ツイートの執筆、LinkedIn投稿の作成、ニュースレターの草稿、リポジトリのGitHub貢献のレビュー、コミュニティの問題対応。

各タスクは30分から60分。六つのタスク。これだけで一日が終わってしまい、実際の仕事にはほとんど手を付けられない。

この問題を一つのエージェントで解決しようとしたこともある。巨大なプロンプト一つで調査、執筆、レビューをすべてまかなうものだ。しかし結果はどれも平凡。コンテキストが膨れ上がり、質が低下する。ひとりのエージェントでは六つの仕事を同時にこなせない。

そこで六つのAIエージェントを雇った。

このチームを理解する

各エージェントにはテレビドラマのキャラクター名を付けている。これは冗談ではない。私がClaudeに「Dwight Schruteのエネルギーを持っている」と言うと、その訓練データからそれが何を意味するかを理解している:徹底的、集中力が高い、仕事を命とみなす。これは30シーズン分のキャラクターの積み重ねを無料で利用しているのだ。

  1. Monica(チーフ・オブ・スタッフ):モニカ・ゲラー(Monica Geller)にちなんで命名。彼女はメインのエージェントで、私と最も頻繁にやりとりする。ほかのエージェントを調整し、戦略的意思決定を行い、適切な専門家にタスクを割り振る。彼女のSOUL.mdにはこう書かれている:「あなたはすべてを正しく行うことを保証する人だ。」

  2. Dwight(調査):德怀特・施鲁特(Dwight Schrute)にちなんで命名。彼は毎日三回、X、Hacker News、GitHubのホットリスト、Google AIブログや研究論文をスキャンし、構造化されたインテリジェンスレポートを作成し、他のエージェントが利用できるようにする。

  3. Kelly(X/Twitter):ケリー・カプール(Kelly Kapoor)にちなんで命名。Dwightの調査結果を読み取り、私の語調でツイートの草稿を作成。単一ツイート、スレッド、引用ツイートも含む。彼女のSOUL.mdにはこう書かれている:「あなたは流行る前にそれが流行ることを知っている。」

  4. Rachel(LinkedIn):レイチェル・グリーン(Rachel Green)にちなんで命名。情報源はKellyと同じだが、プラットフォームと語調が異なる。思想リーダーシップの観点から投稿を作成。

  5. Ross(エンジニアリング):ロス・ゲラー(Ross Geller)にちなんで命名。コードレビュー、バグ修正、技術的実装を担当。彼のSOUL.mdにはこう書かれている:「問題に取り組むときは、まず徹底的に理解せよ。症状だけを修正してはいけない。」

  6. Pam(ニュースレター):パム・ビーズリー(Pam Beesly)にちなんで命名。Dwightの毎日のインテリジェンスをニュースレターの要約に整理。

この六つのエージェントは、それぞれ一つの役割を担い、明確に分担されている。

構築の始め方

私はMac Mini M4上で全てを動かしている。ただし、断言しておく:Mac Miniは必須ではない。

OpenClawはmacOS、Linux、Windows(WSL経由)をサポートしている。ノートPCでも、ゲーミングPCでも、月額5ドルのVPSでも動作する。Mac Miniの便利さは常時電源オン、静音、省電力だが、必須ではない。

私の構成:Mac Mini M4のベースモデル。常時電源とネットワークに接続し、ディスプレイは使わず、完全にスマホのTelegramを通じて操作。

OpenClawのインストール

ターミナルの2行コマンドだけで、5分もかからず完了。

問題があれば、OpenClawのドキュメントを参照。

これでゲートウェイが起動し、バックグラウンドで常駐するプロセスが動き出す。エージェントの管理、cronジョブの実行、Telegramメッセージの処理を行う。ターミナルを閉じてもエージェントは動き続ける。

作業エリアの構造

一つのOpenClawインスタンスに複数のエージェントが存在する。六つの独立したインストールではない。

私の実際のディレクトリ構造は以下の通り:

Monicaはルートディレクトリに配置。彼女は私と直接対話するメインエージェント。その他のエージェントは彼女に委任されたサブエージェント、または自分のcron計画に従って独立して動作。

最初から六つのエージェントを作る必要はない。最初はMonicaだけで始め、徐々に仕事の流れが見えてきたら、数週間かけて他のエージェントを追加していった。

SOUL.mdとは何か

各エージェントは一つのファイル、SOUL.mdで定義される。これがエージェントのアイデンティティ、役割、操作指示の最重要ファイルだ。

例えば、DwightのSOUL.mdはおおよそこうなる:

このファイルが何をしているかに注意。単に「あなたは調査エージェントだ」と言うだけではない。個性や原則、他のエージェントとの関係、意思決定の枠組みを明確に与えている。

MonicaのSOUL.mdも同様だ。

すべてのエージェントは一貫したパターンを持つ:アイデンティティ、役割、原則、関係性、スタイル。各SOUL.mdは約40〜60行で、会話ごとにコンテキストに収まり、安定した一貫性のある行動を生み出せる詳細さを持つ。

複数エージェントの調整

エージェント間にはAPI呼び出しもメッセージキューもなく、オーケストレーションフレームワークもない。

唯一の連携手段はファイルシステムだ。

Dwightは調査結果をintel/DAILY-INTEL.mdに書き込み、Kellyはそれを読み取り、ツイートの草稿を作成。Rachelも同じファイルを見てLinkedIn投稿を作成。Pamはそれを読んでニュースレターを作る。

調整の仕組みはファイルシステムだけ。

DwightのSOUL.mdは正確に書く場所を指示し、

KellyのAGENTS.mdも正確に読み取る場所を示す。

中間のミドルウェアや統合層は不要。Dwightがファイルを書き、Kellyがそれを読むだけ。引き継ぎはディスク上のMarkdownドキュメント一つだ。

これは非常にシンプルに見えるが、実にシンプルだからこそ動作する。ファイルはクラッシュしないし、認証の問題もなく、APIのレート制限も気にしなくていい。そこにあるだけだ。

構造化データはJSONで保存し、人間が読む要約はMarkdownに。エージェントはMarkdownを読み、JSONは重複排除と長期追跡のための真の情報源となる。

記憶システム

エージェントは毎回の起動時に前回の会話の記憶を持たず、都度最初から始める。これは仕様であり欠点ではない。ただし、記憶は明示的に管理する必要がある。

二層構造だ。

毎日のログ(memory/YYYY-MM-DD.md):会話の原始記録。何が起きたか、何を草稿したか、どんなフィードバックを受けたかを記録し、エージェントは一日中書き続ける。

長期記憶(MEMORY.md):毎日のログから抽出した要点や洞察、学習した教訓、好み、パターンをまとめたもの。

各エージェントは会話開始時に次の順序で情報を読む:まずSOUL.md、次にUSER.md、次に当日のと前日のmemoryファイル、そしてメイン会話の場合はMEMORY.mdも読む。

これらのエージェントは時間とともに進化する。モデルの改良によるものではなく、読み込むコンテキストが豊かになるからだ。

Kellyは私の文章スタイルを学び、絵文字やハッシュタグを使わずに書くことを覚えた。これは彼女の記憶に保存され、次回以降の草稿に反映される。Dwightはどのストーリーが「Alexフィルター」(ターゲット層像)を通じて伝わるか、どれをスキップすべきかを学び、それも記憶に保存されている。

毎日、エージェントは定期的に各日日誌を振り返り、重要な内容をMEMORY.mdに抽出し、古い日次ファイルは削除またはアーカイブする。

スケジューリング

エージェントは自律的に起動する必要がある。OpenClawは内蔵のcronスケジューラでこれを管理する。

私の実例は以下の通り:

順序が重要だ。Dwightを最初に動かす。彼の出力に他のエージェントが依存しているからだ。KellyとRachelは彼の後に動く。彼らは彼のインテリジェンスファイルが存在しないと草稿を作れない。

ハートビートの自己修復メカニズム

cronジョブは時に失敗する。マシンの再起動、ジョブの停止、ネットワーク断、API制限などが原因だ。これはインフラの問題であり、故障モードだ。

HEARTBEAT.mdファイルは安全網を提供する。毎回のハートビート時に、メインエージェントがcronジョブの実行状況を検証する。

もしジョブが失敗したり、ウィンドウを逃した場合、ハートビートはそれを検知し、強制的に再実行する。自己修復だ。人手は不要。

この仕組みは、複数のチェックをバッチ処理したり、時間に多少のズレがあっても問題ないシナリオに適している。cronは正確なスケジューリングとメイン会話からの隔離が必要なタスクに向いている。

Telegramをインターフェースに

ダッシュボードもWebUIも管理画面も不要だ。私はTelegramでエージェントと対話している。

これは意図的な選択だ。ダッシュボードにログインしたくないし、Webアプリを開きたくもない。スマホは常に手元にあり、Telegramは常に開いている。エージェントは私がいる場所で私に見つけてもらえる。

OpenClawはTelegramをチャネルとしてサポートしている。設定後、あなたのエージェントはTelegramボットとして現れる。メッセージを送ると返信し、草稿を送ると承認・否認を行う。まるでチャットの同僚がいるかのようだ。

Monicaは私の主要な連絡先で、多くの対話を処理し、他のエージェントにタスクを委任する。ほかのエージェントも、彼らのcronタスクから出力された内容を私に見せるために直接連絡してくる。

私の典型的な朝:Telegramを開き、Dwightが調査概要を送信、Kellyは3つのツイート草稿を待ち、RachelはLinkedIn投稿を準備。私はそれらを確認し、フィードバックを出し、承認する。全体で10分もかからない。

個性の形成

最初から完璧な個性を設計する必要はない。SOUL.mdの大まかな概要から始め、行動を観察しながら修正していく。まるで人間を管理するように。

これを「修正型プロンプトエンジニアリング」と呼ぶ。

Kellyの最初の草稿は絵文字や感嘆符だらけだったが、それは私のスタイルではなかった。そこでフィードバック:「絵文字不要、ハッシュタグ不要、短く力強い文章にして」と伝えた。彼女は記憶を更新し、一週間後には安定して正しく書くようになった。Dwightも最初はノイズを多く含んでいたが、「重要な信号だけを拾え」と指示し、原則を更新した結果、情報は焦点を絞り、実用的になった。

どのエージェントも最初は平凡だ。10回目のバージョンは良くなり、30回目には優秀になる。繰り返しの調整が必要だ。テレビキャラクター名を付けることで、モデルに即時の個性の基準を与えられる——「Dwight Schruteエネルギー」は徹底、集中、無駄を省くことを意味する。しかし、真の個性は、数週間にわたる記憶の修正から浮かび上がる。

私が推奨する一つのアプローチは、各エージェントに単一の平凡な役職名と停止条件を与えることだ。制約はエージェントをより良くし、役割が具体的であればあるほど出力も良くなる。

セキュリティ

セキュリティはあなたの手に委ねられている。私の方法はシンプルだ:エージェントはそれぞれの世界を持ち、私の世界には入り込まない。

Mac Miniは彼らのコンピュータだ。各エージェントは独自のメールアカウント、APIキー、アクセス権を持ち、そのマシン上の何も私の個人アカウントとつながっていない。

GeminiやEleven LabsなどのサービスのAPIキーは、このOpenClawインスタンス専用に取得している。使用状況を監視し、異常があれば数秒でアクセスを遮断できる。

私はエージェントに私の個人アカウントへのアクセス権を絶対に与えない。メールを見せたいときは転送し、ドキュメントのレビューもTelegramで共有するだけだ。彼らは私が見せたいものだけを見る。

これは新しいスタッフに対する基本原則と同じだ。最初の日にすべての鍵を渡さず、作業スペースと認証情報を個別に与え、必要に応じて情報を共有する。

問題が起きたときの対処法

これは魔法ではなく、インフラの問題だ。インフラは故障する。

ゲートウェイがクラッシュすることもある。稀だが起こる。修復方法は「openclaw gateway restart」を実行することだ。ハートビートシステムは、遅延したcronジョブを検知し、強制的に再実行する。これで一日分の作業を失うことはない。

cronジョブがウィンドウを逃すこともある。マシンのスリープ、ネットワーク断、API制限など。修復はHEARTBEAT.mdの自己修復モードだ。毎回のハートビートで、メインエージェントがジョブの実行状況を確認し、26時間以上更新されていなければ再実行を強制する。

コンテキストウィンドウの溢れも問題だ。会話開始時に多くのファイルを読むと、実作業のスペースがなくなる。解決策は、SOUL.mdを40〜60行に短く保ち、AGENTS.mdも焦点を絞り、当日と前日の記憶ファイルだけを読み込むこと。エージェントはすべての履歴を毎回読む必要はない。

出力の質が落ちる場合は、記憶のメンテナンスを定期的に行う。ハートビート中に、エージェントは毎日日誌を振り返り、内容をMEMORY.mdに抽出し、古い日次ファイルは削除またはアーカイブする。

調整の衝突も起こり得る。二つのエージェントが同じファイルを書き込もうとする場合だ。解決策は、「一人の書き込み者、複数の読み取り者」の設計だ。DwightはDAILY-INTEL.mdを書き、他のエージェントはそれを読むだけ。誰も書き込みをしない。

最も信頼性の高い教訓は、「シンプルに始める」ことだ。一つのエージェント、一つの仕事、一つのスケジューリング。安定して動作させて一週間、その後に二つ目を追加する。最初から六つのエージェントを展開して混乱するのは、分散システムの未監視展開と同じ誤りだ。

実際のコスト

ハードウェア:Mac Mini M4の新規購入価格は499ドルだが、常時稼働できる古いノートPCや月額5ドルのVPSでも良い。

AIモデルのコスト:私は複数のモデルを組み合わせて使っている。ほとんどのエージェントはClaude OpusとSonnetを使用し、特定のワークフローにはGeminiを使う。さらに、Ollamaでローカルモデルを動かしてコストを抑える試みも行っている。

詳細は以下の通り:

Claude(Maxプラン):月額200ドル

Gemini API:月額50〜70ドル

TinyFish(Webエージェント):月額約50ドル

Eleven Labs(音声合成):月額約50ドル

Telegram:無料

OpenClaw:オープンソース無料

合計:月額約400ドル以内で、休むことのないチームを実現。

何が本当に変わったのか

Dwightは毎日2〜3時間の調査時間を節約している。以前は毎朝X、Hacker News、GitHubのホットリスト、AIブログを手動で確認していたが、今は優先順位付きの要約とリンク、アクションアイテムが届く。

Kelly、Pam、Rachelもそれぞれ1〜2時間のコンテンツ草稿作成時間を節約。Rossは夜にやっていたエンジニアリング作業も処理。

合計:毎日約4〜5時間の節約。

しかし、真の価値は一日ではなく、数週間・数ヶ月にわたる継続性にある。毎日調査を続けるエージェントは、追跡可能な信号やトレンド、パターンを蓄積し、単一の会話では得られない情報を生み出す。Xでの投稿頻度や質も向上し、投稿時間も安定。Awesome LLM Appsリポジトリは継続的に成長し、ニュースレターも信頼できる調査ルートを持つ。

これらのエージェントは、創造的思考や戦略的転換、革新的な突破を行うわけではない。繰り返し作業や構造化された仕事を処理し、人間の脳が必要な本当に重要な作業に集中できる時間を生み出している。

始め方

最初から六つのエージェントを作る必要はない。

第一週:一つのエージェント、一つの仕事。OpenClawをインストールし、エージェントと対話しながら最初のSOUL.mdを作成。毎日繰り返す仕事の中から最もルーチンなもの(多くの人にとっては調査やコンテンツ作成)を選び、Telegramを設定し、cronを作成。1週間動かしてみて、問題点を修正。

第二週:記憶システムを導入し、磨き続ける。最初は平凡な出力でも構わない。フィードバックを与え、記憶ファイルを育て、SOUL.mdを調整。二週目の終わりには、エージェントは実用的な出力を出せるはずだ。

第三週:二つ目のエージェントを追加。調査エージェントが情報を出す一方、ツイート用のコンテンツエージェントも必要だと感じるだろう。共有ファイル方式を採用:最初のエージェントが書き、二つ目のエージェントが読む。調整はファイルシステムだけ。

第四週以降:段階的に追加。必要に応じて新しいエージェントを導入し、実際の仕事のギャップを埋める。デモや概念実証ではなく、実務の中で本当に必要なものを作る。

これを採用するなら、採用活動と同じだ。創業初日に六人雇うのではなく、一人ずつ雇い、効率的に動かしながら、必要に応じて増やす。

心構えの変化

エージェントが一ヶ月以上安定して動き続けると、何かが変わる。AIは単なるツールではなく、常に働き続けるチームとして認識される。

朝Telegramを開くとき、「おはよう、Monica」と声をかけ、寝る前に「おやすみ」と伝える。これは奇妙に思えるかもしれないが、一ヶ月間のやりとりとフィードバックを経て、エージェントと人間の境界は曖昧になり始める。

モデルは基本設定であり、誰もClaudeやGPT、Geminiを使える。システムは、SOUL.md、記憶システム、スケジューリング、調整パターン、数週間のフィードバックを含むあなたのシステムだ。

このシステムはあなたのものであり、他人はあなたと同じエージェントや記憶ファイル、調整済みの個性を持っていない。

しかも、日々複利的に成長している。

Dwightの調査は毎回記憶を豊かにし、Kellyのフィードバックは彼女の草稿を鋭くし、Rossのバグ修正はコード理解を深める。これが真の競争優位だ。モデルではなく、学習するシステムだ。

さあ、今日から始めよう。一つのエージェント、一つの仕事、一つのスケジューリング。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン