OpenClaw Token 節約の究極ガイド:最強モデルを使って、最小の費用で/内含ヒントワード

PANews

作者:xiyu

Claude Opus 4.6 を使いたいけど、月末の請求が爆発しそう?この記事で60〜85%コスト削減を実現します。

1. トークンはどこに使われている?

あなたはトークンは「あなたの言ったこと + AIの返答」だけだと思っていませんか?実際はそれだけではありません。

会話ごとの隠れたコスト:

  • システムプロンプト(約3000〜5000トークン):OpenClawのコア指示、変更不可
  • コンテキストファイルの注入(約3000〜14000トークン):AGENTS.md、SOUL.md、MEMORY.mdなど、毎回会話に含まれる—これが最大の見えないコスト
  • 履歴メッセージ:会話が長くなるほど増加
  • あなたの入力 + AIの出力:これが「すべて」だと思っている部分

シンプルな「今日の天気は?」でも、実際には8000〜15000入力トークンを消費します。Opusで計算すると、コンテキストだけで$0.12〜0.22かかる計算です。

Cronはさらに厳しい:毎回新規会話として全コンテキストを再注入。15分ごとに実行されるCronは1日96回、Opusのコストは1日あたり$10〜20。

Heartbeatも同様:基本的に会話呼び出しなので、間隔が短いほどコスト増。

2. モデルの階層化:日常はSonnet、重要なときはOpus

コスト削減の最も効果的な方法。SonnetはOpusの約1/5の価格で、80%の日常タスクに十分対応。

提案例:

OpenClawのデフォルトモデルをClaude Sonnetに変更し、

深い分析や創作時だけにOpusを使う。

具体的な設定:

  1. デフォルトモデルをSonnetに設定

  2. cronタスクもSonnetを使用

  3. 文章作成や深い分析だけにOpusを指定

**Opusの用途例:**長文作成、複雑なコード、多段推論、クリエイティブなタスク

**Sonnetの用途例:**日常会話、簡単な質問応答、cronチェック、heartbeat、ファイル操作、翻訳

**実測結果:**切り替え後、月コストが65%削減、体感ほぼ変わらず。

3. コンテキストのスリム化:見えないトークンの大口を削減

毎回の呼び出しで「ノイズ」となる部分は3000〜14000トークン。注入ファイルの最適化が最もコスパ良し。

提案例:

OpenClawのコンテキストファイルを最適化してトークン節約。

具体的には:

  1. AGENTS.mdの不要部分(グループチャットルール、TTS、不要な機能)を削除し、800トークン以内に圧縮

  2. SOUL.mdを要点だけに簡潔化し、300〜500トークンに

  3. MEMORY.mdの古い情報を整理し、2000トークン以内に

  4. workspaceFiles設定を見直し、不要なファイルの注入を除去

経験則:注入トークンを1000減らすごとに、1日100回の呼び出しを想定し、月に約$45節約。

4. Cronの最適化:最も見えにくいコスト削減策

提案例:OpenClawのcronタスクを最適化してトークン節約。

やること:

  1. すべてのcronタスクと頻度、モデルをリストアップ

  2. クリエイティブ以外のタスクはSonnetにダウングレード

  3. 同じ時間帯のタスクをまとめる(例:複数のチェックを一つに)

  4. 不要な高頻度を抑制(システムチェックを10分から30分に、バージョンチェックを1日1回に)

  5. deliveryをオンデマンド通知に設定し、通常時は通知しない

基本原則:頻繁に呼び出す必要はない。多くの「リアルタイム」要求は偽のニーズ。5つの独立したチェックを1回にまとめることで、コンテキスト注入コストを75%削減。

5. Heartbeatの最適化

提案例:OpenClaw heartbeat設定の最適化。

やること:

  1. インターバルを45〜60分に設定

  2. 深夜23:00〜8:00は静音モード

  3. HEARTBEAT.mdを最小限の行数に簡素化

  4. 分散していたチェックをheartbeatにまとめて一括実行

6. 精密検索:qmdを使って入力トークンを90%削減

agentは資料検索時、「全文読む」設定になっています—500行のファイルは3000〜5000トークンですが、必要なのは10行だけ。90%の入力トークンが無駄に消費されている

qmdはローカルのセマンティック検索ツールで、全文+ベクトル索引を構築し、agentが段落を正確に特定できるようにします。すべてローカル計算でAPIコストゼロ

mq(Mini Query)と併用:ディレクトリ構造のプレビュー、段落の正確抽出、キーワード検索—必要な10〜30行だけを読む。

提案例:qmdの知識ベース検索設定。

Github:https://github.com/tobi/qmd

必要な設定:

  1. qmdのインストール

  2. 作業ディレクトリにインデックス作成

  3. AGENTS.mdに検索ルールを追加し、agentにqmd/mq優先で検索させる

  4. 定期的にインデックスを更新

実測効果:資料検索時のトークンが15000から1500に減少、90%削減。

memorySearchとの違い:memorySearchは「記憶」(MEMORY.md)を対象、qmdは「資料検索」(独自知識ベース)を担当し、相互に干渉しません。

7. Memory Searchの選択

提案例:OpenClawのmemorySearch設定。

記憶ファイルが少ない(数十のmd)場合、

ローカル埋め込みとVoyage AIのどちらがおすすめ?

それぞれのコストと検索精度の違いを解説。

**結論:**ファイルが少なければローカル埋め込み(コストゼロ)、多言語対応やファイル数が多い場合はVoyage AI(1アカウントあたり2億トークン無料)がおすすめ。

8. 最終設定リスト

提案例:OpenClawの設定を一括最適化し、最大のコスト削減を実現。

以下の内容を実行:

・デフォルトモデルをSonnetに変更し、創作・分析タスクだけにOpusを使う

・AGENTS.md、SOUL.md、MEMORY.mdを最適化

・すべてのcronをSonnetにダウングレード&合併&頻度を下げる

・Heartbeatは45分間隔+深夜静音

・qmdによる精密検索に置き換え

・workspaceFilesは必要なファイルだけ残す

・MEMORY.mdは定期的に整理し、2000トークン以内に

長期的なメリット:

  1. モデルの階層化—Sonnetは日常、Opusは重要な作業に、コストを60〜80%削減

  2. コンテキストのスリム化—ファイルの最適化+qmdによる正確検索で入力トークンを30〜90%削減

  3. 呼び出し回数の削減—cronの合併、heartbeatの延長、静音期間の設定

Sonnet 4はすでに高性能。日常用途では違いを感じません。必要なときだけOpusに切り替えればOK。

実戦経験に基づく多エージェントシステムの推定値です。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし