作者:xiyu
Claude Opus 4.6 を使いたいけど、月末の請求が爆発しそう?この記事で60〜85%コスト削減を実現します。
あなたはトークンは「あなたの言ったこと + AIの返答」だけだと思っていませんか?実際はそれだけではありません。
会話ごとの隠れたコスト:
シンプルな「今日の天気は?」でも、実際には8000〜15000入力トークンを消費します。Opusで計算すると、コンテキストだけで$0.12〜0.22かかる計算です。
Cronはさらに厳しい:毎回新規会話として全コンテキストを再注入。15分ごとに実行されるCronは1日96回、Opusのコストは1日あたり$10〜20。
Heartbeatも同様:基本的に会話呼び出しなので、間隔が短いほどコスト増。
コスト削減の最も効果的な方法。SonnetはOpusの約1/5の価格で、80%の日常タスクに十分対応。
提案例:
OpenClawのデフォルトモデルをClaude Sonnetに変更し、
深い分析や創作時だけにOpusを使う。
具体的な設定:
デフォルトモデルをSonnetに設定
cronタスクもSonnetを使用
文章作成や深い分析だけにOpusを指定
**Opusの用途例:**長文作成、複雑なコード、多段推論、クリエイティブなタスク
**Sonnetの用途例:**日常会話、簡単な質問応答、cronチェック、heartbeat、ファイル操作、翻訳
**実測結果:**切り替え後、月コストが65%削減、体感ほぼ変わらず。
毎回の呼び出しで「ノイズ」となる部分は3000〜14000トークン。注入ファイルの最適化が最もコスパ良し。
提案例:
OpenClawのコンテキストファイルを最適化してトークン節約。
具体的には:
AGENTS.mdの不要部分(グループチャットルール、TTS、不要な機能)を削除し、800トークン以内に圧縮
SOUL.mdを要点だけに簡潔化し、300〜500トークンに
MEMORY.mdの古い情報を整理し、2000トークン以内に
workspaceFiles設定を見直し、不要なファイルの注入を除去
経験則:注入トークンを1000減らすごとに、1日100回の呼び出しを想定し、月に約$45節約。
提案例:OpenClawのcronタスクを最適化してトークン節約。
やること:
すべてのcronタスクと頻度、モデルをリストアップ
クリエイティブ以外のタスクはSonnetにダウングレード
同じ時間帯のタスクをまとめる(例:複数のチェックを一つに)
不要な高頻度を抑制(システムチェックを10分から30分に、バージョンチェックを1日1回に)
deliveryをオンデマンド通知に設定し、通常時は通知しない
基本原則:頻繁に呼び出す必要はない。多くの「リアルタイム」要求は偽のニーズ。5つの独立したチェックを1回にまとめることで、コンテキスト注入コストを75%削減。
提案例:OpenClaw heartbeat設定の最適化。
やること:
インターバルを45〜60分に設定
深夜23:00〜8:00は静音モード
HEARTBEAT.mdを最小限の行数に簡素化
分散していたチェックをheartbeatにまとめて一括実行
agentは資料検索時、「全文読む」設定になっています—500行のファイルは3000〜5000トークンですが、必要なのは10行だけ。90%の入力トークンが無駄に消費されている。
qmdはローカルのセマンティック検索ツールで、全文+ベクトル索引を構築し、agentが段落を正確に特定できるようにします。すべてローカル計算でAPIコストゼロ。
mq(Mini Query)と併用:ディレクトリ構造のプレビュー、段落の正確抽出、キーワード検索—必要な10〜30行だけを読む。
提案例:qmdの知識ベース検索設定。
Github:https://github.com/tobi/qmd
必要な設定:
qmdのインストール
作業ディレクトリにインデックス作成
AGENTS.mdに検索ルールを追加し、agentにqmd/mq優先で検索させる
定期的にインデックスを更新
実測効果:資料検索時のトークンが15000から1500に減少、90%削減。
memorySearchとの違い:memorySearchは「記憶」(MEMORY.md)を対象、qmdは「資料検索」(独自知識ベース)を担当し、相互に干渉しません。
提案例:OpenClawのmemorySearch設定。
記憶ファイルが少ない(数十のmd)場合、
ローカル埋め込みとVoyage AIのどちらがおすすめ?
それぞれのコストと検索精度の違いを解説。
**結論:**ファイルが少なければローカル埋め込み(コストゼロ)、多言語対応やファイル数が多い場合はVoyage AI(1アカウントあたり2億トークン無料)がおすすめ。
提案例:OpenClawの設定を一括最適化し、最大のコスト削減を実現。
以下の内容を実行:
・デフォルトモデルをSonnetに変更し、創作・分析タスクだけにOpusを使う
・AGENTS.md、SOUL.md、MEMORY.mdを最適化
・すべてのcronをSonnetにダウングレード&合併&頻度を下げる
・Heartbeatは45分間隔+深夜静音
・qmdによる精密検索に置き換え
・workspaceFilesは必要なファイルだけ残す
・MEMORY.mdは定期的に整理し、2000トークン以内に
長期的なメリット:
モデルの階層化—Sonnetは日常、Opusは重要な作業に、コストを60〜80%削減
コンテキストのスリム化—ファイルの最適化+qmdによる正確検索で入力トークンを30〜90%削減
呼び出し回数の削減—cronの合併、heartbeatの延長、静音期間の設定
Sonnet 4はすでに高性能。日常用途では違いを感じません。必要なときだけOpusに切り替えればOK。
実戦経験に基づく多エージェントシステムの推定値です。