Claude Codeのトークンコストは、CLAUDE.mdの最適化・Extended Thinking調整・MCP無効化・/clearと/compactの使い分けの4軸を整えるだけで月額を半額以下に抑えられます。本記事では実測値を踏まえた具体的な設定術を解説します。
「Claude Codeを使い始めたら月の支払いが$300を超えて焦った」「Opusを多用しているせいか、思ったよりトークンが減るのが早い」――そんな悩みはありませんか?
本記事を読むと、Anthropic公式が公開している実測コスト水準と、開発者1人あたりの月額を$100以下に抑えるための即効性の高い設定が体系的にわかります。
Claude Codeのトークンコストはなぜ膨らむのか?
最大の原因は毎リクエスト送信される「ベースコンテキスト」の肥大化です。CLAUDE.md・MCP定義・有効化中のスキルなど、ユーザー操作とは別に毎回付与されるトークンが累積コストを跳ね上げます。
Anthropic公式によると、エンタープライズ平均は開発者1人あたり1日$13、月$150〜$250、90%のユーザーは1日$30以下に収まります。一方で設定を放置すると簡単に倍以上のコストが発生します。
何が主にトークンを消費している?
| 消費源 | 典型的な使用量 | 削減難易度 |
|---|---|---|
| CLAUDE.md | 毎リクエスト数千〜1万トークン | ★(最も即効性) |
| MCP定義 | サーバー毎に数百〜数千トークン | ★ |
| Extended Thinking | 1タスクで数万トークン | ★★ |
| 不要ファイル探索 | node_modules探索で数万 | ★★ |
即効性の高いコスト削減設定5選
優先度順に「①/clearを毎タスク後に実行」「②CLAUDE.mdを200行以下に圧縮」「③モデル選択をSonnetデフォルトに」「④Extended Thinkingをmediumに制限」「⑤未使用MCPサーバーを無効化」の5つを実施してください。これだけで月額の40〜60%削減が見込めます。
設定① /clear と /compact を使い分ける
タスクが切り替わるタイミングで/clearを打つだけで、それまでに蓄積したコンテキストトークンを毎回リセットできます。長時間の連続セッションでは/compact Focus on code samples and API usageのようにカスタム指示付きで圧縮するのが効果的です。
設定② CLAUDE.mdを200行以下に最適化する
CLAUDE.mdはアーキテクチャ概要・主要ディレクトリ説明・コーディング規約の最小限に絞り、詳細手順はスキルファイルに分離しましょう。「コードレビューの手順」「PR作成のフロー」などはCLAUDE.mdから外し、必要時のみロードされるスキルへ移行します。
設定③ モデル選択(Sonnet/Opus/Haiku)
デフォルトはSonnet 4.6で、巨大なリファクタリングやアーキテクチャ設計のみOpus 4.7に切り替えるのが鉄則。Haiku 4.5はサブエージェントへの割り当て先として最適で、CI/CD自動化との相性も抜群です。
設定④ Extended Thinkingを調整する
思考トークンは「出力扱い」で課金されるため、Opusで深い思考を多用するとコストが跳ね上がります。/effort mediumまたは環境変数MAX_THINKING_TOKENS=8000で上限を設定し、必要な場面のみhighに上げるメリハリ運用が推奨です。
設定⑤ 未使用MCPサーバーを無効化する
/mcpコマンドで現在有効なMCPサーバー一覧を確認し、使っていないものを無効化します。1サーバーあたり数百〜数千トークンの定義が毎リクエスト送信されるため、放置の影響は想像より大きいです。
上級者向けのコスト削減テクニック
PreToolUseフックでテスト出力やログをClaudeに渡す前にフィルタリングすると、不要な数千トークンを根本から削減できます。さらにgh/awsなどのCLIツールをMCPの代替として使えば、MCP定義のオーバーヘッドも消せます。
テスト実行結果のうち、失敗したケースだけClaudeに渡すようにフックを設定。settings.jsonで"PreToolUse"に処理スクリプトを指定するだけ。
GitHub操作はghコマンド、AWS操作はawsコマンドで代替。MCP定義トークンが消えるため、特に多数のサーバーを抱えていた場合に効果大。
TypeScript・Goなど型情報を持つ言語ではプラグインを有効化。Claudeが構造を把握するためのファイル読み取り回数が減ります。
インフラエンジニア向けの設定例は?
大規模TerraformリポジトリではCLAUDE.mdに.terraform/と*.tfstateを除外指定するだけで1回の探索で数万トークン削減できます。プランモード(Shift+Tab)を活用し、IaCコード変更前に方針を確定させると手戻りも防げます。
チーム展開時はClaude ConsoleでWorkspaceごとのレート制限とコスト上限を設定し、新人エンジニアの予想外の高額利用を防止しましょう。
コスト追跡と監視はどうする?
セッション中の利用状況は/usageコマンドで即確認可能。ステータスラインに残りコンテキスト量を常時表示するよう設定すれば、トークン肥大化に気づきやすくなります。
エンタープライズではLiteLLM経由でAnthropic APIを呼び出すと、組織全体のコストを部門・ユーザー別にダッシュボード化できます。
まとめ:4軸の最適化で月額を半額以下に
- /clearを毎タスク後に実行し、コンテキスト蓄積をリセット
- CLAUDE.mdは200行以下に絞り、詳細はスキルへ分離
- モデルはSonnetデフォルト・Opusは限定運用
- Extended Thinkingをmediumに制限し、必要時のみhighに
- 未使用MCPサーバーを無効化して定義オーバーヘッドを削除
FAQ
/clear と /compact はどう使い分ける?▼
/clearでリセット、同じプロジェクトの作業を継続するなら/compactで要約圧縮。compactは前の情報を凝縮した形で引き継げるため、長時間セッションに最適です。

コメント