Claude Codeの「ultrathink」を試してみた:拡張思考モードの使いどころ

Claude Codeには隠れた思考モードがある。「think」から「ultrathink」まで、段階的に思考予算が増える仕組みを実際に使って検証してみました。

こんにちは!

Claude Codeを使ってて、「なんか複雑な問題でも一発で解決してくれることがある」と感じたことありませんか?

実はこれ、Claude Codeには「拡張思考モード(Extended Thinking)」という機能が隠れてるんです。

Anthropicの公式ドキュメントにはちゃんと書いてあるんですけど、あんまり知られてない。自分も最初は存在を知らなくて、調べてみたら「なるほど、だから複雑な問題で精度が上がるのか」と納得しました。

今日は、この拡張思考モードを実際に使ってみて、どういう時に効くのかをまとめます。


拡張思考モードって何?

普段AIに質問すると、わりとすぐに回答が返ってきますよね。

でも複雑な問題——アーキテクチャ設計とか、厄介なバグのデバッグとか——だと、「もうちょっと考えてから答えてほしい」と思うことがあります。

拡張思考モードは、まさにそれ。Claudeに「回答する前に、ちゃんと考える時間」を与える機能です。

普通のClaudeが「思いついたことをすぐ言う同僚」だとしたら、拡張思考モードのClaudeは「ちょっと待って、考えさせて」と言ってから、本当に考えてくれる同僚。


思考レベルは4段階ある

Claude Codeでは、特定のキーワードで思考レベルをトリガーできます。

キーワード思考予算使いどころ
think約4,000トークンシンプルなバグ修正、基本的なリファクタリング
think hard / megathink約10,000トークンAPI設計、データベース計画、最適化
think harder / ultrathink約32,000トークンアーキテクチャ再設計、本番環境の重大バグ、複雑な移行

「think」から「ultrathink」まで、段階的に「思考予算」が増える仕組みになってます。

ちなみに、「think about it」「think deeply」「think more」あたりでもmegathinkレベルが発動します。最大限の思考が欲しいときは「ultrathink」が確実です。


実際に使ってみた

ケース1:複雑なバグ調査

このバグの根本原因についてultrathinkして。
再現手順、エラーログ、関連コードを添付するから、
なぜこれが起きてるのか分析して。

普通に「バグを直して」と頼むより、原因の分析が深くなりました。複数の仮説を検討して、可能性の高い順に整理してくれる感じ。

ケース2:リファクタリング戦略

このモジュールをどう分割するのが最適か、think harderして。
現在の構造、依存関係、将来の拡張性を考慮して提案して。

こういう「正解が一つじゃない問題」で、拡張思考モードは特に効く印象です。複数のアプローチを比較検討してくれます。


ハマりポイント:Claude.aiでは効かない

これ、最初に知っておいてほしいんですけど。

ultrathinkとかのキーワードは、Claude Code(ターミナル/CLIツール)でしか効きません。

Claude.aiのWebインターフェースで「ultrathink」と入力しても、ただの単語として扱われるだけ。APIも同じで、思考パラメータを明示的に設定しないとキーワードは無意味です。

ネットで「プロンプトにultrathinkを追加するだけ」というアドバイスを見かけますが、それはClaude Codeを使ってる場合だけの話。Webチャットでは別のプロンプト技術に頼る必要があります。


いつ使うべきか

すべてのタスクにultrathinkが必要なわけじゃないです。むしろ、乱用すると時間がかかるだけ。

thinkレベル(約4Kトークン)が適してる場面

  • シンプルなバグ修正
  • 明確な答えがある質問
  • 定型的なコード生成

megathinkレベル(約10Kトークン)が適してる場面

  • API構造の設計
  • データベーススキーマの計画
  • パフォーマンス最適化
  • コードアーキテクチャのレビュー

ultrathinkレベル(約32Kトークン)が適してる場面

  • システムアーキテクチャの再設計
  • 本番環境の重大バグ調査
  • 複数システムに影響する移行作業
  • 間違えると大きな影響がある問題

「この問題、どのくらい複雑か?」で使い分けるのがコツかなと思います。


コストの話

拡張思考モードはトークンを消費するので、APIで課金されてる場合はコストが増えます。

2025年現在の目安:

  • 基本思考(約4Kトークン):タスクあたり約$0.06
  • 強化思考(約10Kトークン):タスクあたり約$0.15
  • ultrathink(約32Kトークン):タスクあたり約$0.48

個人プロジェクトなら気にならないレベルですが、チームで大量に使う場合は意識したほうがいいかもしれません。

ただ、公式ドキュメントによると「最初にちゃんと考えさせることで、間違った方向に進んでからの修正コストを減らせる」という見方もあるみたいです。結果的にコスト効率が上がる可能性はあります。


Claude 4のインターリーブド思考

最新のClaude 4モデルでは「インターリーブド思考」という機能も追加されてます。

これは、ツール呼び出しの間にも思考できる仕組み。ファイルを読んで、コマンドを実行して、変更を適用して……というエージェント的なタスクで、途中途中で推論できるようになりました。

複数ファイルを触るような複雑なコーディングタスクでは、拡張思考モードの価値がさらに上がってる感じですね。


まとめ

拡張思考モードは、複雑な問題でClaude Codeの精度を上げる機能。

  • think:日常的なタスク
  • megathink:設計・最適化作業
  • ultrathink:本当に難しい問題

この使い分けを意識するだけで、かなり結果が変わります。

ただし、Claude.aiのWebインターフェースでは効かないので注意。Claude Codeを使ってる人限定の技です。

次に複雑なバグや設計問題にぶつかったとき、「ultrathinkして」と一言追加してみてください。違いが実感できると思います。


関連記事: