こんにちは!
2026年3月13日、Anthropicから大きなニュースがありました。
Claude Opus 4.6とSonnet 4.6の100万トークン(1M)コンテキストウィンドウが、追加料金なしで正式リリース(GA)。
これまでベータ版として一部ユーザーに開放されてましたが、今回は全APIユーザーが使えるようになりました。ベータヘッダーも不要、レート制限もなし。
正直、「100万トークンって言われても、どのくらいなの?」って思いますよね。
実際に触ってみたので、何ができるのか、競合モデルとどう違うのか、日本語で使うときの注意点まで、できるだけ具体的にまとめてみます。
100万トークンって、どのくらいの量?
まず「100万トークン」を身近な単位に変換してみましょう。
| 単位 | 英語の場合 | 日本語の場合 |
|---|---|---|
| 単語数 | 約75万語 | 約25〜35万語 |
| ページ数(A4) | 約1,500〜2,000ページ | 約500〜700ページ |
| 書籍 | 小説5〜7冊分 | 新書3〜4冊分 |
| コードベース | 約15,000〜25,000行 | — |
ちなみに、日本語は英語の2〜3倍のトークンを消費するんです。ひらがな・カタカナ・漢字が混在するので、1文字あたりのトークン数が多くなる。「東京都」だけで5〜6トークン使うこともあります。
これ、けっこう重要なポイント。英語で「100万トークン=小説7冊」って聞くと夢が広がりますが、日本語だとざっくり3分の1くらいに割り引いて考えるのが現実的です。
それでも、新書3〜4冊分を一度に読ませて質問できるわけですから、十分すごい。
ベンチマーク:MRCR v2で圧倒的な差
「コンテキストが長い」だけなら、GeminiもGPTもやってます。大事なのは長い文脈の中から、ちゃんと情報を拾えるか。
ここで使われるのが**MRCR v2(8-needle)**というベンチマーク。100万トークンのテキストの中に8つの「針」(特定の事実)を埋め込んで、モデルがそれを正確に見つけられるか測定するテストです。
| モデル | MRCR v2(1M) | コンテキスト上限 |
|---|---|---|
| Claude Opus 4.6 | 76〜78% | 100万トークン |
| GPT-5.4 | 36% | 105万トークン |
| Gemini 3.1 Pro | 26% | 100万トークン |
| Claude Sonnet 4.5 | 18.5% | 20万トークン |
Opus 4.6のスコアが飛び抜けてるのがわかります。GPT-5.4の2倍以上、Gemini 3.1 Proの約3倍。
実は128Kトークンの範囲では、GeminiもClaudeもほぼ同じスコア(84.9%)なんです。差が出るのは、100万トークンまで伸ばしたとき。つまり本当に長い文脈を扱う能力は、Claudeが現時点で頭一つ抜けているということ。
「Lost in the Middle」問題
ただし、注意点も。
AIの長文処理には「Lost in the Middle(真ん中で迷子になる)」という既知の課題があります。文書の冒頭と末尾の情報はよく拾えるけど、真ん中あたりの情報は見落としやすい、というもの。
MRCR v2で76〜78%ということは、約20〜25%の情報は見落とす可能性があるわけです。
個人的には、100万トークン全体の有効活用率は50〜65%くらいかなと思っています。つまり、「100万トークン入れたから全部完璧に理解してくれる」とは思わない方がいい。
対策として効果的だったのは:
- 重要な情報は文書の冒頭か末尾に配置する
- 構造化されたフォーマット(見出し、番号付きリスト)を使う
- 「〇〇について、文書の△△セクションを参照して回答してください」と明示的に指示する
要は、「長いコンテキスト=何も考えずに放り込めばOK」ではなくて、ちょっとした工夫で精度がかなり変わるということですね。コンテキストエンジニアリングのスキルが重要になってきます。気になる方はContext Engineering Masterスキルも参考にしてみてください。
料金比較:意外と複雑な話
「追加料金なし」というAnthropicの発表、実はちょっとだけ補足が必要です。
API料金(100万トークンあたり)
| モデル | 入力 | 出力 | 日本円換算(入力) |
|---|---|---|---|
| Claude Opus 4.6 | $5.00 | $25.00 | 約¥775 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 約¥465 |
| GPT-5.4 | $2.50 | $15.00 | 約¥388 |
| Gemini 3.1 Pro | $2.00 | $12.00 | 約¥310 |
※1ドル=155円で換算
単純な単価だけ見ると、Gemini 3.1 ProはOpus 4.6の約2.5分の1。安い。
ただし、ここにはトリックがあって——
200Kトークン超えのプレミアム料金
APIで200Kトークンを超えるリクエストを送ると、全トークンにプレミアム料金が適用されます。
| 標準料金(〜200K) | プレミアム料金(200K超) | |
|---|---|---|
| Opus 4.6 入力 | $5.00/MTok | $10.00/MTok |
| Opus 4.6 出力 | $25.00/MTok | $37.50/MTok |
つまり、900Kトークンの報告書を分析する場合、入力だけで約$9.00(約¥1,395)。けっこうかかりますね。
プロンプトキャッシュで90%節約
ここで重要になるのがプロンプトキャッシュ。同じ文書を何度も参照する場合、キャッシュ読み取りは基本料金の10分の1。
| 操作 | Opus 4.6の料金 | 節約率 |
|---|---|---|
| 通常入力 | $5.00/MTok | — |
| キャッシュ書き込み(5分) | $6.25/MTok | — |
| キャッシュ読み取り | $0.50/MTok | 90% |
たとえば、500ページの契約書をキャッシュに入れて、10回質問する場合。キャッシュなしだと毎回フルコスト。キャッシュありなら、2回目以降は10分の1。これで全体のコストを60〜70%削減できます。
実務で100万トークンを使うなら、プロンプトキャッシュは必須かなと思います。
コンテキストコンパクション:もう一つの新機能
Opus 4.6で導入されたコンテキストコンパクションも見逃せない機能です。
これは、長時間のエージェント作業中にコンテキストが上限に近づくと、**AIが自動的に重要な情報を圧縮・要約して、コンテキストを「詰め直す」**仕組み。
従来だと、コンテキストが溢れたら「最初からやり直し」でしたが、コンパクション機能があれば長時間の作業をコンテキスト切れなしで継続できます。
特にClaude Codeでのコーディング作業——大規模なリファクタリングとか、複数ファイルにまたがるデバッグ——で重宝する機能ですね。
日本のビジネスで使える実用シナリオ
実際にどう使うか、日本の仕事に即した例をまとめてみました。
1. 報告書・議事録の一括分析
四半期決算の報告書、会議の議事録、プロジェクトの進捗レポート……気づくと膨大な量になってますよね。
100万トークンなら、**数百ページ分の報告書をまとめて読み込んで、「過去6ヶ月のプロジェクトAの進捗を時系列でまとめて」**みたいな指示が可能。
2. 契約書のクロスリファレンス
日本の契約書って長いですよね。基本契約書、個別契約書、覚書、変更合意書……全部合わせると数百ページになることも。
これを一度にClaudeに読み込ませて「基本契約と個別契約で矛盾する条項はあるか」と聞く使い方はかなり実用的です。
3. 論文・技術文書のレビュー
学術論文やテクニカルドキュメントを複数本読み込ませて、「この5本の論文の主張を比較して、合意点と相違点を整理して」という使い方。研究者やR&D部門にとっては夢のような機能。
4. コードベースの全体把握
15,000〜25,000行のコードベースを丸ごと読み込ませて、アーキテクチャの分析やバグの特定を依頼する。CIのログやテスト結果も一緒に投げられるのは大きい。
5. 日本語×英語の翻訳・ローカライズ
社内ドキュメントの英訳、海外パートナーとの契約書の和訳など、元文書と参考資料をまとめて投入できるので、文脈を踏まえた精度の高い翻訳ができます。
日本語で使うときの注意点
繰り返しになりますが、ここが本当に大事。
トークン効率の違い
英語: "artificial intelligence" = 2 トークン
日本語: "人工知能" = 4〜5 トークン
日本語テキストは英語の2〜3倍のトークンを消費します。つまり:
| 英語 | 日本語 | |
|---|---|---|
| 100万トークンで読める量 | 約75万語 | 約25〜35万語 |
| 新書1冊(約10万字) | 約13万トークン | 約25〜30万トークン |
| 100万トークンで読める冊数 | 5〜7冊 | 3〜4冊 |
APIコストも当然、日本語の方が割高になります。同じ内容の文書でも、日本語版は英語版の2〜3倍のトークンを消費するので、コスト意識は英語ユーザーの2倍くらい持っておく方がいいです。
AIトークンカウンターで事前にトークン数を確認しておくと安心です。
実用的なコスト削減テクニック
- プロンプトキャッシュを積極活用(上で紹介した90%節約)
- **バッチAPI(50%割引)**を使えるワークフローは使う
- 英語で指示を出して、日本語で回答を得るパターンも検討する(入力トークン節約)
- 不要な前置きや繰り返しを省いた簡潔なプロンプトを心がける
他モデルとの総合比較
最後に、主要モデルの比較表をまとめておきます。
| Claude Opus 4.6 | GPT-5.4 | Gemini 3.1 Pro | |
|---|---|---|---|
| コンテキスト | 100万トークン | 105万トークン | 100万トークン |
| MRCR v2(1M) | 76〜78% | 36% | 26% |
| 入力料金 | $5.00/MTok | $2.50/MTok | $2.00/MTok |
| 出力料金 | $25.00/MTok | $15.00/MTok | $12.00/MTok |
| プロンプトキャッシュ | 90%割引 | 約93%割引 | 時間課金制 |
| コンテキストコンパクション | あり | — | — |
| 得意分野 | 長文理解・コード・推論 | 汎用・ツール連携 | リサーチ・マルチモーダル |
コスパで選ぶならGemini 3.1 Pro。長文処理の精度で選ぶならClaude Opus 4.6。バランス型ならGPT-5.4。
用途によって最適なモデルが変わるので、「どれが最強」という話ではないです。各モデルの詳しい比較はChatGPT・Claude・Gemini比較記事でも書いてます。
まとめ
Claude Opus 4.6の100万トークンGA、実際に触ってみて感じたのは「量の変化が質の変化を生む」ということ。
20万トークンまでだと「文書を分割して何回かに分けて処理する」必要があったけど、100万トークンなら一発で全体を把握できる。この差はかなり大きい。
ただし、万能ではない。日本語のトークン効率、200K超のプレミアム料金、Lost in the Middleの課題——この3つは頭に入れておいた方がいいです。
個人的なおすすめの使い方:
- まずは20万トークン以内で試す(標準料金で使える範囲)
- プロンプトキャッシュを必ず設定する(コスト90%削減)
- 重要な情報は文書の冒頭・末尾に配置(精度向上)
- 日本語はトークン2〜3倍を常に意識(コスト管理)
100万トークンの時代、始まりましたね。まだまだ発展途上ではありますが、使い方次第でかなりの武器になるかなと思います。
少しでも参考になれば嬉しいです。最後までお読みいただきありがとうございました!