Claude Fable 5とは?性能・安全機構・6月22日までの無料期間

Claude Fable 5を徹底解説。Mythosの背景、GPT-5.5との実ベンチマーク比較、2層の安全機構、料金、そして6月22日まで追加料金なしで試す方法まで。

2か月前、AnthropicはあるAIモデルを開発しましたが、すぐに「これは売るには危険すぎる」と判断しました。このモデルは、主要なOSやブラウザの未知のセキュリティホールを自律的に発見できる能力を持っており、同社はそれを閉じ込め、約200名の厳選されたパートナーのみがアクセスできる状態にしました。

昨日、そのまさに同じモデルがClaudeアプリに姿を現しました。ただし、それは「檻」の中に入れた状態でです。

Claude Fable 5は、一般ユーザーがこれまで使えた中で最も高性能なAIモデルです。その性能差は、多くのベンチマーク観測者を驚かせるほどでした。しかし、今年のリリースとして最も奇妙な点もあります。価格が前の旗艦モデルの倍、特定の質問には別のモデルが静かに回答する仕組み、そしてClaudeのサブスクリプションユーザーにとっても、6月22日までの無料提供という制限がある点です。日本のメディアも即座に反応し、ITmediaはシンプルにこう指摘しました。「試すなら今が時」です。ここではその全貌と、この2週間の無料枠を無駄にしないための方法を解説します。

Claude Fable 5 は実際、何なのか

一言で言えば、Fable 5は安全装置を備えたAnthropicの「Mythos」モデルです。

詳しい背景は4月7日に遡ります。Anthropicは前線モデル「Claude Mythos Preview」を発表しましたが、公開は見送りました。このモデルは、まだ誰も知らない脆弱性(ゼロデイ脆弱性)を自律的に発見し、実際の攻撃コード(エクスプロイト)に変換できる能力を持っていました。Anthropicによると、主要なOSとブラウザのすべての重大なバグを見つけ、その99%は従来知られていなかったものです。UK AI Security Instituteが独自に評価した結果、Mythosは1年前にはどのモデルも着手すらできなかった専門レベルのサイバータスクの73%を完了しました。

そのため、Mythosは一般公開ではなく「Project Glasswing」と呼ばれる限定プログラムへと移行しました。Apple、Google、Microsoft、Nvidia、AWS、そして最終的に15カ国以上約200の組織が参加し、攻撃者よりも先に自社の脆弱性を発見・修正するためにこのモデルを活用しています。Anthropicは修正作業を支援するため、最大1億米ドルの使用クレジットを提供しました。

6月9日にリリースされたFable 5は、私たち一般ユーザーにとっての入り口です。Anthropicの表現を借りれば、「一般利用に安全に適合させたMythosクラスのモデル」です。同じ頭脳を持ち、ただし異なるルールで動きます。

ベンチマークの数値

ベンチマークの数値は全てを語らないものの、今回のリリース表は圧倒的でした。SWE-bench Pro(標準的な実務コーディングテストの、より難易度が高く不正対策が施されたバージョン)でFable 5は**80.3%**を達成し、80%の壁を破った初のモデルとなりました。Anthropicの以前の旗艦モデル「Claude Opus 4.8」は69.2%、OpenAIの「GPT-5.5」は58.6%、Googleの「Gemini 3.1 Pro」は54.2%です。

Claude Fable 5およびMythos 5の公式ベンチマーク表:SWE-Bench Proで80.3%(Opus 4.8は69.2%、GPT-5.5は58.6%)、知識作業・PC操作・法律・生物学でも首位
Claude Fable 5 リリースベンチマーク

Anthropicのリリース用ベンチマーク表。アスタリスク付きの行はFable 5の安全装置が作動する箇所であり、これらのスコアは制限なしのMythos 5のものです。出典:Anthropic

コーディング以外の分野でもパターンは同じです。

ベンチマーク(測定内容)Fable 5 / Mythos 5Opus 4.8GPT-5.5Gemini 3.1 Pro
SWE-bench Pro(実務コーディング)80.3%69.2%58.6%54.2%
GDPval-AA(オフィスでの知識作業、Elo)1932189017691314
Legal Agent Benchmark(法務作業)13.3%10.4%2.1%0.0%
OSWorld-Verified(PC操作)85.0%83.4%78.7%76.2%
Terminal-Bench 2.1(エージェント型ターミナル作業)88.0%82.7%83.4%70.7%

2つの行は特に注目して翻訳する価値があります。GDPvalは、44の職業のメモ、分析、レポートといった「実際のオフィスでの成果物」を測定する指標です。GPT-5.5との1932対1769の差は、コーディングのテストではなく「あなたの実際の仕事」のベンチマークと言えます。また、Legal Agent Benchmarkの数値はテストが非常に厳格なためコミカルに低く見えますが、順位が重要です。13.3%対2.1%は、エージェント型法律業務において6倍の差があることを示しています。

実世界の事例も次々と届いています。Stripeによると、このモデルは推計でチーム作業に2ヶ月以上かかるとされる5000万行のコードベース移行を、たった1日で完了させました。独立系の集計サイト「Artificial Analysis」は、Fable 5をインテリジェンスインデックスで64.9ポイント、1位にランク付けしました。これはAnthropic以外の最高モデルを約5ポイント引き離すもので、複合インデックスにおいてこれは極めて大きな差です。

「檻」の中:2つの安全レイヤー

ここが今回のリリースで本当に新しい部分であり、かつ議論の的となっている点です。

1つ目のレイヤーは目に見えます。 別の分類器モデルがすべてのリクエストを監視しています。特定の3つのカテゴリー(攻撃的なサイバーセキュリティ、生物・化学、または競合他社のモデル訓練のためにモデルの能力を引き出そうとする試み)の質問が検出されると、Fable 5は回答しません。代わりにClaude Opus 4.8が回答し、その旨がユーザーに通知されます。まるで専門家が特定の質問を直面して断るのではなく、同僚に引き渡すような仕組みです。Anthropicによると、セッションの95%以上はこれに触发されません。この設計の真価は1つの数値に表れています。エクスプロイト開発のテストでは、制限なしのMythos 5が78%のスコアを取るのに対し、Opus 4.8は40%です。その38ポイントの差こそが、Anthropicが攻撃者に決して手渡したくない「Advantage」です。

2つ目のレイヤーは目に見えず、専門家の間で議論になっています。 システムカードの隅に書かれていますが、前線AIそのものの構築(前線学習パイプライン、分散学習インフラ、アクセラレータ設計など)に関するリクエストに対し、Fable 5は拒否もせず、引き渡しもしません。代わりに、通知なしでステアリングベクトルや修正されたプロンプトを用いて、意図的に品質を制限した回答を行います。Anthropicによると、これは全体のトラフィックの約0.03%、組織の0.1%未満に影響します。

このモデルを称賛する人々からも批判の声が上がっています。同じエッセイでFable 5を「一般公開されている中で最も賢いモデル」と称したAI研究所(Allen Institute for AI)のNathan Lambert氏は、通知なしに自動的に知能が低下するAIモデルは、根本的にアライメント(価値適合)が崩れていると指摘しました。より深い懸念は、拒否は可視化され引き渡しは評価できますが、静かに弱められた回答の場合は、自分のアイデアが失敗したのか、コードが失敗したのか、それともモデルが力を控えていたのかさえ分からない点です。

公平な反論もあります。確かに記録は残っており(それゆえに発見された)、影響を受けるトラフィックは微小であり、このポリシーは利用規約ページを無視する可能性が最も低い行動をターゲットにしている点です。大多数の職種には影響ありません。しかし、この「先例」が作られたこと自体が、本当のニュースです。

もう1つ隠された詳細があります。すべてのMythosクラストラフィックには、ゼロ保存契約を持つ企業であっても、強制された30日間のデータ保持期間が設けられています。Anthropicは、これは訓練用ではなく新型攻撃や Jailbreak を検出するためだと説明しています。機密性の高い顧客データを扱う場合は、これ経由で業務を処理する前に法務部門に確認してください。

価格と、6月22日の期限

Fable 5の入力トークン100万あたり10米ドル、出力トークン100万あたり50米ドルです。Opus 4.8のちょうど倍額ですが、早期パートナー向けにMythos Previewが課した価格の半分未満です。コンテキストウィンドウ(約100万トークン、約75万字のワーキングメモリ)と最大応答長(12万8000トークン)は従来通り変わりません。頭脳が向上しただけで、容器はそのままです。

APIユーザーにとって、これがすべてです。現在利用可能で、従量課金です。

Claude Pro、Max、Teamのサブスクリプションに加入する数百万人にとって、時計は回っています。Fable 5は有料プランに追加料金なしで含まれますが、6月22日までという制限があります。Opusの倍の速度で利用クォータを消費しながらです。6月23日以降は、容量が許す限り「標準的な一部として復帰するまで」別の使用クレジットに移行します。具体的な日付は付いていません。CNET JapanとITmediaもこの期限を最大の見出しとして扱っており、Anthropicもリリース期間中のClaudeのレートリミットをリセットしました。

この2週間の窓は、ベンチマーク以上の議論を巻き起こしました。ある viral な意見は「定額制AIサブスクリプションは終わった」と断言しました。前線モデルの経済性は「食べ放題」プランでは成立せず、使用クレジットが誰もが追随する未来だと。冷静な読み解きでは、AnthropicはMythosクラスの計算リソースを正直に価格設定したが、リリース需要に押しつぶされ、GPUが追いつくまで割り当てを調整しているだけだと。どちらも真実であり得ます。実務的な事実は変わりません。無料体験は6月22日で終了するということです。

やれないこと

  • 安価でも高速でもない。 倍の価格は現実です。初期ユーザーからは長時間の推論時間や、40分以上かかるエージェント型タスクの請求書が報告されています。日常的な簡単な質問には不向きです。絵の額を掛けるために建築士を雇うようなものです。
  • すべての分野で最強ではない。 Andon Labsは制限なしのMythos 5を自社のVending-Bench(ビジネス模擬ゲーム)でテストしましたが、Opus 4.7やGPT-5.5よりも少ない資金でしか利益を上げませんでした。1チーム、1ベンチマークですが、リリース時の熱狂に対する有用な解毒剤です。
  • 7月のサブスクリプションで確実に使い続けられるわけではない。 「容量が許す限り復帰」は意図であって日付ではありません。

Fable 5とOpus 4.8、どちらを使うべきか?

Opus 4.8が消えたわけではありません。半額の価格帯であれば、ほとんどの作業にとって依然として賢明なデフォルトです。

タスク使い分け
日常の文章作成、メール、要約Opus 4.8 — Fable はオーバースペックです
長期にわたる多段階の研究や分析Fable 5 — 深掘りした際に差が明確になります
本格的なコーディング、デバッグ、マイグレーションFable 5 — ここで他のモデルを圧倒します
複雑な文書:金融、法律、高密度なPDFFable 5 — GDPvalや法律関連の数値がその根拠です
セキュリティ研究、生物・化学のトピックOpus 4.8 を直接 — Fable も結局は専門モデルに委譲します
予算内で高ボリュームな自動化タスクOpus 4.8 または Haiku — トークンコストがすぐに積み上がります

あなたにとっての意義

すでにClaude Pro、Max、Teamに加入しているなら: 6月22日までに、追加コストなしで「その差があなたの仕事に意味を持つか」を試すチャンスがあります。モデルが同等にこなせる雑談や軽い作業にこの期間を無駄にしないでください。最も困難で実務的なタスクを与えてみてください。複雑なスプレッドシートの分析、80ページにわたる契約書、ずっと先延ばしにしているレポートなど。結果に目を見張れば、後でクレジットを購入する価値があったかどうか分かります。もしそうでなくても、Opus 4.8は依然として優秀でプランに含まれています。

ChatGPTを使っているが興味があるなら: GPT-5.5との差は、ここ数年でどのラボも持てなかった最大のリードです。ただし、それは深い推論、エージェント型作業、長期のコンテキストに集中しています。AI使用が会話メインであれば、その差は感じられないでしょう。しかし、実際のプロフェッショナルな成果物でモデルの限界を試すなら、これは「 hype ではなくデータで裏打ちされた 」稀な試すチャンスです。

AIを本格的に使い始めたことがないなら: ここでの出来事があなたのスタート地点を変えるわけではありません。ClaudeとChatGPTの無料枠が依然として最適な教室であることは変わりません。ただし、何が起きたかを覚えておいてください。これまで販売された中で最も強力なAIが、他のAIに監視されながら動いています。この「能力+監視者」というアーキテクチャが、今後数年間のAIの姿の原型になるでしょう。

まとめ

Claude Fable 5は、2つの物語を一つにまとめたものです。1つ目は純粋な性能です。ここ数年で最大級の世代間ジャンプであり、コーディング、オフィスワーク、金融、法律の各分野でエビデンスが示され、サブスクリプションユーザーが無料で試せる2週間の窓が設けられました。2つ目は先例です。危険性を封じ込めるために公開を中止するのではなく、分類器、フォールバック、データ保持ルール、静かな制限の格子状ネットワークの中に組み込んで出荷した、初の前線モデルです。1つ目の物語が「6月22日までに試すべき理由」であり、2つ目の物語が「ベンチマークが陳腐化しても、このリリースが長く記憶される理由」です。

「どのモデルをどの仕事に使うべきか」という問いでいつも迷っているなら、当社のコースAI入門はゼロからその判断力を養い、ChatGPT使い方マスターでそれを日常の成果につなげます。各コースの最初の2レッスンは無料です。

参考リンク

Build Real AI Skills

Step-by-step courses with quizzes and certificates for your resume