最終更新:2026年5月15日。 新情報が更新されるたびに追記していきます。ブックマーク推奨です。
【2026年5月の続報】Spud、出ました ―ただし名前は「GPT-5.5」でした。 OpenAIは2026年4月23日午前10時(太平洋時間)に GPT-5.5 を発表しました。同日中に ChatGPT の Plus / Pro / Business / Enterprise ユーザー向けに展開され、API は翌4月24日から提供開始。さらに5月5日には GPT-5.5 Instant が無料ユーザー向けのデフォルトモデルに昇格しました。ベンチマーク結果は SWE-bench Verified 88.7%、Terminal-Bench 2.0 で 82.7%(Claude Opus 4.7 の 69.4% を13ポイント引き離す高性能)。以下のトラッカーは当時の記録としてそのまま残しています。最新動向については「実際に何が起きたのか」のセクションをご覧ください。本物の GPT-6 については、現時点で市場の本命予想は2026年Q3〜Q4です。
あの「伝説の4月14日」から3日が過ぎました。Altman氏のツイートはない。ブログ投稿もない。「全員手を止めろ」という衝撃的な瞬間もなかった。@sama のフィードは静まり返り、@openai のアカウントも ChatGPT Memory の展開に関する淡々とした更新のみです。
その間、競合各社は着々と動き続けています。The Information が昨日、**Anthropic の Opus 4.7 と AI デザインツールが「早ければ今週中に」**出荷されると報じました。Google の Gemini 3.1 Ultra はすでに一般公開済み。Meta の Muse Spark も1週間前から稼働しています。我慢強く待っているのは OpenAI だけです。
Spud のタイマーは確かに回っています。プレトレーニングは3月24日に完了し、Altman 氏が「数週間後」と語った時期は4月14〜21日頃を指していると考えられます。Polymarket の「4月30日までに GPT-6」の確率は 78% から 72% に下方修正されました。ただ、空気の質は完全に変わっています。3日前の議論が「4月14日の情報は本当か?」だったのに対し、今は「Claude が先にリリースされたら、モデルの順番自体に意味があるのか?」という話に進んでいます。
4月17日時点で判明している事実を、本日付でまとめ直しました。
実際に何が起きたのか — Spud は GPT-5.5 として出荷された
このトラッカーが最後に更新されてから6日後、OpenAI は長引くサスペンスに終止符を打ちました。2026年4月23日午前10時(太平洋時間)、コミュニティが「GPT-6」と呼んでいたモデルが、名を「GPT-5.5」と変えてリリースされました。 コードネーム「Spud」も確かに存在しました。事前リークされた「40%の性能向上」は若干の誇張が含まれていましたが、モデル自体の品質は本物。しかも主要な3ベンチマークのうち2つでトップスコアを叩き出しています。
4月の出荷スケジュール、一枚絵で
| バリアント | ChatGPT | API | 対象 |
|---|---|---|---|
| GPT-5.5(標準) | 4月23日 | 4月24日 | Plus / Pro / Business / Enterprise |
| GPT-5.5 Thinking | 4月23日 | 4月24日 | 上記同様 |
| GPT-5.5 Pro | 4月23日 | 4月24日 | Pro / Business / Enterprise |
| GPT-5.5 Instant | — | — (ChatGPT UI のみ) | 無料ユーザーのデフォルトに(5月5日) |
| GPT-5.5-Cyber | — | Trusted Access のみ | 認定済みサイバーセキュリティ研究者(5月7日) |
効くベンチマーク(Spud が実際に勝ってるとこ)
| ベンチマーク | GPT-5.5 | GPT-5.4 | Claude Opus 4.7 | コメント |
|---|---|---|---|---|
| Terminal-Bench 2.0(エージェント的ツール使用) | 82.7% | 75.1% | 69.4% | 新SOTA。Opus を約13ポイント引き離す圧勝 |
| SWE-bench Verified(コーディング) | 88.7% | 87.6% | 87.6% | わずか差。リードは狭い |
| SWE-bench Pro(複数ファイル編集) | 58.6% | 57.7% | — | まだ競合が追い上げ可能 |
| MMLU(一般知識) | ~92.4% | ~90% | — | 差はわずか |
| OSWorld-Verified(コンピュータ操作) | 78.7% | — | 78.0% | Opus と統計的に同点 |
| FrontierMath(Tier 1-3) | 51.7% | — | 43.8% | 明確なリード |
| FrontierMath Tier 4 | 35.4% | — | 22.9% | エキスパート級で大差 |
| ARC-AGI-2 | +11.7pt 改善 | ベースライン | — | 単一ベンチでの最大ジャンプ |
GPT-5.4 から何が「実際」変わったのか
日本のテックメディア(gihyo.jp、Impress Watch、SBBit など)がこぞって強調しているキーワードは「任せる知性」です。具体的にどのような変化があるのか、以下の通りです。
- 長文コンテキストの「実用性」が一段階跳ね上がった。コンテキストウィンドウ自体は 1.0M から 1.05M トークンへとほぼ据え置きですが、512K〜1M の範囲で要件をどれだけ正確に維持できるかが段違いです。Gemini や Claude でも話題になっていた「ウィンドウは広いのに真ん中を忘れる」というあるある現象が、5.5 では明確に解消されています。
- エージェントとしての粘り強さ。Terminal-Bench 2.0 で Opus を 13ポイント引き離したのは、「ツール呼び出し中の早期離脱が減少した」「複数ステップの処理を最後までやり遂げる」「自己検証と修正のループが安定して回る」という複合的な効果です。Cursor の CEO も X で「5.4 より圧倒的に粘り強い」と評価しています。
- 科学・抽象推論のスコアも底上げ。GeneBench が 19% → 25%、BixBench が 74% → 約 80.5%、FrontierMath Tier 4 で 35.4% という結果に。エンジニアよりも研究者やデータサイエンティストの方が体感しやすい分野です。
- システムカードに初めて独立した「Alignment(アライメント)」セクションが追加。深刻度3の不整合率は約 0.01%、深刻度4のインシデント観測はゼロでした。OpenAI は安全性に関する説明責任を前面に押し出しています。
- トークンあたりのレイテンシは GPT-5.4 と同等のまま、能力がアップ。OpenAI 公式の説明では、「Codex で同じタスクを完了させる際、必要トークン数が減ったケースが多い」そうです。リスト価格は倍額でも、実効的なコストが下がるユースケースは十分考えられます。
API 料金(1Mトークン、ショートコンテキスト)
| モデル | 入力 | キャッシュ入力 | 出力 | メモ |
|---|---|---|---|---|
| gpt-5.5 | $5.00 | $0.50 | $30.00 | フロンティア、1.05Mコンテキスト |
| gpt-5.5-pro | $30.00 | — | $180.00 | テストタイム計算多めの高精度版 |
| gpt-5.4 | $2.50 | — | $15.00 | 前世代フロンティア(1.0M) |
| gpt-5.4-mini | $0.75 | — | $4.50 | 軽量版 |
| gpt-5.4-nano | $0.20 | — | $1.25 | 最安 |
272K トークンを超えるロングコンテキストについては、セッション全体に対して入力価格の 2 倍 / 出力価格の 1.5 倍の倍率が適用されます。Batch と Flex は半額、Priority は 2.5 倍 — これは他の OpenAI モデルと同じ料金構造です。GPT-5.5 Instant は単独の API SKU を持たず、ChatGPT の無料枠と内部のリアルタイムルータ経由でのみ利用可能です。
で、命名はどっちが正解だった?
Polymarket の「4月23日までに GPT-5.5」市場は、ローンチ直前で約 83% が Yes を示しており見事に的中しました。一方、「6月30日までに GPT-6」市場は完全に外れました。OpenAI は今回、「5.x 系を高速にリリースしていく」という路線に明確にコミットしたことになります。Brockman 氏の「2年分の研究、漸進的な改善ではない」という発言は、バージョン番号の話ではなくモデルの質や中身に関するものだった、というのが正解のようです。
公式ソース:Introducing GPT-5.5 — OpenAI / システムカード / GPT-5.5 Instant システムカード / Deployment Safety Hub。日本語での解説記事は、gihyo.jp の技術解説、Impress Watch の速報、SBBit のエージェント視点分析 が特に分かりやすいのでおすすめです。
クイック回答
| 質問 | 回答 |
|---|---|
| GPT-6はもう出た? | いいえ |
| 4月14日に何か出た? | 何も。 噂は完全に消滅。 |
| Altmanはそれ以降何か言った? | 何も。3月24日以降フィードは静まり返ってる。 |
| OpenAIが公式に確定させたこと? | 2026年3月24日プレトレーニング完了。それだけ。 |
| 名称は「GPT-6」それとも「GPT-5.5」? | 公式には未決定。内部筋はGPT-5.5寄り。 |
| コードネーム? | Spud 🥔 |
| Polymarket「4月30日まで」? | 約72%(4月13日は78%) |
| 「6月30日まで」? | 約93% |
| 最も可能性の高いリリース時期? | 2026年4月21日~5月25日 |
これまでのストーリー — ビジュアル版
3週間。3つの節目。そして1回、起こらなかった発表。プレトレーニング完了以降の Spud サガを時系列で振り返ります。
OpenAIが公式に発表したこと
公式に発表されたのは、以下の3点のみです。
- 「Spud」のプレトレーニングは2026年3月24日に完了。 Sam Altman 氏が X 上で直接言及し確定。
- Altman 氏いわく「リリースは数週間後」(3月24日時点の発言で、つまり既に3週間半が経過)。
- Brockman 氏が Spud を「2年分の研究成果」であり「漸進的な改善ではない」と公の場で発言。
以上が公式発表の全内容です。具体的なリリース日付なし、モデルカード(model card)公開なし、API 提供発表なし、ティーザー動画すらありません。OpenAI は GPT-6 用のブログ記事やプレスリリース、製品ページさえも公開していません。
プレッシャーマップ — Spudが出ないとOpenAIが失うもの
OpenAI が誰もいない荒野にリリースしようとしているわけではありません。主要な競合各社はすでに4月中に出荷済みか、今週中に出荷予定の状態です。Spud をオーブンに入れ続ける間、「フロンティアモデル」というポジションの物語は次々と他社に持っていかれていきます。
先週の HumanX カンファレンスで支配的だったのは “Claude Mania” でした。OpenAI でも GPT-6 でもありません。Spud のリリースが5月末まで遅れれば、OpenAI は「最強フロンティアモデル」の座を2サイクル連続で Anthropic に明け渡すことになります。
このプレッシャーが、社員が X 上で大胆なほのめかしをする一方で、公式チャンネルが沈黙している背景にあります。Altman 氏は事前発表するとローンチのインパクトを損なうと考えています。しかし、Anthropic に「物語」を奪い続けられるわけにもいきません。
4月14日の噂:ポストモーテム
明確に外れた情報として、もう一度整理しておきます。
発信源: 検証不能な「内部筋」からのリーク。4月7日に小型ブログ(または個人ブログ)で投稿されたものです。内容は以下の通り。
- 4月14日ローンチ、および「統合スーパーアプリ」(ChatGPT + Codex + Atlas)の展開
- GPT-5.4 比で約 40% の性能向上
- コンテキストウィンドウ 2M トークン
なぜ外れたと判断できるか:
- 発信者の実態や実績を検証する手段がない
- 「40%」「2M」といった数字が不自然に丸く、マーケティング用語の匂いが強い
- OpenAI の歴史を振り返れば直前発表がほとんどであり、6日前の予告は前例がない
- TechCrunch、The Verge、The Information などの主要メディアが裏取りしていない
- 予告日から3日が経過しても Altman 氏の動きがゼロだったため、虚偽確定
確かにあった部分: 4月10〜11日にかけて @thsottiaux(「next week will be about more than cooking」)と @pashmerepat(「things are about to get wild ❄️」)が投稿したほのめかしツイートは、実在する OpenAI 社員による本物の投稿です。ただし、OpenAI 関係者の文脈での「next week(来週)」は特定の日程ではなく「近いうち」「ある期間」を指すのが常です。4月14日という特定日付は、リーク元の投稿者が後付けで設定したものと考えられます。
判定: 「4月中旬〜5月初旬」という広いレンジ自体は依然として有効です。「4月14日」という特定日付については、最初から信頼性が欠けていました。
Polymarketオッズ(4月16日更新)
予測市場は 4月14日の情報外れを受けて楽観論を少し抑えましたが、基本的なトレンドは崩れていません。
| 市場 | リリース確率(期限まで) |
|---|---|
| Polymarket「GPT-6 4/30まで」 | 約72%(4/13は78%) |
| Polymarket「5/31まで」 | 約86% |
| Polymarket「6/30まで」 | 約93%(以前95%) |
| Manifold「5/15まで」 | 約78%(以前82%) |
| PredictionPulse | 6/30まで約28%(少数懐疑派) |
「4月30日まで」の確率が 6ポイント低下したのは、市場が 4月14日の情報外れを織り込んだためです。ただし、5月や6月といったロングテールの確率はほぼ変動していません。トレーダーは Spud のリリース自体を信じており、単に「今週」という短期間の賭けを降りただけです。
「GPT-6」か「GPT-5.5」か?
結論は出ていません。2週間前の命名をめぐる論争は、そのまま持ち越し状態です。
「GPT-5.5」派のシグナル:
- X 上の内部筋が一貫して「GPT-5.5」という名称を使っている
- Daniel Mac(テックレポーター、1,141いいね):「GPT-5.5 aka Spud 🥔. OpenAI’s best model yet.」
- OpenAI の過去の傾向:半ナンバー(.5)は「大幅な改善だが、パラダイムシフトではない」というシグナルとして使われてきた
「GPT-6」派のシグナル:
- Brockman 氏が「2年分の研究」という表現を用いている点
- 噂の統合エコシステム(ChatGPT + Codex + Atlas)ローンチ
- ベンチマークで 40% 向上が実現しているなら、マーケティング側も大きな数字を打ち出したがる
私たちの判断: 名称はローンチ当日のベンチマーク結果次第で決まります。Spud が GPT-5.4 を 25% 以上上回れば「GPT-6」。10〜15% の差なら「GPT-5.5」のままです。名称から OpenAI の自信度を読み取ることができます。
待っている間に — 本当に大事なこと
Spud が 4月21日にリリースされようが、5月25日にリリースされようが、真にモデルの価値を引き出しているのは、ローンチ当日に Twitter をリロードしている人ではありません。 「AI への指示出し方」をすでにマスターしている人です。適当なプロンプトでは、どのモデルを使っても陳腐な回答しか返ってきません。逆に、凡庸なモデルでも、熟練したエンジニアの手にかかれば本番環境でそのまま使えるコードを出力できます。
GPT-6 のユーザーを10倍にするスキルとは、プロンプトエンジニアリング + 実践的な AI ワークフロー です。これは Spud のリリースから2ヶ月後を待つ必要はなく、今日から2時間で学べます。
- プロンプトエンジニアリング(無料で始める) — 全8レッスン、約90分。「メール書いて」と打つ人とパワーユーザーを分けるための技術。
- AI入門(無料で始める) — これらのシステムが実際どのように動作しているかを理解するためのメンタルモデル。GPT-6 の新機能を3週目ではなく、初日からすっと理解できるはずです。
最初の2レッスンはアカウント作成だけで無料です。クレジットカード不要、登録は30秒。Spud が明日出ようが、チーム内で最も早く使いこなし、価値を引き出せる人材になれます。
次に見るべきもの(5月15日更新)
4月17日に書いたオリジナル予想は歴史的記録として残しますが、5月時点での現実的な予想ラインは以下の通りです。
Spud が「5.5」としてリリースされたことで、市場は期待値を再設定しました。 Polymarket と Manifold の両方で、「GPT-6 by 6月30日」(現実的ではないとの見方)の確率が引き下げられ、「12月31日まで」も微減しました。OpenAI の 5.x 系高速リリースサイクルが、「本物の GPT-6」を相対的に不要なものにしているためです。5月15日時点の主要オッズは以下の通り。
| 市場 | 確率 | 4月21日からの変化 |
|---|---|---|
| Polymarket — GPT-6 by 6月30日 | 約10-11% | 約45% → 急落(4月23日の5.5ローンチで近接見込みが消失) |
| Polymarket — GPT-6 by 9月30日 | 約55-60% | 約72% から下方修正 |
| Polymarket — GPT-6 by 12月31日 | 約82% | ほぼ横ばい |
| Manifold — 6月までに | 約3% | 新規 |
| Manifold — 9月までに | 約51% | 新規 |
| Manifold — 12月までに | 約71% | 新規 |
| Manifold — 「2026年に GPT-6 出る?」(命名問題込み) | 約65% Yes | 新規 |
要約すると、本物の GPT-6 のベースラインは 2026年Q3〜Q4 です。市場の最頻値は12月着地。残りの約28%が2027年以降に振れており、ロードマップ依存度が高いプロダクトを開発している場合、無視できないテールリスクとして考慮する必要があります。
直近で注視すべき指標:
| 期間 | 見るべきもの |
|---|---|
| 5/19-20 | Google I/O 基調講演。Google が出す価格や新モデルが OpenAI に次の手を強いる流れ。 |
| 5月末-6月 | 市場で「GPT-5.6」内部テストの観測。Polymarket の 5.6 市場は近接で約88%。静かに出る可能性。 |
| 6-8月 | OpenAI DevDay(例年Q3)。Altman の X 投稿で本物の GPT-6 日程が漏れるかも。最近は「GPT-6 を『追加のゴブリン』で訓練中」とCodexバグネタで茶化してましたが、ハード日付はゼロ。 |
| 9月 | Polymarket / Manifold 両方の確率質量が集中する着地点。5.x 系の刻みが続くなら、ここで本物の 6 が差別化できないと意味が薄れる。 |
| 年末 | 12月までに出なければ「OpenAI は命名で負けたが性能では負けてない」が物語として定着。Polymarket は82%、逆張りするならこのラインを売り。 |
OpenAI のブログを F5 連打しているなら、一度深呼吸をしてください。直近4回のローンチ(GPT-5.5 を含む)で確認されたパターンは以下の通りです。日付の事前予告なし、当日の Altman 氏による X 投稿、30分後の公式ブログ公開、API アクセスは24〜48時間をかけて段階的に展開されます。リリースが確定すれば、1時間以内には情報がまとまります。
アーカイブ:4月17日時点の監視リスト
参考として、3週間前に記載していた予想も残しておきます。
| 期間 | 当時見ていたもの |
|---|---|
| 4/17-20 | フィード沈黙。実際:4月23日に GPT-5.5 として出荷。 |
| 4/21-30 | Polymarket 72%の窓 → GPT-5.5として的中。API は4月24日に展開。 |
| 5/1-25 | GPT-5.5 Instant の無料展開(5月5日)、GPT-5.5-Cyber(5月7日)。 |
あなたへの意味(2026年5月版)
開発者の方へ: 評価対象は「未来の GPT-6」ではなく、「今すぐ使える GPT-5.5」です。リアルなスペックは、入出力 $5 / $30 per 1M tokens(ショートコンテキスト)、1.05M のコンテキストウィンドウ、Terminal-Bench 2.0 で SOTA です。エージェント系のワークフローを構築するなら市場最強クラス。Claude Opus 4.7 は純粋なコーディング判断ではまだリードしていますが、エージェントやツール連携の分野では、Opus 4.7 が追う立場に回っています。本物の GPT-6 への移行議論は、市場予想通りなら Q3〜Q4 まで一旦凍結しても問題ありません。
AI 製品開発者の方へ: Q1 に懸念されていた「GPT-6 が出たら自社製品が陳腐化する」という不安はほぼ解消しました。5.5 世代がリリースされた以上、今この時点で開発を進められます。本物の GPT-6 が再び議論の中心になるのが早くて5〜7ヶ月後だとすれば、その分早く市場に出す方が収益面でも有利です。未確定のスペックに先回りして設計を進めるのは、業界で伝統的に「時間の無駄遣い」とされる行為なので避けましょう。
AI ツール選びで迷っている方へ: GPT-5.5 と Claude Opus 4.7 は現在フロンティア層で「同等」の位置にあり、得意分野が異なるだけです。Opus 4.7 は純粋なコーディング判断と指示追従に強く、GPT-5.5 はターミナル/エージェント作業と FrontierMath に優れています。これからはワークロードに合わせて選ぶフェーズです。価格を最優先するなら Gemini 3.1 Pro が正解。「次のモデルが出たら乗り換えよう」という物語は一旦終了しました。次のモデルは、すでに登場しています。
単に気になっている方へ: Spud、確かにリリースされました。これから半年間で注目すべきは「GPT-6 はいつ出るか」ではなく、「OpenAI は次の大ジャンプをどう命名し、Anthropic の Opus 5 より先にリリースできるか」です。
結論(2026年5月15日版)
5月時点での素直なまとめです。
Spud は出ました — 4月23日に GPT-5.5 として。 「4月23日までに GPT-5.5」の予測市場は完璧に的中し、「6月30日までに GPT-6」市場は約50ポイント外れました。これは「どのリークを信じるべきか」を考える際の基準として覚えておくと良いでしょう。実資金が集まる予測市場 > インサイダー系ブログ > X の「知り合いがいる」系の情報。この順位は常に変わりません。
本物の GPT-6 のベースラインは、今や 2026年Q3〜Q4 です。 Polymarket では 6月末が約10%、9月末が約55-60%、12月末が約82%。Manifold は短期間でより悲観的な数値を示しています(6月までに約3%、9月までに約51%)。約4分の1の確率が2027年以降に振れており、ロードマップ依存度が高いプロダクトでは無視できないテールリスクとなります。
GPT-5.6 は内部テストに入っています。 Polymarket の 5.6 市場は近接で約88%。5.x 系のリリースペースは本物であり、誰も予想していなかった速さです。開発するなら今は GPT-5.5 をベースに進め、2026年の残りは漸進的なアップグレードがあると想定するのが正解です。
Anthropic と OpenAI は、今まさに互角の勝負をしています。 Claude Opus 4.7 は純粋なコーディング判断と指示追従でリード。GPT-5.5 はエージェント/ターミナル系ベンチで約13ポイント差をつけて勝利しました(Terminal-Bench 2.0)。Gemini 3.1 Pro は依然として大量処理におけるコストリーダーです。「次のモデルが出たら乗り換えよう」という戦略は、今のところ無効です。次のモデルは、すでに登場してしまっていますから。
4月14日の熱狂サイクルから、今でも通用する教訓は一つだけ。 次に耳にする「インサイダー」リークが具体的な日付と「40%性能向上」のような綺麗に丸められた数字を伴っていたら、今回と同じく裏取りできないと思ってください。OpenAI のリリースパターンは「当日告知 → Altman 氏の X 投稿 → 30分後のブログ公開」です。それ以外はすべてノイズです。
本物の GPT-6 の具体的なロードマップが夏までに明確になったら、このページも改めて更新します。
関連記事: GPT-6 が噂通りエージェント機能付きでリリースされた場合、Claude vs ChatGPT 2026比較もあわせて参照してください。また、「Claude Mania」記事では、OpenAI が今どれだけのプレッシャーにさらされているかが解説されています。
参考資料:
一次情報(OpenAI 公式):
- Introducing GPT-5.5 — OpenAI
- GPT-5.5 Instant — OpenAI
- GPT-5.5 システムカード — OpenAI
- GPT-5.5 Instant システムカード — OpenAI
- Deployment Safety Hub — GPT-5.5
日本語での解説・速報:
- OpenAI、新モデルGPT-5.5をリリース — gihyo.jp
- OpenAI、GPT-5.5を公開「任せる」知性を大幅向上 — Impress Watch
- OpenAIが最新AIモデル「GPT-5.5」発表、エージェンティックAIとして大幅進化 — SBBit
- GPT 5.5とは?使い方・料金・API【2026年5月】 — ファネルAi
- GPT-5.5 リリース解説 — 株式会社オブライト
英語での主要報道(4月23日ローンチ):
- OpenAI announces GPT-5.5 — CNBC
- OpenAI releases GPT-5.5 — TechCrunch
- GPT-5.5 Instant 無料展開(5月5日) — TechCrunch
予測市場(現在価格):
トラッカー・分析: