GPT-6リリース日:Spud=GPT-5.5、本命はQ4?(5/15更新)

GPT-6リリース日トラッカー:Spud=GPT-5.5(4月23日リリース)。Polymarket現在のオッズは6月10%、9月55%、12月82%。Opus 4.7とのベンチマーク比較もまとめ。

最終更新:2026年5月15日。 新情報が更新されるたびに追記していきます。ブックマーク推奨です。

【2026年5月の続報】Spud、出ました ―ただし名前は「GPT-5.5」でした。 OpenAIは2026年4月23日午前10時(太平洋時間)に GPT-5.5 を発表しました。同日中に ChatGPT の Plus / Pro / Business / Enterprise ユーザー向けに展開され、API は翌4月24日から提供開始。さらに5月5日には GPT-5.5 Instant が無料ユーザー向けのデフォルトモデルに昇格しました。ベンチマーク結果は SWE-bench Verified 88.7%、Terminal-Bench 2.0 で 82.7%(Claude Opus 4.7 の 69.4% を13ポイント引き離す高性能)。以下のトラッカーは当時の記録としてそのまま残しています。最新動向については「実際に何が起きたのか」のセクションをご覧ください。本物の GPT-6 については、現時点で市場の本命予想は2026年Q3〜Q4です。


あの「伝説の4月14日」から3日が過ぎました。Altman氏のツイートはない。ブログ投稿もない。「全員手を止めろ」という衝撃的な瞬間もなかった。@sama のフィードは静まり返り、@openai のアカウントも ChatGPT Memory の展開に関する淡々とした更新のみです。

その間、競合各社は着々と動き続けています。The Information が昨日、**Anthropic の Opus 4.7 と AI デザインツールが「早ければ今週中に」**出荷されると報じました。Google の Gemini 3.1 Ultra はすでに一般公開済み。Meta の Muse Spark も1週間前から稼働しています。我慢強く待っているのは OpenAI だけです。

Spud のタイマーは確かに回っています。プレトレーニングは3月24日に完了し、Altman 氏が「数週間後」と語った時期は4月14〜21日頃を指していると考えられます。Polymarket の「4月30日までに GPT-6」の確率は 78% から 72% に下方修正されました。ただ、空気の質は完全に変わっています。3日前の議論が「4月14日の情報は本当か?」だったのに対し、今は「Claude が先にリリースされたら、モデルの順番自体に意味があるのか?」という話に進んでいます。

4月17日時点で判明している事実を、本日付でまとめ直しました。

実際に何が起きたのか — Spud は GPT-5.5 として出荷された

このトラッカーが最後に更新されてから6日後、OpenAI は長引くサスペンスに終止符を打ちました。2026年4月23日午前10時(太平洋時間)、コミュニティが「GPT-6」と呼んでいたモデルが、名を「GPT-5.5」と変えてリリースされました。 コードネーム「Spud」も確かに存在しました。事前リークされた「40%の性能向上」は若干の誇張が含まれていましたが、モデル自体の品質は本物。しかも主要な3ベンチマークのうち2つでトップスコアを叩き出しています。

4月の出荷スケジュール、一枚絵で

バリアントChatGPTAPI対象
GPT-5.5(標準)4月23日4月24日Plus / Pro / Business / Enterprise
GPT-5.5 Thinking4月23日4月24日上記同様
GPT-5.5 Pro4月23日4月24日Pro / Business / Enterprise
GPT-5.5 Instant— (ChatGPT UI のみ)無料ユーザーのデフォルトに(5月5日)
GPT-5.5-CyberTrusted Access のみ認定済みサイバーセキュリティ研究者(5月7日)

効くベンチマーク(Spud が実際に勝ってるとこ)

ベンチマークGPT-5.5GPT-5.4Claude Opus 4.7コメント
Terminal-Bench 2.0(エージェント的ツール使用)82.7%75.1%69.4%新SOTA。Opus を約13ポイント引き離す圧勝
SWE-bench Verified(コーディング)88.7%87.6%87.6%わずか差。リードは狭い
SWE-bench Pro(複数ファイル編集)58.6%57.7%まだ競合が追い上げ可能
MMLU(一般知識)~92.4%~90%差はわずか
OSWorld-Verified(コンピュータ操作)78.7%78.0%Opus と統計的に同点
FrontierMath(Tier 1-3)51.7%43.8%明確なリード
FrontierMath Tier 435.4%22.9%エキスパート級で大差
ARC-AGI-2+11.7pt 改善ベースライン単一ベンチでの最大ジャンプ

GPT-5.4 から何が「実際」変わったのか

日本のテックメディア(gihyo.jp、Impress Watch、SBBit など)がこぞって強調しているキーワードは「任せる知性」です。具体的にどのような変化があるのか、以下の通りです。

  • 長文コンテキストの「実用性」が一段階跳ね上がった。コンテキストウィンドウ自体は 1.0M から 1.05M トークンへとほぼ据え置きですが、512K〜1M の範囲で要件をどれだけ正確に維持できるかが段違いです。Gemini や Claude でも話題になっていた「ウィンドウは広いのに真ん中を忘れる」というあるある現象が、5.5 では明確に解消されています。
  • エージェントとしての粘り強さ。Terminal-Bench 2.0 で Opus を 13ポイント引き離したのは、「ツール呼び出し中の早期離脱が減少した」「複数ステップの処理を最後までやり遂げる」「自己検証と修正のループが安定して回る」という複合的な効果です。Cursor の CEO も X で「5.4 より圧倒的に粘り強い」と評価しています。
  • 科学・抽象推論のスコアも底上げ。GeneBench が 19% → 25%、BixBench が 74% → 約 80.5%、FrontierMath Tier 4 で 35.4% という結果に。エンジニアよりも研究者やデータサイエンティストの方が体感しやすい分野です。
  • システムカードに初めて独立した「Alignment(アライメント)」セクションが追加。深刻度3の不整合率は約 0.01%、深刻度4のインシデント観測はゼロでした。OpenAI は安全性に関する説明責任を前面に押し出しています。
  • トークンあたりのレイテンシは GPT-5.4 と同等のまま、能力がアップ。OpenAI 公式の説明では、「Codex で同じタスクを完了させる際、必要トークン数が減ったケースが多い」そうです。リスト価格は倍額でも、実効的なコストが下がるユースケースは十分考えられます。

API 料金(1Mトークン、ショートコンテキスト)

モデル入力キャッシュ入力出力メモ
gpt-5.5$5.00$0.50$30.00フロンティア、1.05Mコンテキスト
gpt-5.5-pro$30.00$180.00テストタイム計算多めの高精度版
gpt-5.4$2.50$15.00前世代フロンティア(1.0M)
gpt-5.4-mini$0.75$4.50軽量版
gpt-5.4-nano$0.20$1.25最安

272K トークンを超えるロングコンテキストについては、セッション全体に対して入力価格の 2 倍 / 出力価格の 1.5 倍の倍率が適用されます。Batch と Flex は半額、Priority は 2.5 倍 — これは他の OpenAI モデルと同じ料金構造です。GPT-5.5 Instant は単独の API SKU を持たず、ChatGPT の無料枠と内部のリアルタイムルータ経由でのみ利用可能です。

で、命名はどっちが正解だった?

Polymarket の「4月23日までに GPT-5.5」市場は、ローンチ直前で約 83% が Yes を示しており見事に的中しました。一方、「6月30日までに GPT-6」市場は完全に外れました。OpenAI は今回、「5.x 系を高速にリリースしていく」という路線に明確にコミットしたことになります。Brockman 氏の「2年分の研究、漸進的な改善ではない」という発言は、バージョン番号の話ではなくモデルの質や中身に関するものだった、というのが正解のようです。

公式ソース:Introducing GPT-5.5 — OpenAI / システムカード / GPT-5.5 Instant システムカード / Deployment Safety Hub。日本語での解説記事は、gihyo.jp の技術解説Impress Watch の速報SBBit のエージェント視点分析 が特に分かりやすいのでおすすめです。

クイック回答

質問回答
GPT-6はもう出た?いいえ
4月14日に何か出た?何も。 噂は完全に消滅。
Altmanはそれ以降何か言った?何も。3月24日以降フィードは静まり返ってる。
OpenAIが公式に確定させたこと?2026年3月24日プレトレーニング完了。それだけ。
名称は「GPT-6」それとも「GPT-5.5」?公式には未決定。内部筋はGPT-5.5寄り。
コードネーム?Spud 🥔
Polymarket「4月30日まで」?約72%(4月13日は78%)
「6月30日まで」?約93%
最も可能性の高いリリース時期?2026年4月21日~5月25日

これまでのストーリー — ビジュアル版

3週間。3つの節目。そして1回、起こらなかった発表。プレトレーニング完了以降の Spud サガを時系列で振り返ります。

GPT-6(Spud)— これまでのトラッカー
プレトレ完了
3/24
社員のほのめかし
4/10-11
4月14日騒動
4/14
今日
4/17
予想時期
4/21 – 5/25
Altmanが確定。リリースは『数週間』以内と。
@thsottiaux、@pashmerepat が『next week』と意味深な投稿。
発表なし、ツイートなし。リーク元は実績ゼロ。
沈黙。Polymarketは6ポイント低下。
Polymarket 4/30まで72%、6/30まで93%。
3月24日にプレトレ完了、その後は沈黙。4月14日の噂は外部発信で、OpenAI発ではない。

OpenAIが公式に発表したこと

公式に発表されたのは、以下の3点のみです。

  1. 「Spud」のプレトレーニングは2026年3月24日に完了。 Sam Altman 氏が X 上で直接言及し確定。
  2. Altman 氏いわく「リリースは数週間後」(3月24日時点の発言で、つまり既に3週間半が経過)。
  3. Brockman 氏が Spud を「2年分の研究成果」であり「漸進的な改善ではない」と公の場で発言。

以上が公式発表の全内容です。具体的なリリース日付なし、モデルカード(model card)公開なし、API 提供発表なし、ティーザー動画すらありません。OpenAI は GPT-6 用のブログ記事やプレスリリース、製品ページさえも公開していません。

プレッシャーマップ — Spudが出ないとOpenAIが失うもの

OpenAI が誰もいない荒野にリリースしようとしているわけではありません。主要な競合各社はすでに4月中に出荷済みか、今週中に出荷予定の状態です。Spud をオーブンに入れ続ける間、「フロンティアモデル」というポジションの物語は次々と他社に持っていかれていきます。

Anthropic Opus 4.7
今週中にAIデザインツールと同時リリースの噂。Claude CodeはすでにARR 25億ドル。
Google Gemini 3.1 Ultra
4月初旬にリリース。公開ベンチマークで最強のマルチモーダル。
Meta Muse Spark
4月9-10日ローンチ。手堅いがカテゴリーを変えるほどではない。
オープンソース勢
Mistral、DeepSeek、Llamaが中段をガッチリ埋める。
低い OpenAIのリリース時期への圧力 高い

先週の HumanX カンファレンスで支配的だったのは “Claude Mania” でした。OpenAI でも GPT-6 でもありません。Spud のリリースが5月末まで遅れれば、OpenAI は「最強フロンティアモデル」の座を2サイクル連続で Anthropic に明け渡すことになります。

このプレッシャーが、社員が X 上で大胆なほのめかしをする一方で、公式チャンネルが沈黙している背景にあります。Altman 氏は事前発表するとローンチのインパクトを損なうと考えています。しかし、Anthropic に「物語」を奪い続けられるわけにもいきません。

4月14日の噂:ポストモーテム

明確に外れた情報として、もう一度整理しておきます。

発信源: 検証不能な「内部筋」からのリーク。4月7日に小型ブログ(または個人ブログ)で投稿されたものです。内容は以下の通り。

  • 4月14日ローンチ、および「統合スーパーアプリ」(ChatGPT + Codex + Atlas)の展開
  • GPT-5.4 比で約 40% の性能向上
  • コンテキストウィンドウ 2M トークン

なぜ外れたと判断できるか:

  • 発信者の実態や実績を検証する手段がない
  • 「40%」「2M」といった数字が不自然に丸く、マーケティング用語の匂いが強い
  • OpenAI の歴史を振り返れば直前発表がほとんどであり、6日前の予告は前例がない
  • TechCrunch、The Verge、The Information などの主要メディアが裏取りしていない
  • 予告日から3日が経過しても Altman 氏の動きがゼロだったため、虚偽確定

確かにあった部分: 4月10〜11日にかけて @thsottiaux(「next week will be about more than cooking」)と @pashmerepat(「things are about to get wild ❄️」)が投稿したほのめかしツイートは、実在する OpenAI 社員による本物の投稿です。ただし、OpenAI 関係者の文脈での「next week(来週)」は特定の日程ではなく「近いうち」「ある期間」を指すのが常です。4月14日という特定日付は、リーク元の投稿者が後付けで設定したものと考えられます。

判定: 「4月中旬〜5月初旬」という広いレンジ自体は依然として有効です。「4月14日」という特定日付については、最初から信頼性が欠けていました。

Polymarketオッズ(4月16日更新)

予測市場は 4月14日の情報外れを受けて楽観論を少し抑えましたが、基本的なトレンドは崩れていません。

Polymarket:GPT-6リリース確率
各期間にトレーダーが織り込んでいる量
すでに過ぎた期間
4/30まで(72%)
5/31まで(86%)
6/30まで(93%)
その後
今日 6/30まで
市場リリース確率(期限まで)
Polymarket「GPT-6 4/30まで」約72%(4/13は78%)
Polymarket「5/31まで」約86%
Polymarket「6/30まで」約93%(以前95%)
Manifold「5/15まで」約78%(以前82%)
PredictionPulse6/30まで約28%(少数懐疑派)

「4月30日まで」の確率が 6ポイント低下したのは、市場が 4月14日の情報外れを織り込んだためです。ただし、5月や6月といったロングテールの確率はほぼ変動していません。トレーダーは Spud のリリース自体を信じており、単に「今週」という短期間の賭けを降りただけです。

「GPT-6」か「GPT-5.5」か?

結論は出ていません。2週間前の命名をめぐる論争は、そのまま持ち越し状態です。

「GPT-5.5」派のシグナル:

  • X 上の内部筋が一貫して「GPT-5.5」という名称を使っている
  • Daniel Mac(テックレポーター、1,141いいね):「GPT-5.5 aka Spud 🥔. OpenAI’s best model yet.」
  • OpenAI の過去の傾向:半ナンバー(.5)は「大幅な改善だが、パラダイムシフトではない」というシグナルとして使われてきた

「GPT-6」派のシグナル:

  • Brockman 氏が「2年分の研究」という表現を用いている点
  • 噂の統合エコシステム(ChatGPT + Codex + Atlas)ローンチ
  • ベンチマークで 40% 向上が実現しているなら、マーケティング側も大きな数字を打ち出したがる

私たちの判断: 名称はローンチ当日のベンチマーク結果次第で決まります。Spud が GPT-5.4 を 25% 以上上回れば「GPT-6」。10〜15% の差なら「GPT-5.5」のままです。名称から OpenAI の自信度を読み取ることができます。


待っている間に — 本当に大事なこと

Spud が 4月21日にリリースされようが、5月25日にリリースされようが、真にモデルの価値を引き出しているのは、ローンチ当日に Twitter をリロードしている人ではありません。 「AI への指示出し方」をすでにマスターしている人です。適当なプロンプトでは、どのモデルを使っても陳腐な回答しか返ってきません。逆に、凡庸なモデルでも、熟練したエンジニアの手にかかれば本番環境でそのまま使えるコードを出力できます。

GPT-6 のユーザーを10倍にするスキルとは、プロンプトエンジニアリング + 実践的な AI ワークフロー です。これは Spud のリリースから2ヶ月後を待つ必要はなく、今日から2時間で学べます。

最初の2レッスンはアカウント作成だけで無料です。クレジットカード不要、登録は30秒。Spud が明日出ようが、チーム内で最も早く使いこなし、価値を引き出せる人材になれます。


次に見るべきもの(5月15日更新)

4月17日に書いたオリジナル予想は歴史的記録として残しますが、5月時点での現実的な予想ラインは以下の通りです。

Spud が「5.5」としてリリースされたことで、市場は期待値を再設定しました。 Polymarket と Manifold の両方で、「GPT-6 by 6月30日」(現実的ではないとの見方)の確率が引き下げられ、「12月31日まで」も微減しました。OpenAI の 5.x 系高速リリースサイクルが、「本物の GPT-6」を相対的に不要なものにしているためです。5月15日時点の主要オッズは以下の通り。

市場確率4月21日からの変化
Polymarket — GPT-6 by 6月30日約10-11%約45% → 急落(4月23日の5.5ローンチで近接見込みが消失)
Polymarket — GPT-6 by 9月30日約55-60%約72% から下方修正
Polymarket — GPT-6 by 12月31日約82%ほぼ横ばい
Manifold — 6月までに約3%新規
Manifold — 9月までに約51%新規
Manifold — 12月までに約71%新規
Manifold — 「2026年に GPT-6 出る?」(命名問題込み)約65% Yes新規

要約すると、本物の GPT-6 のベースラインは 2026年Q3〜Q4 です。市場の最頻値は12月着地。残りの約28%が2027年以降に振れており、ロードマップ依存度が高いプロダクトを開発している場合、無視できないテールリスクとして考慮する必要があります。

直近で注視すべき指標:

期間見るべきもの
5/19-20Google I/O 基調講演。Google が出す価格や新モデルが OpenAI に次の手を強いる流れ。
5月末-6月市場で「GPT-5.6」内部テストの観測。Polymarket の 5.6 市場は近接で約88%。静かに出る可能性。
6-8月OpenAI DevDay(例年Q3)。Altman の X 投稿で本物の GPT-6 日程が漏れるかも。最近は「GPT-6 を『追加のゴブリン』で訓練中」とCodexバグネタで茶化してましたが、ハード日付はゼロ。
9月Polymarket / Manifold 両方の確率質量が集中する着地点。5.x 系の刻みが続くなら、ここで本物の 6 が差別化できないと意味が薄れる。
年末12月までに出なければ「OpenAI は命名で負けたが性能では負けてない」が物語として定着。Polymarket は82%、逆張りするならこのラインを売り。

OpenAI のブログを F5 連打しているなら、一度深呼吸をしてください。直近4回のローンチ(GPT-5.5 を含む)で確認されたパターンは以下の通りです。日付の事前予告なし、当日の Altman 氏による X 投稿、30分後の公式ブログ公開、API アクセスは24〜48時間をかけて段階的に展開されます。リリースが確定すれば、1時間以内には情報がまとまります。

アーカイブ:4月17日時点の監視リスト

参考として、3週間前に記載していた予想も残しておきます。

期間当時見ていたもの
4/17-20フィード沈黙。実際:4月23日に GPT-5.5 として出荷。
4/21-30Polymarket 72%の窓 → GPT-5.5として的中。API は4月24日に展開。
5/1-25GPT-5.5 Instant の無料展開(5月5日)、GPT-5.5-Cyber(5月7日)。

あなたへの意味(2026年5月版)

開発者の方へ: 評価対象は「未来の GPT-6」ではなく、「今すぐ使える GPT-5.5」です。リアルなスペックは、入出力 $5 / $30 per 1M tokens(ショートコンテキスト)、1.05M のコンテキストウィンドウ、Terminal-Bench 2.0 で SOTA です。エージェント系のワークフローを構築するなら市場最強クラス。Claude Opus 4.7 は純粋なコーディング判断ではまだリードしていますが、エージェントやツール連携の分野では、Opus 4.7 が追う立場に回っています。本物の GPT-6 への移行議論は、市場予想通りなら Q3〜Q4 まで一旦凍結しても問題ありません。

AI 製品開発者の方へ: Q1 に懸念されていた「GPT-6 が出たら自社製品が陳腐化する」という不安はほぼ解消しました。5.5 世代がリリースされた以上、今この時点で開発を進められます。本物の GPT-6 が再び議論の中心になるのが早くて5〜7ヶ月後だとすれば、その分早く市場に出す方が収益面でも有利です。未確定のスペックに先回りして設計を進めるのは、業界で伝統的に「時間の無駄遣い」とされる行為なので避けましょう。

AI ツール選びで迷っている方へ: GPT-5.5 と Claude Opus 4.7 は現在フロンティア層で「同等」の位置にあり、得意分野が異なるだけです。Opus 4.7 は純粋なコーディング判断と指示追従に強く、GPT-5.5 はターミナル/エージェント作業と FrontierMath に優れています。これからはワークロードに合わせて選ぶフェーズです。価格を最優先するなら Gemini 3.1 Pro が正解。「次のモデルが出たら乗り換えよう」という物語は一旦終了しました。次のモデルは、すでに登場しています。

単に気になっている方へ: Spud、確かにリリースされました。これから半年間で注目すべきは「GPT-6 はいつ出るか」ではなく、「OpenAI は次の大ジャンプをどう命名し、Anthropic の Opus 5 より先にリリースできるか」です。

結論(2026年5月15日版)

5月時点での素直なまとめです。

Spud は出ました — 4月23日に GPT-5.5 として。 「4月23日までに GPT-5.5」の予測市場は完璧に的中し、「6月30日までに GPT-6」市場は約50ポイント外れました。これは「どのリークを信じるべきか」を考える際の基準として覚えておくと良いでしょう。実資金が集まる予測市場 > インサイダー系ブログ > X の「知り合いがいる」系の情報。この順位は常に変わりません。

本物の GPT-6 のベースラインは、今や 2026年Q3〜Q4 です。 Polymarket では 6月末が約10%、9月末が約55-60%、12月末が約82%。Manifold は短期間でより悲観的な数値を示しています(6月までに約3%、9月までに約51%)。約4分の1の確率が2027年以降に振れており、ロードマップ依存度が高いプロダクトでは無視できないテールリスクとなります。

GPT-5.6 は内部テストに入っています。 Polymarket の 5.6 市場は近接で約88%。5.x 系のリリースペースは本物であり、誰も予想していなかった速さです。開発するなら今は GPT-5.5 をベースに進め、2026年の残りは漸進的なアップグレードがあると想定するのが正解です。

Anthropic と OpenAI は、今まさに互角の勝負をしています。 Claude Opus 4.7 は純粋なコーディング判断と指示追従でリード。GPT-5.5 はエージェント/ターミナル系ベンチで約13ポイント差をつけて勝利しました(Terminal-Bench 2.0)。Gemini 3.1 Pro は依然として大量処理におけるコストリーダーです。「次のモデルが出たら乗り換えよう」という戦略は、今のところ無効です。次のモデルは、すでに登場してしまっていますから。

4月14日の熱狂サイクルから、今でも通用する教訓は一つだけ。 次に耳にする「インサイダー」リークが具体的な日付と「40%性能向上」のような綺麗に丸められた数字を伴っていたら、今回と同じく裏取りできないと思ってください。OpenAI のリリースパターンは「当日告知 → Altman 氏の X 投稿 → 30分後のブログ公開」です。それ以外はすべてノイズです。

本物の GPT-6 の具体的なロードマップが夏までに明確になったら、このページも改めて更新します。


関連記事: GPT-6 が噂通りエージェント機能付きでリリースされた場合、Claude vs ChatGPT 2026比較もあわせて参照してください。また、「Claude Mania」記事では、OpenAI が今どれだけのプレッシャーにさらされているかが解説されています。


参考資料:

一次情報(OpenAI 公式):

日本語での解説・速報:

英語での主要報道(4月23日ローンチ):

予測市場(現在価格):

トラッカー・分析: