Vera Rubin auf der GTC Taipei (1. Juni): Das 5-Fragen-Briefing für DACH-CIOs

Jensen Huang ist am Samstag, dem 23. Mai, in Taipei gelandet und ist direkt zum Abendessen mit TSMC-Gründer Morris Chang gefahren. Am Montag trifft er C.C. Wei, den jetzigen TSMC-Chairman, um CoWoS-Packaging-Kapazität für die Plattform zu sichern, die Jensen “den größten und schnellsten Produkthochlauf in der Geschichte Taiwans” nennt. Die GTC-Taipei-Keynote am Montag, dem 1. Juni, ist die öffentliche Ebene einer Reise, deren eigentlicher Zweck Lieferketten-Diplomatie war.

Für die meisten Leser ist die Keynote ein Marketing-Event. Für jeden, der eine Q3-GPU-Compute-Verlängerung unterschreibt, eine DGX-SuperPOD-Konfiguration über einen Reseller verhandelt oder einen Rechenzentrumsausbau für 2027 plant, ist das die eine Stunde des Jahres, die Deine Beschaffungsmathematik zurücksetzt.

In DACH kommt eine Schicht obendrauf, die im US-Diskurs fehlt: die Kombination aus DSGVO-Datenresidenz, EU-AI-Act-Pflichten ab August 2026 und der grundsätzlichen Mittelstandsskepsis gegenüber Single-Vendor-Lock-in. Wenn Du in Deutschland, Österreich oder der Schweiz beschaffst, ist die Keynote nicht nur eine Preis-Ankerung. Sie ist auch ein Souveränitätssignal.

Unten findest Du die Briefing-Version. Fünf Fragen für ein einseitiges Handout vor der Keynote, wie eine gute Antwort jeweils aussieht, und die vier Follow-up-Fragen für Dein NVIDIA-Account-Team am Montagmorgen, bevor die Vertriebsteams die Filter setzen.

Was sich geändert hat (und warum das mehr ist als der nächste Produktlaunch)

Vera Rubin ist die Architektur nach Blackwell. NVIDIA verspricht 3,5-fache Trainings- und 5-fache Inferenz-Performance pro GPU — das Flaggschiff-Rack-System Vera Rubin NVL72 läuft auf der dritten MGX-NVL72-Generation.

Das ist die Folien-Version. Drei leisere Fakten zählen für die Beschaffung mehr.

Eins. Der Preissprung ist real — und er kommt aus dem Speicher. Tom’s Hardware hat die NVL72-Stückliste auf rund 7,8 Millionen US-Dollar pro Rack beziffert — gegenüber rund 4 Millionen für das vergleichbare Grace-Blackwell-GB200-Rack. Ein Plus von 95 Prozent. Die Rubin-GPU selbst kostet nur etwa 50.000 US-Dollar; der Speicher macht inzwischen rund 26 Prozent der Systemkosten aus, fast das Fünffache wie bei Blackwell. Jede GPU bringt 288 GB HBM4 mit, das Rack also 20,7 TB High-Bandwidth-Speicher. OEM-Angebote liegen je nach Konfiguration bei 5-7 Millionen US-Dollar pro Rack — und damit ziemlich genau auf der Futurum-Schätzung, die seit der CES kursiert. In Euro umgerechnet und mit deutschen Lieferzuschlägen kalkulierst Du eher 6,8-9,2 Mio. EUR pro Rack — bevor Du Strom, Kühlung oder DSGVO-konforme Standorthärtung addierst.

Zwei. Das NVIDIA-Auftragsbuch bis 2027 liegt nach Berichten nahe an einer Billion US-Dollar. AWS hat die Bereitstellung von über 1 Million NVIDIA-GPUs ab 2026 zugesagt. Google Cloud bietet Vera Rubin NVL72 als einer der ersten Cloud-Anbieter in der zweiten Jahreshälfte 2026 an. Meta hat sich auf Millionen Chips quer durch Blackwell und Rubin festgelegt. Microsoft hat bereits Vera-Rubin-Muster im Haus — Satya Nadella hat das beim letzten Earnings-Call bestätigt. Wenn Du kein Hyperscaler bist und kein Launch-Partner, stehst Du in der Schlange weiter hinten. Für den DACH-Mittelstand heißt das: Verzicht auf On-Premise-Rubin in 2026 ist die wahrscheinlichste Realität, und der Druck Richtung Hyperscaler-Cloud verstärkt sich genau dann, wenn der EU-AI-Act ab August 2026 Souveränitätsthemen verschärft.

Drei. Der Engpass ist real — und er sitzt nicht im Silizium, sondern im CoWoS-Packaging. TSMCs Chip-on-Wafer-on-Substrate-Prozess fügt CPU, GPU und HBM zu einem funktionierenden KI-Beschleuniger zusammen und ist seit fast zwei Jahren der eigentliche Volumenbremser. TSMC skaliert CoWoS von rund 75.000-80.000 Wafer pro Monat Anfang 2026 in Richtung 125.000-140.000 zum Jahresende — eine der aggressivsten Packaging-Ausbauten der Halbleitergeschichte. NVIDIA hat angeblich mehr als die Hälfte der CoWoS-Gesamtkapazität 2026-27 vorgebucht. Genau deshalb ist Jensen dieses Wochenende nach Taipei geflogen.

Das ist der Kontext. Jetzt die Fragen.

Die offizielle NVIDIA-GTC-Taipei-2026-Keynote-Seite — Jensen Huangs Auftritt am 1. Juni, Vera-Rubin-Plattform im Mittelpunkt Quelle: NVIDIA GTC Taipei 2026 Keynote, abgerufen am 25. Mai 2026.

Die 5 Fragen für das Pre-Keynote-Handout Deines Teams

Frage 1 — Bestätigt Jensen ein Enterprise-Vera-Rubin-GA-Lieferfenster?

Das ist die Frage, die Deinen H2-Beschaffungsplan zurücksetzt.

Worauf hören. Eine bestätigte “H2 2026 Enterprise-Verfügbarkeit” für NVL72 ist der Bull Case für Deinen Q4-Aufbau. “H1 2027” ist das realistische Szenario — und heißt: Du darfst zwei weitere Quartale Blackwell-Auslastung optimieren. Alles Vage — “in der zweiten Jahreshälfte” ohne Enterprise-Spezifikation, “rollende Verfügbarkeit” — solltest Du in der Finanzplanung mit einem 6-Monats-Verzögerungspuffer einpreisen.

Die Gegenposition, die es wert ist, im Hinterkopf zu behalten. SemiAnalysis argumentiert im Great AI Silicon Shortage, dass für jeden Käufer mitten im GB200-Zyklus der schlaue Move ist: Blackwell bis 2026 zu Ende rollen und Rubin für 2027 reservieren — die frühen Slots gehen an Hyperscaler, und die Lieferkette hat schlicht nicht genug HBM4, um Enterprise-Volumen vor Mitte 2027 zu bedienen. Wenn das stimmt, ist “bestätigte H2 2026” die Marketing-Version einer Wahrheit, die für Nicht-Hyperscaler eher H1 2027 lautet.

Frage 2 — Welche namentlich genannten Hyperscaler- und Enterprise-Commitments bekommen Bühnenzeit?

NVIDIA verankert Enterprise-Preise und Versorgungstier-Wahrnehmung über die Namen, die auf der Bühne erscheinen. Achte auf drei Dinge.

Wenn Anthropic-Vera-Rubin genannt wird — neben dem bestehenden Anthropic-Google-Broadcom-3,5-GW-TPU-Deal und dem SpaceX-Colossus-Mietvertrag aus dem S-1 vom 20. Mai — hat sich Anthropics Compute-Risiko-Modell gerade gestreckt. Wenn Du Claude-API-lastig bist und im Q3 verlängerst, ist das ein positives Signal für Kapazitätsgarantien.

Wenn AWS oder Azure auf der Bühne ein Multi-Milliarden-Vera-Rubin-Commitment verkündet, sollte Deine 2027er-Cloud-GPU-Preisprognose um 15-25 Prozent nach unten gehen — weil die Versorgungs-Konkurrenz die Stunden-Listenpreise bis Q2 2027 drücken wird. Plane das in jeden 18-Monats-Cloud-Spend-Vorschlag ein, den Dein CFO gerade absegnet.

Wenn Meta oder Google einen Eigen-Cluster-Vera-Rubin-Aufbau im Gigawatt-Maßstab ankündigt, müssen die nächsten 12 Monate Deiner Inference-Kosten-pro-Token-Prognosen aktualisiert werden — sie sind wahrscheinlich zu hoch.

Frage 3 — Gibt es eine “Five-Layer-Cake”-Energiepartnerschaft?

NVIDIAs durchgängiges Framing in Q1-Q2 2026 war das Five-Layer Cake — Energie, Silizium, Systeme, Software, Anwendungen. Sie haben den Großteil der Torte. Was sie nicht haben, ist Energie.

Eine Bühnenpartnerschaft für Energieversorgung — mit einem Hyperscaler, einem Netzbetreiber, einem Small-Modular-Reactor-Anbieter oder einer regionalen Energieversorgerin — würde signalisieren, dass sich der Engpass offiziell von Chips auf Strom verschoben hat. Das ändert, welche Rechenzentrumsregionen Dein Team für Neubau anpeilen sollte. Für DACH heißt das besonders: Standorte mit garantiertem Stromanschluss in Frankfurt, Wien-Nordost oder dem Zürcher Limmattal werden zur Mangelware — und genau das ist der Markt, in dem Microsoft, AWS und Google bereits Vorverträge geschlossen haben. Wenn die Keynote keinen Energie-Slide enthält, ist das ein negatives Signal — die Engpassgeschichte bleibt Packaging, und Du hast noch ein Jahr, bevor sich die Form ändert.

Frage 4 — Was ist die neue DGX-SuperPOD-Preisobergrenze?

NVIDIA ankert Enterprise-Preise gewöhnlich an großen Keynotes. Wenn der Vera-Rubin-SuperPOD-Preis materiell über dem aktuellen Blackwell-SuperPOD-Preis liegt — irgendwo nennenswert über der 5-7-Mio-Spanne pro Rack, die schon durchsickert — schließt sich Dein Reseller-Verhandlungsfenster. Die meisten Reseller und OEMs preisen innerhalb von 8-12 Prozent um den NVIDIA-Anker.

Der Käufer-Move: Hol Deinen Reseller (Dell, Supermicro, HPE, Lenovo, Bechtle, Cancom, Computacenter für DACH) innerhalb von 48 Stunden nach der Keynote ans Telefon und frag explizit nach einem Angebot gegen die keynote-verankerte Linie. Wenn das Angebot mehr als 15 Prozent darüber liegt, testet der Reseller Deine Verhandlungsreife — kontere mit der öffentlichen Ankerzahl und geh, wenn er nicht bewegt.

Frage 5 — Steht explizit eine TSMC-CoWoS-Kapazitätsgarantie in der Ankündigung?

Jensens Samstag-Montag-Trip ist genau darum. Wenn CoWoS-Kapazität explizit oder implizit an NVIDIA-Prioritätskunden-Zuweisung gekoppelt ist — und die Keynote Formulierungen wie “wir haben die Packaging-Kapazität gesichert, um X Racks pro Quartal bis Q4 2027 zu liefern” nutzt — ist das praktische Signal für Dein Team binär.

Platziere Deine Q3-Bestellungen bis 31. Juli oder warte bis Q1 2027. Das ist keine Übertreibung. Die Pipeline, die NVIDIA angeblich vorgebucht hat, deckt mehr als die Hälfte der CoWoS-Gesamtkapazität 2026-27; die Restkapazität ist das, was OEM-Resellern für Enterprise bleibt. Wenn Du nicht vor Q3-Schluss in der Warteschlange stehst, ist der nächste verfügbare Slot ehrlich Q1 2027.

Wenn die Keynote eine harte Kapazitätsgarantie vermeidet — und Jensen das übliche “wir arbeiten mit TSMC daran, zu skalieren” abliefert — ist das ebenfalls handlungsrelevant. Es bedeutet, TSMC und NVIDIA haben am Wochenende keine durchsetzbare Verpflichtung erreicht — und die Pipeline ist fragiler, als das Schlagzeilenauftragsbuch suggeriert.

Die Vera-Rubin-NVL72-Produktseite auf nvidia.com mit der Rack-Architektur und den Performance-Sprüngen gegenüber Blackwell Quelle: NVIDIA Vera Rubin NVL72, abgerufen am 25. Mai 2026.

Was Du Deinen NVIDIA-Account-Manager am Dienstag, 2. Juni morgens fragst

Die Fragen oben sind für Dein Team während der Keynote. Diese vier sind für Deinen NVIDIA-Enterprise-Account-Manager am Telefon, das Du für den Morgen danach planst.

“Welche spezifische Vera-Rubin-Allokation habt Ihr für uns für Q4 2026 und Q1-Q2 2027 — angesichts der Keynote-Ankündigungen? Schreibt Ihr das in einem Side-Letter zu unserem bestehenden Rahmenvertrag fest?” Vertriebsleute bieten verbale “indikative Allokationen”. Side-Letter-Formulierung ist das, was sie real macht.
“Gibt es auf unserem Spend-Niveau einen Launch-Partner- oder Prioritätskunden-Status? Wo ist die Schwelle, und was müssten wir 2026-27 ändern, um zu qualifizieren?” Das ist die Verhandlungseröffnung für kapazitätsgarantierte Allokation. Selbst wenn die Antwort Nein ist, sagt sie Dir, wer sie bekommt.
“Wie sieht der Upgrade-Pfad von Blackwell aus? Habt Ihr eine Inzahlungnahme, eine Restwertgarantie oder einen Refresh-Rabatt, der unsere GB200-Ausgaben 2025 ausgleicht, wenn wir Vera Rubin für 2027 bestellen?” Relevant für jedes Unternehmen, das in den letzten 12 Monaten stark in Blackwell investiert hat. NVIDIAs Enterprise-Vertrieb ist hier in den letzten zwei Quartalen flexibler geworden.
“Wie ist Eure Eventualplanung, falls CoWoS-Kapazität rutscht? Wenn TSMC das Jahresend-Packaging-Ziel verfehlt — welches verbindliche Lieferfenster habt Ihr für unsere Allokation, und ist Pönale-Sprache verfügbar?” Es geht nicht darum, tatsächlich Pönale zu ziehen. Es geht darum, früh die Risikobewertung sichtbar zu machen, die NVIDIA selbst einpreist — und Deinem Beschaffungs-Rechtsanwalt den Rahmen für eine schriftliche Eventualklausel zu geben.

Was das für Dich heißt

Wenn Du Enterprise-CIO mit offener Q3-GPU-Compute-Verlängerung bist

Warte die Keynote ab. Plane dann das oben beschriebene Account-Manager-Gespräch innerhalb von 48 Stunden. Verankere jede Verlängerungsverpflichtung an der keynote-veröffentlichten Preisobergrenze und der Side-Letter-Allokations-Sprache. Lass Dein Team nicht zu Pre-Keynote-Preisen verlängern — der öffentliche Anker verschiebt Deinen Verhandlungsraum materiell.

Wenn Du VP-Infrastruktur bist und einen 2027er-Rechenzentrumsausbau planst

Die Energiefrage zählt für Dich mehr als die Siliziumfrage. Wenn die Keynote eine Five-Layer-Cake-Energiepartnerschaft bringt, ziehe Deine Standort-/Strom-Entscheidungen in Q3 vor. Wenn nicht, bleibt Dein Engpass bis 2027 Packaging, nicht Strom — und Dein bestehender Standortplan hält wahrscheinlich.

Wenn Du Platform-Engineering-Lead bei einem 50-500-Personen-KI-Startup bist

Das meiste hiervon ändert Deinen Alltag nicht. Dein Model-Vendor (Anthropic, OpenAI, Google) trägt das Silizium-Risiko für Dich. Das eine Signal, das zählt: Wenn Anthropic als Vera-Rubin-Partner genannt wird, verbessert sich Dein Claude-Kapazitätsausblick für Q3-Q4 materiell — und Du kannst die Hedge-Arbeit auf Bedrock-/Vertex-Backup-Kapazität verschieben, die Du als P1 mitgeschleppt hast.

Wenn Du DACH-Mittelstand-Beschaffer im regulierten Sektor bist

Die Vertragssprache-Fragen sind die, die Du zu Deinem Enterprise-Account-Team trägst. Besonders Side-Letter-Sprache und CoWoS-Slip-Eventualklausel. Regulierte Branchen in DACH bekommen die schlechteste Allokationsseite zu spüren, weil Beschaffungs-Governance Dein Team verlangsamt; der Ausgleich liegt in vertraglicher Spezifizität, und das Post-Keynote-Fenster ist der Moment, in dem Vertriebsleute am ehesten bereit sind, das schriftlich zu festigen. Bei DSGVO- und EU-AI-Act-Pflichten zusätzlich auf Datenresidenz-Garantien achten — gerade wer Frankfurt, Dublin oder Zürich als Pflichtstandorte braucht.

Was dieses Briefing Dir nicht sagen kann

Es kann Dir nicht sagen, ob die Keynote irgendetwas davon tatsächlich liefert. Pre-Event-Analyse ist eine Art, Dein Zuhören zu organisieren; sie ist keine Prognose. Jensen hat bei früheren Keynotes spezifische Lieferfenster zurückgehalten, wenn die Verkaufszyklus-Mathematik ungünstig war.

Es kann Dir nicht sagen, wie der Compute-Fahrplan Deines Modell-Vendors aussieht. Anthropic, OpenAI und Google veröffentlichen genug für eine 12-Monats-Skizze, aber nicht genug, um ein 36-Monats-Commitment zu unterschreiben.

Es kann das geopolitische Risiko nicht bepreisen. Jede nennenswerte Taiwan-Straße-Disruption setzt jede CoWoS-abhängige Zahl im Modell zurück. Die meisten CIOs tragen schon eine unausgesprochene Annahme, dass die Lieferkette geografisch konzentriert ist — die Keynote wird das wahrscheinlich verstärken, aber keine Seite veröffentlicht eine echte Eventualplanung.

Es kann Deine Reseller-Beziehung nicht ersetzen. Bechtle, Cancom, Computacenter, Dell, HPE, Supermicro und Lenovo haben Material-Kontext, den die Keynote nicht offenlegen wird. Plane das Post-Keynote-Gespräch ungeachtet dessen, was angekündigt wird.

Das Fazit

Behandle die Keynote wie eine wichtige EZB-Sitzung, nicht wie einen Produktlaunch. Die marktbewegende Information steckt in den spezifischen Linien zu Allokation, Kapazität, Partnerschaften und Preisen — den Dingen, die die meisten Leser bei den Demos überhören. Sorg dafür, dass Dein Team ein einseitiges Handout mit den fünf Fragen oben hat, führe am Morgen des 2. Juni eine 30-minütige Nachbesprechung durch, und plane das Account-Manager-Gespräch für den Nachmittag.

Wenn Du den KI-Beschaffungs-Muskel auf Deinem Team aufbaust — vom Vendor-Auswahl über Vertragssprache und Kapazitätsplanung bis zur Hyperscaler-Beziehungsarbeit, die diese Keynotes in echte Entscheidungen verwandelt — geht unser KI-Controlling für IT-Beratung durch den Beschaffungsrahmen von vorne bis hinten.