Vera Rubin à GTC Taipei (1er juin) : le briefing en 5 questions pour DSI français et francophones

Jensen Huang a atterri à Taipei samedi 23 mai, et il est parti direct dîner avec Morris Chang, le fondateur de TSMC. Lundi, il rencontre C.C. Wei, le chairman actuel, pour verrouiller la capacité packaging CoWoS pour la plateforme que Jensen appelle « la rampe de produit la plus grande et la plus rapide de l’histoire de Taiwan ». La keynote du lundi 1er juin à GTC Taipei est la couche publique d’un voyage dont le vrai but est la diplomatie de la chaîne d’approvisionnement.

Pour la plupart des lecteurs, la keynote sera un événement marketing. Pour quiconque signe un renouvellement compute GPU au T3, négocie une configuration DGX SuperPOD via un revendeur, ou planifie une construction de datacenter pour 2027, c’est la seule heure de l’année qui remet à zéro la math de ton sourcing.

Pour la France et la francophonie il y a une couche supplémentaire qui manque dans le discours US : la souveraineté numérique côté CNIL/HDS pour les données de santé, l’AI Act qui entre en vigueur en août 2026, la stratégie nationale IA (3,5 milliards d’euros annoncés par France 2030), et la réalité que la plupart des entreprises françaises sourcent leur compute via OVHcloud, Scaleway ou les hyperscalers en régions Paris/Marseille/Francfort — pas directement chez NVIDIA. Si tu achètes depuis Paris, Lyon, Toulouse, Bruxelles ou Montréal, la keynote n’est pas qu’un ancrage de prix. C’est aussi un signal sur la quantité de capacité Rubin qui partira aux clients US avant d’arriver dans ta région cloud.

Ci-dessous le briefing. Cinq questions à mettre sur un handout d’une page avant la keynote, à quoi ressemble la bonne réponse pour chacune, et les quatre questions de suivi à poser à ton account manager NVIDIA mardi matin avant que les filtres de l’équipe commerciale ne se referment.

Ce qui a changé (et pourquoi ce n’est pas qu’un nouveau lancement produit)

Vera Rubin est l’architecture qui suit Blackwell. NVIDIA promet 3,5× de performance d’entraînement et 5× d’inférence par GPU — le système rack-scale phare, Vera Rubin NVL72, tourne sur la troisième génération de la plateforme MGX NVL72.

Ça, c’est la version slide. Trois faits plus discrets comptent davantage pour le sourcing.

Un. Le saut de prix est réel — et il vient de la mémoire. Tom’s Hardware a chiffré la BOM du NVL72 à environ 7,8 millions de dollars par rack versus environ 4 millions pour le rack Grace Blackwell GB200 équivalent — soit une hausse de 95 %. Chaque GPU Rubin coûte seulement autour de 50 000 dollars ; la mémoire représente désormais environ 26 % du coût total du système, près de cinq fois plus que sur Blackwell. Chaque GPU embarque 288 Go de HBM4, soit 20,7 To de mémoire haut débit par rack. Les devis OEM oscillent entre 5 et 7 millions de dollars par rack selon configuration. En euros, et avec les coûts d’import français — TVA, frais d’installation conformes ASN si tu es opérateur d’importance vitale, climatisation de précision — la facture monte facilement à 6,5-8,5 millions d’euros par rack avant électricité et exploitation.

Deux. Le carnet de commandes NVIDIA jusqu’en 2027 frôle reportedly les 1 000 milliards de dollars. AWS s’est engagé à déployer plus d’un million de GPU NVIDIA dès 2026. Google Cloud fait partie des premiers cloud providers à proposer Vera Rubin NVL72 en seconde moitié 2026. Meta s’est engagé sur des millions de puces entre Blackwell et Rubin. Microsoft a déjà des échantillons Vera Rubin en interne — Satya Nadella l’a confirmé sur son dernier earnings call. Si tu n’es ni un hyperscaler ni un launch partner, tu es plus loin dans la file. Pour la France ça veut dire : la capacité Rubin arrivera dans us-east-1 d’AWS et us-central de GCP avant d’arriver dans eu-west-3 (Paris), europe-west9 (Paris) ou europe-southwest1 (Madrid). Ta planif de capacité T3-T4 doit assumer un retard de 1-2 trimestres pour les régions européennes.

Trois. Le goulet est réel — et ce n’est pas le silicium. C’est le packaging CoWoS. TSMC monte la cadence CoWoS de 75-80 000 wafers par mois début 2026 vers 125-140 000 fin d’année — l’une des montées en charge packaging les plus agressives de l’histoire du semi-conducteur. NVIDIA a reportedly pré-réservé plus de la moitié de la capacité CoWoS totale 2026-27.

Ce trio, c’est le contexte. Maintenant les questions.

La page officielle de la keynote NVIDIA GTC Taipei 2026 — discours de Jensen Huang le 1er juin, plateforme Vera Rubin au centre Source : NVIDIA GTC Taipei 2026 Keynote, consulté le 25 mai 2026.

Les 5 questions à mettre sur le handout pré-keynote de ton équipe

Question 1 — Jensen va-t-il confirmer une fenêtre de livraison GA entreprise pour Vera Rubin ?

Celle qui remet à zéro ton plan de sourcing H2.

Ce qu’il faut écouter. Une ligne confirmée « disponibilité entreprise seconde moitié 2026 » pour NVL72, c’est le cas bull pour ton build-up T4. Un cadrage « première moitié 2027 », c’est le cas réaliste — et ça veut dire que tu as la permission d’optimiser ton utilisation Blackwell pendant deux trimestres de plus. Tout flou — « en seconde moitié » sans qualificatif entreprise, « disponibilité progressive » — tu dois le pricer comme un buffer de retard de 6 mois dans ton modèle financier.

La lecture contraire à garder en tête. SemiAnalysis argumente dans The Great AI Silicon Shortage que pour tout acheteur en milieu de cycle GB200, le bon move c’est de terminer les rollouts Blackwell sur 2026 et de réserver Rubin pour 2027 — les slots de livraison anticipée partent aux hyperscalers, et la chaîne d’appro n’a tout simplement pas assez de HBM4 pour honorer le volume entreprise avant mi-2027 au plus tôt. Si cette lecture est juste, « H2 2026 confirmé » c’est la version marketing d’une vérité qui ressemble pour les non-hyperscalers à H1 2027 au mieux.

Question 2 — Quels commitments nommés (hyperscalers et entreprises) reçoivent du temps de scène ?

NVIDIA ancre prix entreprise et perception du tier de fourniture via les noms qui apparaissent sur scène.

Si Anthropic-Vera-Rubin est nommé — à côté du deal Anthropic-Google-Broadcom 3,5 GW TPU existant et de la location de SpaceX Colossus révélée dans le S-1 du 20 mai — le modèle de risque compute d’Anthropic vient de s’aplatir. Si tu es une entreprise gourmande en API Claude qui renouvelle au T3, c’est un signal positif pour les garanties de capacité.

Si AWS ou Azure annonce un commitment Vera Rubin multi-milliards sur scène, ta prévision de prix Cloud-GPU pour 2027 doit baisser de 15-25 % parce que la concurrence du côté de l’offre va comprimer les tarifs horaires d’ici T2 2027.

Si Meta ou Google annonce une construction de cluster propre Vera Rubin à l’échelle gigawatt, les 12 prochains mois de tes prévisions de coût d’inférence par token gravées dans ton modèle financier sont à actualiser — elles sont probablement trop hautes.

Question 3 — Y a-t-il un partenariat énergie « Five-Layer Cake » ?

Le cadrage répété de NVIDIA sur T1-T2 2026 a été le Five-Layer Cake — énergie, silicium, systèmes, software, applications. Ils ont la majeure partie du gâteau. Ce qu’ils n’ont pas, c’est l’énergie.

Un partenariat énergie sur scène — avec un hyperscaler, un opérateur réseau, un acteur SMR (small modular reactor), ou un fournisseur d’électricité régional Texas/Tennessee/Arizona — signalerait que le goulet s’est officiellement déplacé du chip vers l’électricité. Ça change quelles régions de datacenter ton équipe doit cibler. En France, ça pèse particulièrement : les fermes serveurs en Île-de-France saturent (RTE le dit ouvertement depuis Q4 2025) ; Marseille et Lyon sont les options de repli rapide ; le territoire du Grand Est (Saint-Avold, Strasbourg) bénéficie de l’EnR éolien-photovoltaïque et de la proximité Allemagne. Si NVIDIA annonce un partenariat SMR avec EDF ou Framatome — peu probable mais pas impossible — c’est un game-changer pour la souveraineté compute française.

Question 4 — Quel est le nouveau plafond de prix DGX SuperPOD ?

NVIDIA ancre typiquement les prix entreprise lors des keynotes majeures. Si le prix SuperPOD Vera Rubin est ancré matériellement au-dessus du prix SuperPOD Blackwell actuel — n’importe où significativement au-delà de la fourchette 5-7 M$ par rack qui fuite déjà — ta fenêtre de négo avec ton revendeur vient de se refermer.

Le move acheteur : chope ton revendeur (Dell, Supermicro, HPE, Lenovo — et en France, les intégrateurs régionaux comme Bull / Atos, Capgemini, Sopra Steria, OVHcloud Hardware, Computacenter France) au téléphone dans les 48 heures qui suivent la keynote et demande explicitement une cotation contre la ligne ancrée par la keynote. Si la cotation est plus de 15 % au-dessus, le revendeur teste ta sophistication ; contre avec le chiffre d’ancrage public et casse-toi s’il ne bouge pas.

Question 5 — Y a-t-il une garantie de capacité CoWoS de TSMC enterrée dans l’annonce ?

Le voyage samedi-lundi de Jensen à Taipei est précisément pour ça. Si la capacité CoWoS est explicitement ou implicitement liée à l’allocation de clients prioritaires NVIDIA — et que la keynote utilise des formulations comme « nous avons sécurisé la capacité packaging nécessaire pour livrer X racks par trimestre jusqu’à T4 2027 » — le signal pratique pour ton équipe est binaire.

Place tes commandes T3 avant le 31 juillet ou attends T1 2027. Ce n’est pas de l’hyperbole. Le pipeline d’appro que NVIDIA a pré-réservé couvre plus de la moitié de la sortie CoWoS totale 2026-27 ; la capacité résiduelle, c’est ce qui est dispo pour les OEM revendeurs aux entreprises. Si tu n’es pas dans la file avant la clôture T3, le prochain slot dispo c’est honnêtement T1 2027.

La page produit Vera Rubin NVL72 sur nvidia.com avec l’architecture rack-scale et les gains de perfo cités 5x inférence / 3,5x entraînement vs Blackwell Source : NVIDIA Vera Rubin NVL72, consulté le 25 mai 2026.

Ce qu’il faut demander à ton account manager NVIDIA le mardi 2 juin au matin

Les questions du dessus sont pour ton équipe pendant la keynote. Ces quatre sont pour ton account manager entreprise NVIDIA sur l’appel que tu dois caler pour le lendemain matin.

« Au vu des annonces de la keynote, quelle est notre allocation spécifique Vera Rubin pour T4 2026 et T1-T2 2027 ? Vous me le mettez par écrit dans un side letter à notre contrat-cadre existant ? » Les commerciaux offriront des « allocations indicatives » verbales. La formulation en side letter, c’est ce qui les rend réelles.
« Y a-t-il une désignation launch-partner ou client prioritaire à notre niveau de dépense ? Quel est le seuil de qualification, et qu’est-ce qu’on devrait changer sur 2026-27 pour qualifier ? » C’est l’ouverture de négo pour une allocation avec garantie de capacité.
« Quel est le chemin d’upgrade depuis Blackwell ? On a un crédit de reprise, un commitment de valeur résiduelle, ou une remise de cycle de refresh qui compense notre dépense GB200 2025 si on commande Vera Rubin pour 2027 ? » Pertinent pour toute entreprise qui a acheté Blackwell fort sur les 12 derniers mois.
« Quel est votre plan de contingence si la capacité CoWoS glisse ? Spécifiquement, si TSMC rate son objectif packaging fin d’année, quelle est votre fenêtre de livraison engagée pour notre allocation, et y a-t-il une clause de pénalités liquidées disponible ? » Le but, ce n’est pas vraiment de réclamer des pénalités. Le but, c’est de faire émerger — tôt — combien de risque réel NVIDIA prix elle-même dans la timeline.

Ce que ça veut dire pour toi

Si tu es DSI entreprise avec un renouvellement compute GPU T3 ouvert

Attends la keynote. Puis cale l’appel avec l’account manager décrit ci-dessus dans les 48 heures. Ancre tout commitment de renouvellement au plafond de prix révélé par la keynote et à la formulation de side letter sur l’allocation. Ne laisse pas ton équipe renouveler aux prix pré-keynote — l’ancrage public déplace ta plage de négo matériellement.

Si tu es VP-infrastructure qui planifie une construction datacenter 2027 en France ou DACH-adjacent

La question énergie compte plus pour toi que la question silicium. Si la keynote produit un partenariat Five-Layer-Cake énergie, accélère tes décisions terrain/énergie au T3. En France, les options sont Île-de-France (saturée), Grand-Est (EnR), Marseille (Mer Méditerranée pour le refroidissement), Lyon (proximité hydraulique). Si NVIDIA ne dit rien sur énergie, ton goulet jusqu’en 2027 reste packaging, pas énergie — et ton plan de site existant tient probablement.

Si tu es lead plateforme dans une startup IA française de 50-500 personnes

L’essentiel de tout ça ne change pas ton quotidien. Ton vendor de modèle (Anthropic, OpenAI, Mistral, Google) porte le risque compute pour toi. Le seul signal qui compte : si Anthropic est nommée comme partenaire Vera Rubin, ton outlook capacité Claude pour T3-T4 s’améliore matériellement et tu peux différer le hedge sur Bedrock / Vertex que tu portes en P1. Pour les startups françaises souveraineté-sensibles, ajoute Mistral La Plateforme à ta réflexion — l’inférence hébergée en France/EU est une couche de portabilité qui sera de plus en plus pertinente côté ANSSI et AI Act.

Si tu es responsable achat hardware dans une industrie régulée française (banque, santé, énergie, défense)

Les questions de formulation contractuelle sont celles que tu portes à ton équipe account entreprise. Spécifiquement la formulation de side letter et la formulation de contingence sur slip CoWoS. Pour la France : ajoute une question sur l’hébergement HDS (santé), SecNumCloud (ANSSI) ou les exigences spécifiques BCE/ACPR (banque). NVIDIA a des partenariats existants avec OVHcloud et Scaleway pour répondre à ces qualifications ; demande explicitement le routage de la cotation par ces partenaires si la qualification est requise.

Ce que ce briefing ne peut pas te dire

Il ne peut pas te dire si la keynote livre vraiment quoi que ce soit du dessus. L’analyse pré-événement c’est une façon d’organiser ton écoute ; ce n’est pas une prédiction. Jensen a retenu des fenêtres de livraison spécifiques lors de keynotes passées quand la math du cycle commercial était défavorable.

Il ne peut pas te dire à quoi ressemble la feuille de route compute de ton propre vendor de modèle. Anthropic, OpenAI, Mistral et Google publient assez pour esquisser 12 mois mais pas assez pour souscrire un commitment de 36 mois.

Il ne peut pas pricer le risque géopolitique. Toute disruption sérieuse dans le détroit de Taïwan remet à zéro chaque chiffre CoWoS-dépendant du modèle.

Il ne peut pas remplacer ta relation revendeur. Bull/Atos, Capgemini, Sopra Steria, Dell, HPE, Supermicro, Lenovo, OVHcloud — n’importe lequel d’eux a un contexte matériel que la keynote ne fera pas remonter. Cale l’appel post-keynote indépendamment de ce qui est annoncé.

La conclusion

Traite la keynote comme une réunion BCE importante, pas comme un lancement produit. L’info qui bouge les marchés est dans les lignes spécifiques sur allocation, capacité, partenariats et prix — les trucs que la majorité des lecteurs zappent pour les démos. Passe à ton équipe un handout d’une page avec les cinq questions du dessus, fais un debrief de 30 minutes le matin du 2 juin, et cale l’appel avec l’account manager pour l’après-midi.

Si tu construis le muscle achat et déploiement IA dans ton équipe — couvrant sélection vendor, formulation contractuelle, planif de capacité, et le travail relation hyperscalers qui transforme ces keynotes en décisions réelles — notre IA Formation Entreprise parcourt le framework d’achat de bout en bout.