Y’a quelques semaines, quelqu’un a posté une vidéo qui faisait le tour d’un restaurant où les photos du menu, les plats, toute l’ambiance étaient visiblement générés par IA. La légende : « tout dans ce resto est généré par IA et ça me fout les jetons ». 6 279 likes, et des réponses sans pitié — « pub de slop, bouffe de slop », « ça fait cheap et fainéant », des gens qui se demandaient si la cuisine était seulement propre. Un chef a résumé la peur à la perfection : « je peux pas faire confiance à ta cuisine. J’ai besoin de voir à quoi ça ressemble pour de vrai, pas ce qu’un data center s’imagine que ça ressemble. »
Alors mettons les choses au clair tout de suite, parce que ce qu’on va faire, c’est l’exact opposé. L’IA vidéo est devenue assez accessible pour qu’un patron de café se fasse un vrai clip de promo en vingt minutes, pour le prix d’un café. Ça, c’est un vrai cadeau. Mais fait à l’arrache — en truquant des plats que tu ne sers pas, en collant du texte illisible par-dessus, en sur-traitant une vraie photo jusqu’à ce que le latte ait l’air radioactif — non seulement ça fait un flop, mais ça fait baisser la confiance des clients. La bonne nouvelle, c’est que la façon honnête d’utiliser l’IA vidéo, c’est aussi celle qui marche pour de vrai. Et ça commence avec une photo que t’as déjà.
Ce qui a changé (et ce qu’il faut ignorer)
Il y a deux ans, une vidéo de promo correcte, ça voulait dire un vidéaste, une demi-journée de tournage et une facture à quatre chiffres. Aujourd’hui, Veo 3.1 de Google — intégré dans l’app Gemini et dans l’outil Flow — peut transformer une seule photo fixe en court clip animé avec lumière et mouvement naturels. Sur une photo plate de ton croissant, tu peux faire monter une vapeur et lancer un lent travelling avant.
Petit point d’hygiène pour pas que tu perdes ton temps : Sora, c’est fini. OpenAI a fermé son app Sora grand public le 26 avril 2026. Si un tuto te dit d’utiliser Sora, il est périmé, point. Et côté Google, faut pas se mélanger les pinceaux : depuis Google I/O en mai 2026, Gemini Omni (le nouveau modèle « tout-en-un » de Google) prend la main sur la vidéo dans l’app Gemini — mais Veo 3.1 n’a pas disparu pour autant. Les deux coexistent : Omni, c’est la porte d’entrée grand public la plus simple (génération vidéo directement dans l’app, filigrane SynthID inclus) ; Veo 3.1 reste le modèle de référence côté pro et API, celui qu’une agence ou un intégrateur va continuer d’utiliser en coulisses. Pour un patron de café, ce qui compte : les deux te donnent un clip à partir d’une photo, et la porte d’entrée la moins chère, c’est un abonnement Google AI (j’en parle plus bas, avec le forfait Google AI Plus à 4,99 € et la vraie question de savoir s’il vaut le coup).
La méthode honnête en 20 minutes
Tout le truc tient là-dedans : tu animes une photo de ta vraie bouffe. Pas un plat généré. Pas un bol de banque d’images. Le vrai truc que tu vas tendre au client. Cette seule règle garde ta pub honnête, te met du bon côté des règles sur la publicité — en France, fabriquer un plat qui ne ressemble pas à ce que tu sers, ça tombe sous les pratiques commerciales trompeuses, et c’est la DGCCRF qui veille (l’équivalent français de la FTC américaine) — et, pas par hasard, ça produit le clip qui convertit.
Étape par étape :
- Photographie ton vrai plat. Appareil du téléphone, 1080p, surface neutre, près d’une fenêtre. Cette photo est à la fois ta matière première et ton assurance honnêteté.
- Ouvre Gemini ou Google Flow, lance une génération vidéo, et attache la photo comme image de référence. C’est de l’« image-vers-vidéo » — le plat reste ancré au réel au lieu d’être inventé.
- Écris deux courtes lignes : une action, un mouvement de caméra. Pour une photo de café, c’est littéralement : « Vapeur qui s’élève d’un latte fraîchement préparé, volutes qui s’enroulent lentement dans la lumière chaude du matin. Lent travelling avant, faible profondeur de champ, aucun texte, aucune main. » Garde le mouvement du sujet et celui de la caméra comme deux instructions séparées et simples.
- Génère d’abord huit secondes en réglage « Fast ». C’est un brouillon pas cher. Huit secondes, c’est de toute façon le plafond pour un clip cohérent, alors inutile de lutter contre. Vérifie que le mouvement a l’air naturel avant de dépenser sur un rendu de meilleure qualité.
- Coupe-la, puis ajoute ton texte dans un éditeur normal comme CapCut ou l’éditeur d’Instagram/Reels. C’est l’étape que tout le monde saute et qu’il ne faut surtout pas sauter : ne laisse jamais l’IA écrire ton prix, le nom de ton café ou ton adresse — elle transforme les lettres en charabia. Tape le texte toi-même, par-dessus.
- Publie en vertical (9:16), 1080p, 7 à 15 secondes. Mets tes hashtags dans le premier commentaire.
Petit bonus que beaucoup ignorent : Gemini Omni génère l’audio nativement. Une légère ambiance de café, le bruit d’un versement — ça peut sortir directement de la génération, sans que t’aies à chercher une musique libre de droits.
Les mouvements qui passent pour naturels avec la bouffe, ce sont les semi-aléatoires, ceux qu’on a du mal à truquer : la vapeur qui monte, un lent travelling avant, un versement de liquide, un filet de sauce ou de miel, une bascule de lumière dorée. Ceux-là cachent les petites imperfections qu’il reste à l’IA. Mise dessus.
Ce que ça veut dire pour toi
Si tu tiens un café : La vapeur est ta meilleure amie. Un latte, un espresso qui coule, une brioche à la cannelle avec la vapeur qui s’enroule — ça s’anime magnifiquement et ça a l’air réel, parce que la vapeur est vraiment aléatoire. Commence par là.
Si t’as un restaurant : Anime le plat signature pour lequel on te connaît. Un lent travelling avant sur une vraie assiette de pâtes avec une légère chaleur qui s’élève, ça bat n’importe quelle scène générée. Poste-en une par semaine, fais tourner les plats, et laisse les clients voir exactement ce qu’ils vont avoir.
Si t’es un commerce ou une boutique de quartier : Même méthode, sujet différent — un produit sur une surface propre avec une lente rotation ou un doux balayage de lumière. L’idée « une bonne photo devient une vidéo qui arrête le scroll » marche aussi bien pour une bougie ou un sac que pour un croissant.
Ce que l’IA vidéo ne sait toujours pas faire
- Elle ne sait pas écrire de texte. Les prix, le nom de ton café, « OUVERT TARD » — l’IA transforme les lettres en charabia. Ajoute chaque mot toi-même, dans l’éditeur, après.
- Elle ne gère pas bien les mains ni les visages. Les doigts fusionnent, les visages partent dans l’étrange. Garde les gens en dehors du clip IA — si tu veux un humain, filme ce bout-là pour de vrai et monte-le dedans.
- Elle ne garde pas ton logo cohérent. Le design de ta tasse ou ton enseigne va se déformer image après image. Ajoute le logo en surimpression statique au montage, pas dans la génération.
- Elle ne tourne pas plus de 8 secondes par clip proprement. Tu veux 20 secondes ? Assemble plusieurs clips au montage. Ne demande pas un mini-film à une seule génération.
- Elle ne peut pas rendre une fausse bouffe honnête. C’est le gros morceau. Un bol lustré par l’IA qui ne ressemble en rien à la vraie assiette, c’est pas du marketing malin — au regard des pratiques commerciales trompeuses, c’est de la publicité mensongère, et les clients sanctionnent ça plus fort que pas de pub du tout. Pour la DGCCRF, d’ailleurs, ce qui compte c’est l’effet sur le client (est-il trompé sur le plat ?), pas l’outil utilisé : photo retouchée ou clip IA, même règle. Anime ta vraie photo. Ne génère pas un plat que tu ne sers pas.
Et il y a maintenant une raison de plus de signaler tes vidéos IA : la transparence devient une obligation légale. À partir du 2 août 2026, l’article 50 du règlement européen sur l’IA (l’« AI Act ») impose de signaler clairement les contenus générés ou manipulés par IA — surtout quand ils peuvent passer pour réels. En clair, une petite mention « #GénéréParIA » ne te coûte rien, t’achète de la confiance, et te met du bon côté de la loi qui arrive. Autant prendre le pli tout de suite.
Pour résumer
Le café qui s’est fait incendier en ligne n’a pas échoué parce qu’il a utilisé l’IA. Il a échoué parce qu’il a utilisé l’IA pour mentir sur la bouffe. Fais l’inverse. Prends une vraie photo du truc dont t’es fier·ère, laisse l’IA ajouter huit secondes de vapeur et un doux travelling avant, tape tes propres mots par-dessus, et publie. Vingt minutes, quelques centimes, et un clip qui ressemble à ton endroit — parce que c’en est un.
Tu veux toute la mise en place — les prompts exacts, l’antisèche des mouvements de caméra, et comment préparer un mois de clips en un après-midi ? Notre formation Création vidéo IA te déroule ça pour un petit commerce, du début à la fin. Et si tu te demandes quel forfait IA payer concrètement pour avoir les outils vidéo, voici le décryptage honnête de Google AI Plus à 4,99 €.
Sources
- Veo 3.1 — Google DeepMind
- Le guide ultime de prompting pour Veo 3.1 — Google Cloud
- Ce qu’il faut savoir sur l’arrêt de Sora — Centre d’aide OpenAI
- Pratiques commerciales trompeuses : ce que dit la loi — DGCCRF
- Article 50 — Obligations de transparence (règlement UE 2024/1689 sur l’IA)
- Calendrier d’application de l’AI Act — Commission européenne
- Générateurs de vidéos IA 2026 : le comparatif — Clubic
- L’état de la génération vidéo par IA en 2026 : ce qui marche, ce qui foire — Numerama