Vor ein paar Wochen lief ein Video durch die Timeline: jemand geht durch ein Restaurant, und die Menüfotos, die Gerichte, die ganze Stimmung sind offensichtlich KI-generiert. Die Caption sinngemäß: “Alles in diesem Restaurant ist KI-generiert und es macht mir echt Angst.” Über 6.000 Likes — und die Kommentare waren brutal. “Slop-Werbung, Slop-Essen”, “sieht billig und faul aus”, Leute fragten, ob die Küche überhaupt sauber ist. Ein Koch hat die Angst perfekt zusammengefasst: “Ich kann eurem Kochen nicht trauen. Ich muss sehen, wie es aussieht — nicht, was ein Rechenzentrum denkt, wie es aussieht.”
Und glaub nicht, das sei nur ein US-Ding. Als auf der DoKomi in Düsseldorf der ganze Food-Court mit KI-generierten Essensbildern zugepflastert war, ging ein Post dazu mit über tausend Likes durch — der Tenor: “unfassbar unangenehm”, man konnte gar nicht erkennen, wie das Essen wirklich aussieht. Eine Besucherin brachte’s auf den Punkt: “selbst die Pommes sind KI generiert … ich find’s sehr traurig.” Genau diese Reaktion riskierst du, wenn du’s faul angehst. Hier in Deutschland genauso.
Okay, machen wir gleich klar, was wir hier tun, denn es ist das Gegenteil davon. KI-Video ist günstig genug geworden, dass ein Café-Inhaber in zwanzig Minuten einen echten Promo-Clip macht, für den Preis eines Kaffees. Das ist ein echtes Geschenk. Aber faul gemacht — Gerichte faken, die du gar nicht servierst, krude Schrift draufkleben, ein echtes Foto so überdrehen, bis der Latte radioaktiv leuchtet — floppt es nicht nur. Es lässt Kunden dir weniger vertrauen. Die gute Nachricht: Der ehrliche Weg, KI-Video zu nutzen, ist auch der, der tatsächlich funktioniert. Und er fängt mit einem Foto an, das du schon hast.
Was sich geändert hat (und was du ignorieren kannst)
Vor zwei Jahren hieß ein anständiges Promo-Video: ein Videograf, ein halber Drehtag, eine vierstellige Rechnung. Jetzt kann Googles Veo 3.1 — eingebaut in die Gemini-App und Googles Flow-Tool — aus einem einzigen Standfoto einen kurzen, bewegten Clip mit natürlichem Licht und Bewegung machen. Aus einem flachen Foto deines Croissants wird aufsteigender Dampf und eine langsame Kamerafahrt.
Kurz aufgeräumt, damit du keine Zeit verschwendest: Sora ist Geschichte. OpenAI hat seine Verbraucher-App Sora am 26. April 2026 abgeschaltet. Wenn dir irgendein Tutorial sagt, du sollst Sora nutzen, ist es veraltet. Die lebenden Tools, die für einen kleinen Betrieb zählen, sind Googles Veo und Gemini Omni — Google verlagert die Videoerzeugung gerade in die Gemini-App unter dem Namen Omni, der günstigste echte Einstieg ist ein Google-AI-Abo (mehr zum 4,99-€-Plan Google AI Plus und ob er sich lohnt weiter unten).
Der ehrliche 20-Minuten-Workflow
Der ganze Trick ist der: Du animierst ein Foto von deinem echten Essen. Kein generiertes Gericht. Keine Stock-Schale. Das echte Ding, das du dem Gast hinstellst. Diese eine Regel hält deine Werbung ehrlich, hält dich auf der richtigen Seite des Irreführungsverbots im Wettbewerbsrecht (UWG) — und produziert, kein Zufall, den Clip, der konvertiert.
Schritt für Schritt:
- Fotografier dein echtes Gericht. Handykamera, 1080p, schlichte Fläche, am Fenster. Dieses Foto ist Rohmaterial und Ehrlichkeits-Versicherung zugleich.
- Öffne Gemini oder Google Flow, starte eine Videoerzeugung und häng das Foto als Referenzbild an. Das ist “Bild-zu-Video” — das Gericht bleibt an der Realität verankert, statt erfunden zu werden.
- Schreib zwei kurze Zeilen: eine Aktion, eine Kamerabewegung. Für einen Kaffeeshot heißt das wörtlich: “Aufsteigender Dampf von einem frischen Latte, Schwaden kräuseln sich langsam im warmen Morgenlicht. Langsame Annäherung (push-in), geringe Schärfentiefe, kein Text, keine Hände.” Halt die Bewegung des Motivs und die der Kamera als getrennte, einfache Anweisungen.
- Erzeug zuerst acht Sekunden auf der “Fast”-Einstellung. Das ist ein günstiger Entwurf. Ein zusammenhängender Clip ist je nach Modell ohnehin auf rund 4 bis 8 Sekunden begrenzt (in Gemini Omni praktisch bis etwa 10), also kämpf nicht dagegen. Prüf, ob die Bewegung natürlich aussieht, bevor du für ein hochwertigeres Rendering zahlst.
- Schneid ihn zu, dann ergänz deinen Text in einem normalen Editor wie CapCut oder dem Instagram-/Reels-Editor. Das ist der Schritt, den alle überspringen und nicht sollten: Lass die KI nie deinen Preis, Café-Namen oder die Adresse rendern — sie verkrüppelt Buchstaben zu Unsinn. Tipp den Text selbst, oben drauf.
- Post ihn vertikal (9:16), 1080p, 7–15 Sekunden. Die Hashtags kommen in den ersten Kommentar.
Die Bewegungen, die bei Essen als echt durchgehen, sind die halb-zufälligen, schwer zu fakenden: aufsteigender Dampf, eine langsame Annäherung, ein flüssiger Guss, ein Sauce- oder Honig-Drizzle, ein Lichtwechsel zur goldenen Stunde. Die verstecken die kleinen Unsauberkeiten, die KI noch hat. Setz drauf.
Was das für dich heißt
Wenn du ein Café führst: Dampf ist dein bester Freund. Ein Latte, ein frischer Espresso-Guss, eine Zimtschnecke mit kräuselndem Dampf — die animieren wunderbar und wirken echt, weil Dampf wirklich zufällig ist. Fang da an.
Wenn du ein Restaurant hast: Animier das Aushängeschild, für das du bekannt bist. Eine langsame Annäherung an einen echten Teller Pasta mit leiser, aufsteigender Wärme schlägt jede generierte Szene. Post einen pro Woche, rotier das Gericht, und lass Kunden genau sehen, was sie bekommen.
Wenn du ein lokaler Laden oder eine Boutique bist: Gleiches Drehbuch, anderes Motiv — ein Produkt auf sauberer Fläche mit einer langsamen Drehung oder einem sanften Lichtwischer. Die Idee “ein gutes Foto wird ein scroll-stoppendes Video” funktioniert bei einer Kerze oder einer Tasche genauso wie beim Croissant.
Was KI-Video noch nicht kann
- Es kann keinen Text schreiben. Preise, dein Café-Name, “BIS SPÄT GEÖFFNET” — KI rendert Buchstaben als kruden Unsinn. Füg jedes Wort selbst hinzu, im Editor, danach.
- Es kann Hände und Gesichter nicht gut. Finger verschmelzen, Gesichter werden unheimlich. Halt Menschen aus dem KI-Clip raus — willst du einen Menschen drin, film den Teil echt und schneid ihn rein.
- Es kann dein Logo nicht konstant halten. Dein Tassendesign oder Schild morpht von Frame zu Frame. Füg das Logo als statisches Overlay im Schnitt ein, nicht in der Erzeugung.
- Es läuft sauber nicht länger als rund 8 Sekunden pro Clip. Du willst 20 Sekunden? Setz mehrere Clips im Editor zusammen. Verlang von einer Erzeugung keinen Mini-Film.
- Es kann Fake-Essen nicht ehrlich machen. Das ist der große Punkt. Eine KI-aufpolierte Schale, die mit dem echten Teller nichts zu tun hat, ist kein cleveres Marketing — sie täuscht über die Beschaffenheit deines Produkts, und das ist nach § 5 UWG irreführende Werbung (abmahnfähig), ganz egal ob KI oder Photoshop. Kunden bestrafen es obendrein härter als gar keine Werbung. Animier dein echtes Foto. Generier kein Gericht, das du nicht servierst.
Und ein Punkt, den du dir jetzt schon merken solltest: Ab dem 2. August 2026 greift die Kennzeichnungspflicht nach Art. 50 EU AI Act für KI-generierte oder wesentlich KI-bearbeitete Bild- und Videoinhalte. Heißt für dich konkret: Ein klar erkennbarer Hinweis — “KI-animiert” in der Caption reicht — gehört dann ohnehin dazu. Die gute Nachricht: Das kostet dich nichts, und ehrliche Kennzeichnung kauft sowieso Vertrauen. Mach’s einfach von Anfang an.
Unterm Strich
Das Restaurant, das online zerrissen wurde, ist nicht gescheitert, weil es KI genutzt hat. Es ist gescheitert, weil es KI genutzt hat, um übers Essen zu lügen. Mach das Gegenteil. Mach ein echtes Foto vom Ding, auf das du stolz bist, lass KI acht Sekunden Dampf und eine sanfte Annäherung dazutun, tipp deine eigenen Worte oben drauf, und post es. Zwanzig Minuten, ein paar Cent, und ein Clip, der nach deinem Laden aussieht — weil er es ist.
Willst du das volle Setup — die genauen Prompts, den Kamerabewegungs-Spickzettel und wie du an einem Nachmittag einen Monat Clips vorproduzierst? Unser Kurs “KI für die Gastronomie” führt dich Schritt für Schritt durch, und tiefer in die Technik geht der Kurs KI-Videos erstellen. Und wenn du gerade abwägst, welches KI-Abo du fürs Video überhaupt zahlst, hier die ehrliche Einordnung von Google AI Plus für 4,99 €.
Quellen
- Veo 3.1 und KI-Videoerzeugung in der Gemini-App (Omni) — Google
- Der ultimative Prompting-Guide für Veo 3.1 — Google Cloud
- Was man zur Sora-Abschaltung wissen muss (26. April 2026) — OpenAI Help Center
- Ende des Hypes: OpenAI stellt KI-Videogenerator Sora ein — ComputerBase
- Leitfaden: Kennzeichnung KI-generierter Inhalte (irreführende Werbung nach § 5 UWG) — Wettbewerbszentrale (2026)
- KI-Kennzeichnungspflicht ab 2. August 2026: Art. 50 EU AI Act für Unternehmen — Seybold