Hace unas semanas alguien subió un video recorriendo un restaurante donde las fotos del menú, los platos, todo el ambiente eran obviamente generados con IA. El comentario: “todo en este restaurante está generado con IA y me está dando escalofríos”. Voló en likes, y las respuestas fueron brutales: “anuncios de relleno, comida de relleno”, “se ve barato y flojo”, gente preguntando si la cocina siquiera estaba limpia. Un chef resumió el miedo perfecto: “no puedo confiar en tu cocina. Necesito ver cómo se ve de verdad, no lo que un centro de datos cree que se ve”.
Y que no se te pase: esto no es un drama de gringos en inglés. En el X en español pasa idéntico, y a diario. “En donde vivo hay un restaurante de comida china cuyo cartel, carta e imágenes son IA, me da desconfianza comer ahí”, escribió alguien — y miles asintieron. Otro post sobre comida inventada por IA juntó más de mil “me gusta”. El reflejo es el mismo en todas partes: si la foto es mentira, la cocina también. Por eso conviene tener clarísimo lo que vamos a hacer acá.
Así que dejemos claro qué estamos haciendo acá, porque es justo lo contrario de eso. El video con IA se puso tan barato que el dueño de una cafetería puede hacer un clip promocional real en veinte minutos por lo que cuesta un café. Eso es un regalo genuino. Pero hecho con flojera —fingiendo platos que no sirves, pegándole texto distorsionado, sobreprocesando una foto real hasta que el latte se ve radioactivo— no solo fracasa. Hace que tus clientes confíen menos en ti. La buena noticia es que la forma honesta de usar el video con IA también es la que de verdad funciona. Y arranca con una foto que ya tienes.
Qué cambió (y qué hay que ignorar)
Hace dos años, un video promocional decente significaba un camarógrafo, media jornada de grabación y una factura de cuatro cifras. Hoy, una sola foto fija de tu croissant puede convertirse en un clip corto con movimiento y luz natural — humo subiendo, un acercamiento lento de cámara. Una foto plana de tu plato cobra vida en segundos.
Y acá un par de cosas importantes para que no pierdas el tiempo. Primero, Sora ya no es una opción. OpenAI retiró su generador de video Sora para el público a inicios de 2026 (la prensa especializada lo confirmó: lo dieron de baja citando el costo alto y la poca rentabilidad). Si un tutorial te dice que uses Sora, está viejo; no lo busques. Segundo, del lado de Google la cosa se simplificó: fue metiendo su generación de video dentro de la familia Gemini. Su modelo de video, Veo, ahora vive ahí adentro —en la app de Gemini y en Google Flow— en vez de andar como una herramienta suelta. O sea, el camino vivo y real para un negocio pequeño hoy es Gemini / Veo 3.1, y la entrada más barata es una suscripción de Google AI (más sobre el plan Google AI Plus a 4,99 € y si vale la pena más abajo).
El método honesto de 20 minutos
El truco entero es este: animas una foto de tu comida de verdad. No un plato generado. No un tazón de stock. La cosa real que le vas a poner enfrente al cliente. Y esta distinción no es un capricho mío: en redes, la gente en español ya la tiene clarísima. Lo resumió bien un comentario que se hizo viral — “que las fotos de comida tengan producción es normal, pero si al final se asemejan al producto real; esas imágenes 100% con IA son puro engaño al consumidor”. Retocar una foto real: aceptado. Inventar el plato: te queman. Esa única regla mantiene tu anuncio honesto, te deja del lado correcto de las leyes —en México el artículo 32 de la Ley Federal de Protección al Consumidor exige que la publicidad sea veraz y no induzca a error (y la PROFECO sí sanciona); en España cae como competencia desleal y publicidad engañosa— y, no por casualidad, produce el clip que de verdad convierte.
Paso a paso:
- Toma la foto de tu plato real. Cámara del celular, 1080p, superficie limpia, cerca de una ventana. Esta foto es tu materia prima y tu seguro de honestidad al mismo tiempo.
- Abre Gemini o Google Flow, inicia una generación de video y adjunta la foto como imagen de referencia. Esto es “imagen-a-video” — el plato se queda anclado a la realidad en vez de ser inventado.
- Escribe dos líneas cortas: una de acción, una de movimiento de cámara. Para una toma de café, literalmente: “Humo subiendo de un latte recién hecho, hilos que se enroscan despacio en luz cálida de la mañana. Acercamiento lento, poca profundidad de campo, sin texto, sin manos.” Mantén el movimiento del sujeto y el de la cámara como instrucciones separadas y simples.
- Genera ocho segundos en modo “Fast” primero. Es un borrador barato. Ocho segundos es el tope para un clip coherente de todas formas, así que no pelees contra eso. Revisa que el movimiento se vea natural antes de gastar en una versión de más calidad.
- Recórtalo y después agrega tu texto en un editor normal como CapCut o el editor de Reels. Este es el paso que todos se saltan y no deberían: nunca dejes que la IA escriba tu precio, el nombre de tu café o la dirección — distorsiona las letras hasta convertirlas en garabatos. El texto lo escribes tú, encima.
- Publícalo vertical (9:16), 1080p, de 7 a 15 segundos. Pon tus hashtags en el primer comentario.
Un detalle que vale oro para LatAm: el video de Veo dentro de Gemini genera audio nativo — el chisporroteo del aceite, el sonido del café cayendo. Eso significa que tu clip puede tener sonido propio sin que andes buscando música libre de derechos. Ventaja real para creadores de la región.
Los movimientos que se leen como naturales con la comida son los semi-aleatorios, los difíciles de fingir: humo subiendo, un acercamiento lento, un vertido de café, un hilo de miel o de salsa, un cambio de luz dorada. Esos esconden las pequeñas imperfecciones que a la IA todavía se le escapan. Apóyate en ellos.
Qué significa esto para ti
Si manejas una cafetería: El humo es tu mejor amigo. Un latte, un espresso recién vertido, un rol de canela con humo enroscándose — esos se animan precioso y se ven reales porque el humo es de verdad aleatorio. Empieza por ahí.
Si tienes un restaurante: Anima el plato estrella por el que te conocen. Un acercamiento lento a un plato real de pasta con un leve calorcito subiendo le gana a cualquier escena generada. Sube uno por semana, rota el plato, y deja que los clientes vean exactamente lo que van a recibir.
Si tienes una tienda local o boutique: Mismo método, distinto sujeto — un producto sobre una superficie limpia con un giro lento o un barrido suave de luz. La idea de “una buena foto se convierte en un video que detiene el scroll” funciona para una vela o una bolsa igual de bien que para un croissant.
Lo que el video con IA todavía no puede hacer
- No puede escribir texto. Precios, el nombre de tu café, “ABIERTO HASTA TARDE” — la IA convierte las letras en garabatos. Cada palabra la pones tú, en el editor, después.
- No hace bien manos ni caras. Los dedos se fusionan, las caras quedan raras. Mantén a las personas fuera del clip de IA — si quieres a alguien, graba esa parte de verdad y móntala.
- No mantiene tu logo consistente. El diseño de tu taza o tu letrero va a mutar de cuadro en cuadro. Mete el logo como una capa estática en la edición, no en la generación.
- No puede pasar de unos 8 segundos por clip de forma limpia. ¿Quieres 20 segundos? Une varios clips en tu editor. No le pidas a una sola generación una mini película.
- No puede hacer honesta la comida falsa. Esta es la grande. Un tazón sobre-procesado por IA que no se parece en nada al plato real no es marketing astuto — es publicidad engañosa, y los clientes la castigan más fuerte que la falta de anuncio. Anima tu foto real. No generes un plato que no sirves. Un pequeño “#GeneradoConIA” en el pie no te cuesta nada y te compra confianza. Y ojo, en varios sitios eso ya está dejando de ser opcional: en la Unión Europea (y por tanto en España) la obligación de etiquetar el contenido generado con IA, vídeos incluidos, entra a aplicarse el 2 de agosto de 2026, con marca visible. Mejor que te agarre con el hábito ya puesto.
En resumen
La cafetería que se ganó las burlas en línea no fracasó por usar IA. Fracasó por usar la IA para mentir sobre la comida. Haz lo contrario. Toma una foto real de eso de lo que estás orgulloso, deja que la IA le agregue ocho segundos de humo y un acercamiento suave, escribe tus propias palabras encima, y publícalo. Veinte minutos, unos centavos, y un clip que se ve como tu lugar — porque lo es.
¿Quieres la configuración completa —los prompts exactos, el machote de movimientos de cámara, y cómo armar un mes de clips en una tarde? Nuestro curso de IA para restaurantes te lleva paso a paso para un negocio pequeño, de principio a fin, y si quieres ir más a fondo en el montaje, el curso de IA para edición de video cubre el corte y el texto. Y si estás decidiendo qué plan de IA pagar para tener las herramientas de video, acá va el análisis honesto de Google AI Plus a 4,99 €.
Fuentes
- Veo 3.1 — Google DeepMind
- OpenAI retiró su generador de videos con IA Sora — Universo Abierto (abril 2026)
- Qué saber sobre la descontinuación de Sora — Centro de Ayuda de OpenAI
- Las empresas deberán etiquetar los contenidos generados por IA a partir de agosto de 2026 — ECIJA
- España aprueba su Ley de IA: etiqueta de IA obligatoria y marca de agua en vídeos e imágenes — Xataka
- Código de buenas prácticas para la transparencia de contenidos generados por IA — Comisión Europea
- Artículo 32 de la Ley Federal de Protección al Consumidor: publicidad veraz y no engañosa — PROFECO (México)
- Estrategia de Instagram 2026: Reels, DMs e IA para restaurantes — elcompaprimera