Cách đây vài tuần, một đoạn video quán ăn lan truyền khắp mạng xã hội khiến cộng đồng mạng dậy sóng. Từ menu, hình ảnh món ăn đến cả không gian quán đều rõ ràng là do AI dựng lên. Dòng caption kèm theo viết đại loại: “Mọi thứ ở đây đều được AI tạo ra, mình thấy hơi rợn.” Video này nhận về hàng nghìn lượt thích chỉ trong vài giờ, còn phần bình luận thì như một cơn bão: “trông rẻ tiền thế này”, “quảng cáo giả, đồ ăn cũng giả nốt”, thậm chí nhiều người còn nghi ngờ cả độ sạch sẽ của bếp. Một comment đã nói thay nỗi sợ lớn nhất: “Mình không còn dám tin cách quán bạn chế biến món ăn nữa. Tôi muốn được nhìn thấy món đó thực sự trông như thế nào, chứ không phải là cái hình ảnh do một trung tâm dữ liệu tưởng tượng ra.”
Chuyện này đâu chỉ có ở mạng xã hội nước ngoài. Tại Việt Nam, kịch bản tương tự đã diễn ra ngoài đời thực. Báo Thanh Niên từng đưa tin về nhiều quán ăn tại TP.HCM dùng những đoạn clip AI hoành tráng để quảng cáo món, nhưng kết quả là khách đến nơi chỉ thấy thực tế chẳng giống gì so với clip. Nhiều người phàn nàn: “đồ ăn nhìn như trong game chứ không phải ngoài đời”, “nếm thử một lần là ’té ngửa’, lần sau chắc không quay lại nữa.”
Vậy nên, chúng ta cần rõ ngay từ đầu: điều chúng ta sẽ bàn đến ở đây hoàn toàn trái ngược với kiểu “gian dối” kia. Giờ đây, việc làm video AI đã rẻ đến mức chủ quán cà phê có thể tự sản xuất một clip quảng cáo chỉn chu chỉ trong 20 phút, với chi phí tương đương một ly cà phê. Và video ngắn không còn là thứ “có thì tốt, không cũng được”: trong báo cáo F&B 2025–2026 của iPOS.vn, hơn 70% chủ quán được khảo sát cho biết họ đặt ưu tiên hàng đầu cho video ngắn (TikTok, Reels, Shorts) trong chiến lược marketing, và khoảng 30–35% đã thử dùng các công cụ AI để làm ảnh, video hoặc nội dung. Công nghệ này đúng là một món quà. Nhưng nếu bạn làm qua loa—bịa món không có trong menu, chèn chữ sai lệch, hay chỉnh sửa ảnh thật đến mức cốc latte trở nên phát sáng kỳ quặc—thì không những không bán chạy, mà còn khiến khách hàng mất niềm tin vào bạn ngay lập tức. Tin tốt là: cách trung thực nhất để dùng video AI cũng chính là cách hiệu quả nhất. Và bước đầu tiên, bạn không cần công cụ nào xa lạ, mà chỉ cần một tấm ảnh bạn đã có sẵn trong điện thoại.
Những gì đã thay đổi (và cái gì nên bỏ qua)
Cách đây hai năm, muốn có một clip quảng cáo ổn thì phải thuê người, dành nửa ngày quay chụp, và hóa đơn không dưới vài triệu đồng. Còn giờ, AI video của Google—cụ thể là Veo 3.1, tích hợp sẵn trong ứng dụng Gemini—có thể biến một ảnh tĩnh duy nhất thành một đoạn clip ngắn với ánh sáng và chuyển động tự nhiên. Một tấm ảnh phẳng lì của ly cà phê sữa đá có thể hiện ra hơi nước ngưng tụ, máy quay từ từ đẩy lại. Một chiếc croissant thì có làn khói cuộn nhẹ.
Một chút lưu ý nhỏ để bạn khỏi mất thời gian: Sora đã ngừng hoạt động. OpenAI đã tắt ứng dụng Sora dành cho người dùng vào ngày 26 tháng 4 năm 2026. Nếu thấy hướng dẫn nào còn bảo dùng Sora, thì bài đó quá hạn rồi. Thay vào đó, bạn nên biết đến cái tên mới: Google đang tích hợp khả năng tạo video vào Gemini Omni, mô hình mà họ đang phát triển thành động lực chính để tạo và chỉnh sửa video ngay trong ứng dụng Gemini. Với một doanh nghiệp nhỏ tại Việt Nam, lối đi thực tế nhất rất đơn giản: dùng ứng dụng Gemini (chạy Veo 3.1 / Gemini Omni), cái mà đã hỗ trợ prompt tiếng Việt luôn. Điểm vào rẻ nhất để bắt đầu là gói đăng ký Google AI; bạn chỉ cần dán mô tả bằng tiếng Việt vào, AI sẽ tự sinh clip, âm thanh cũng được tạo native nên bạn chẳng cần app riêng cho sound.
Quy trình 20 phút “trung thực”
Bí kíp nằm ở một câu: Bạn sẽ làm cho một tấm ảnh món ăn THẬT của mình chuyển động. Không phải món AI vẽ ra. Không phải ảnh stock. Đúng ngay cái món bạn sẽ bưng ra cho khách. Quy tắc đơn giản này giữ cho quảng cáo của bạn đúng chuẩn, giữ bạn trên “phía an toàn” của pháp luật—cụ thể là Điều 8 Luật Quảng cáo 2012 (Luật số 16/2012/QH13), điều cấm quảng cáo “không đúng sự thật hoặc gây nhầm lẫn” về chất lượng, hình thức hay nguồn gốc sản phẩm—và, không phải ngẫu nhiên, nó cũng chính là thứ tạo ra clip có khả năng chuyển đổi tốt nhất.
Làm từng bước như sau:
- Chụp món ăn thật của bạn. Dùng camera điện thoại, độ phân giải 1080p, đặt trên mặt phẳng đơn giản, gần cửa sổ. Tấm ảnh này vừa là nguyên liệu thô, vừa là “bảo hiểm trung thực” cho bạn.
- Mở ứng dụng Gemini, bắt đầu tạo video và đính kèm tấm ảnh đó làm ảnh tham chiếu. Đây là kỹ thuật image-to-video—món ăn sẽ bám sát thực tế thay vì bị AI bịa ra từ con số 0.
- Viết hai dòng ngắn gọn: một dòng mô tả hành động, một dòng mô tả chuyển động máy. Với shot cà phê, cứ viết thẳng thắn: “Hơi nước bốc lên từ ly cà phê sữa đá vừa pha, giọt sương ngưng tụ chảy xuống thành ly trong ánh sáng ấm áp buổi sáng. Máy quay đẩy chậm lại, độ sâu trường ảnh nông, không chữ, không bàn tay.” Giữ chuyển động của món ăn và chuyển động của máy quay tách rời, đơn giản.
- Tạo 8 giây đầu tiên ở chế độ Fast (Nhanh). Đây là bản nháp giá rẻ. 8 giây cũng là giới hạn sạch sẽ cho một clip mạch lạc, nên đừng cố ép dài hơn. Kiểm tra xem chuyển động tự nhiên chưa rồi mới chi trả cho bản render chất lượng cao hơn.
- Cắt ghép, rồi thêm chữ vào một app chỉnh sửa thông thường như CapCut hoặc trình soạn Reels. Đây là bước mọi người hay bỏ qua nhưng tuyệt đối không nên: đừng bao giờ để AI tự render giá, tên quán, hay địa chỉ của bạn—nó sẽ biến chữ cái thành những ký tự vô nghĩa. Tự gõ chữ của bạn, đặt đè lên trên.
- Đăng dọc (9:16), 1080p, dài 7–15 giây. Đổ hashtag vào comment đầu tiên.
Những chuyển động trông tự nhiên nhất cho đồ ăn là những thứ bán ngẫu nhiên, khó làm giả nhất: hơi nước bốc lên, máy quay đẩy chậm, chất lỏng đổ ra, sốt hoặc sữa đặc rưới xuống, ánh sáng vàng hoàng hôn chuyển dần. Những thứ này che đi điểm yếu nhỏ mà AI vẫn chưa xử lý mượt. Hãy lợi dụng chúng.
Điều này có nghĩa gì với bạn
Nếu bạn chạy quán cà phê: Hơi nước và giọt ngưng tụ là bạn thân nhất. Một ly cà phê sữa đá có giọt sương chảy, một giọt phin nhỏ chậm, hay một ổ bánh mì còn âm ấm—những thứ này hoạt hình cực đẹp và trông rất thật vì chuyển động của chúng vốn ngẫu nhiên. Hãy bắt đầu từ đó.
Nếu bạn sở hữu nhà hàng: Hãy làm cho món “đặc sản” bạn nổi tiếng nhất chuyển động. Một cú đẩy máy chậm rãi vào một tô phở thật với làn khói mỏng manh sẽ “ăn đứt” bất kỳ cảnh nào do AI bịa ra. Đăng một clip mỗi tuần, xoay vòng món, để khách thấy chính xác những gì họ sẽ nhận được.
Nếu bạn là shop nhỏ hay boutique: Cùng công thức, nhưng đổi đối tượng—một sản phẩm đặt trên mặt phẳng sạch sẽ với chuyển động xoay chậm hoặc quét ánh sáng nhẹ. Ý tưởng “một tấm ảnh đẹp thành video lướt dừng mắt” áp dụng cho nến thơm hay chiếc túi xách cũng mượt mà như chiếc croissant.
AI video vẫn chưa làm được gì
- Nó không thể viết chữ. Giá tiền, tên quán của bạn, hay dòng chữ “MỞ CỬA ĐẾN KHUYA”—AI sẽ render chữ thành đống ký tự méo mó. Tự thêm mọi từ vào, trong phần chỉnh sửa, sau khi AI xuất video.
- Nó không xử lý tay hoặc mặt người tốt. Ngón tay hay bị dính vào nhau, mặt người trông kỳ quặc. Hãy giữ con người ra khỏi clip AI—nếu muốn có người, hãy quay cảnh đó thật rồi cắt ghép vào.
- Nó không giữ logo của bạn nhất quán. Thiết kế ly của bạn hoặc biển hiệu sẽ biến dạng từng khung hình. Hãy thêm logo dưới dạng lớp phủ tĩnh (static overlay) khi chỉnh sửa, đừng để AI sinh ra.
- Nó không chạy mượt được quá khoảng 8 giây cho một clip duy nhất. Muốn 20 giây? Hãy nối vài clip trong app chỉnh sửa. Đừng yêu cầu một lần AI sinh ra cả một phim ngắn.
- Nó không thể làm đồ ăn giả trở nên trung thực. Đây là điểm lớn nhất. Một tô đồ ăn được AI “trang điểm” trông khác xa thực tế không phải là marketing khéo—dưới luật quảng cáo Việt Nam, nó là sai lệch, và khách hàng sẽ “phạt” bạn nặng hơn cả việc không có quảng cáo. Hãy làm cho ảnh thật của bạn chuyển động. Đừng sinh ra món bạn không bán. Một chú thích nhỏ “#AIGenerated” chẳng tốn kém gì nhưng lại mua được niềm tin.
Tóm lại
Quán cà phê từng bị “ném đá” mạng không thất bại vì dùng AI. Nó thất bại vì dùng AI để nói dối về đồ ăn. Hãy làm ngược lại. Chụp một tấm ảnh thật của món bạn tự hào nhất, để AI thêm vào 8 giây hơi nước và một cú đẩy máy nhẹ nhàng, tự gõ từ ngữ của bạn đặt lên trên, rồi đăng. 20 phút, vài đồng xu, và một clip trông đúng chất quán của bạn—vì nó chính là quán của bạn.
Muốn setup trọn vẹn—prompt chuẩn xác, bảng tra chuyển động máy quay, và cách batch một tháng clip trong một buổi chiều? Khóa học Hướng dẫn tạo video bằng AI của chúng tôi sẽ dẫn bạn từng bước từ A đến Z cho doanh nghiệp nhỏ. Và nếu muốn nhét kỹ năng này vào kế hoạch lớn hơn cho mạng xã hội của quán, khóa học Tiếp thị số với AI sẽ kết nối mọi thứ lại—trong khi hướng dẫn Sử dụng Gemini giúp bạn làm quen với app chính là thứ tạo ra video ngay từ đầu.
Nguồn tham khảo
- Veo 3.1 — Google DeepMind
- Quảng cáo bằng video AI gây tranh cãi: Các chủ quán ở TP.HCM nói gì? — Thanh Niên
- Nhiều quảng cáo sẽ do AI sản xuất — The Saigon Times
- Google phát triển mô hình tạo video AI mới Gemini Omni — Thanh Niên
- Gemini Advanced ở Việt Nam đã có mô hình Veo tạo video từ văn bản — Tinh tế
- Những điều cần biết về việc ngừng hoạt động của Sora — OpenAI Help Center
- Top 10 công cụ AI tạo video hỗ trợ doanh nghiệp 2026 — Base.vn