Google Gemini: Nano Banana – Những tính năng này bạn thử hết chưa!

Giới thiệu

  • Video giới thiệu các ứng dụng “điên rồ” của mô hình chỉnh sửa ảnh mới của Google (tác giả gọi vui là “Nano Banana”).
  • Mục tiêu: liệt kê nhanh ~50 cách dùng để khơi gợi ý tưởng và thấy được độ mạnh của mô hình.
  • Gợi ý tài nguyên: Google Prompting Guide → mục Image editing (mô hình mạnh về chỉnh sửa ảnh, không mạnh về tạo ảnh từ đầu).
  • Công cụ dùng trong demo: Google AI Studio (cũng có trên Gemini, Higsfield, Crea, Freepik, Adobe Firefly…).

Các nhóm tính năng & ví dụ

1) Pha trộn/ghép người

  • Blend 2 người vào cùng ảnh (ví dụ: ảnh bạn + Keanu Reeves → chụp selfie ở gala; mô hình còn vô tình để “nắm tay”).

2) Xoá thành phần không mong muốn

  • Xoá người nền (ảnh bãi biển Hawaii: giữ rùa, xoá khách du lịch).
  • Xoá vật thể (ảnh Colorado: xoá cọc tiêu, biển công trình) theo prompt mẫu từ Google.

3) Thay thế & di dời ngữ cảnh

  • Thay vật thể (điện thoại → quả chuối trong tay).
  • Đổi bối cảnh (đưa người đang cầm chuối vào chuồng khỉ ở sở thú).
  • Đổi góc/camera (yêu cầu nhìn từ bên hông).

4) Chân dung chuyên nghiệp từ ảnh bình thường

  • Nâng cấp headshot: “tạo headshot studio của người này”.
  • Mở rộng thành toàn thân: “tạo ảnh toàn thân chuyên nghiệp” Lưu ý: chất lượng có thể giảm → nên upscale sau đó.

5) Thử trang phục & kiểu tóc

  • Virtual try-on: ảnh bản thân + ảnh bộ đồ → áp trang phục.
  • Thử tóc: ảnh bản thân + ảnh kiểu tóc (hoặc prompt “cho mohawk nhiều màu”). Kết quả bằng text prompt đôi khi tốt hơn so với ghép 2 ảnh.

6) Chỉnh màu & tô màu

  • Đổi màu đồ vật (ghế xanh lá → tím, không ảnh hưởng phần còn lại).
  • Tô màu ảnh đen trắng, sau đó tăng độ rực/hiện đại.

7) Đổi phối cảnh/góc nhìn

  • Cho ảnh gốc + prompt “nhìn từ trên xuống” → ảnh mới cùng bố cục nhưng góc nhìn khác.
  • Ví dụ thêm với cảnh cartoon (giữ phòng/màu/nhân vật nhưng đổi perspective).

8) Giả lập theo thập niên

  • Biến ảnh thành phong cách thập niên (1940s, 50s, 60s, 70s, 80s, 90s): thêm hạt film, đổi trang phục theo thời kỳ. Một số thập niên lẽ ra có màu, nhưng mô hình vẫn ra đen trắng.

9) Đưa bản thân vào “ấn phẩm”

  • Bìa tạp chí
  • Poster phim (vibe Iron Man phần thân trên).
  • Poster truy nã (tự sinh alias & “tội danh” đùa cợt).

10) Biến đổi phong cách thị giác

  • Đổi style bằng text (Studio Ghibli).
  • Chuyển style từ ảnh tham chiếu (ảnh thật + screenshot Ghibli → giữ bố cục, đổi chất liệu).
  • Style GTA V tương tự.
  • Chỉ đổi một phần ảnh (tô bát ramen thành anime 2D, giữ phần khác ảnh thật).

11) Thêm & sửa chữ trong ảnh

  • Thêm text (“Subscribe to Matt Wolf” phía sau người). Hạn chế: xếp lớp chữ phức tạp đôi khi ra không như ý → cân nhắc dùng Photoshop/Canva.
  • Sửa chữ có sẵn (biển quảng cáo → “check out futuretools.io”) → đôi khi rất chuẩn, đôi khi “wonky”.

12) Giữ “đồng nhất nhân vật”

  • Dùng một ảnh tham chiếu nhân vật (alien xanh) → sinh nhiều cảnh (đạp xe, ném rổ, nắm tay bạn gái, đi làm, selfie fan) và giữ gương mặt/đặc trưng nhất quán.

13) Chú thích ngay trên ảnh (annotation-in-image)

  • Đặt chữ trên ảnh (ví dụ với Canva: “woman standing here… plant in the corner…”) + prompt “complete the prompts in the image” → mô hình dựng cảnh theo chú thích.

14) “Nhập nhiều ảnh” vượt giới hạn

  • Gom nhiều ảnh thành 1 ảnh collage (bằng Canva) → upload 1 file và prompt “tạo ảnh bàn làm việc chứa tất cả item này, sắp gọn”.
  • Kết quả lấy đủ từng món trong collage (drone, loa, radio cũ, thẻ SD…).

15) “Vẽ que” định tư thế (stick-figure)

  • Cung cấp 2 ảnh nhân vật + phác stick-figure động tác → mô hình dựng cảnh đúng nhân vật & động tác (vd. đá bay).

16) Gắn thương hiệu & mockup

  • Áo thun với logo, đơn giản.
  • Chai nước hoa tên “Essence of Future” với logo → đẹp hơn, “nâng cấp”.
  • Tạo cảnh người mẫu Instagram cầm chai (dựa trên ảnh chai vừa tạo).
  • Đưa chai ra bãi biển.
  • Thay logo trong ảnh có sẵn (biển sau lưng Sundar: Google ↔ OpenAI/Microsoft/xAI).

17) Thiết kế nhanh

  • Name card đen + logo + tên/URL + thêm chi tiết trang trí.
  • Mockup landing page (tech/AI, dùng logo) → lấy ý tưởng bố cục & màu (chưa hoàn hảo).
  • Banner ad (Essence of Future) với CTA rõ ràng.
  • Thumbnail YouTube (clickbait, gương mặt ngạc nhiên) → đủ dùng để khởi đầu.

18) Thiết kế cảnh quan & nội thất

  • Landscape: tải ảnh sân vườn/pool thật → prompt “đẹp lên” → ý tưởng đưa cho designer.
  • Interior: khoanh vùng tường → “dán wallpaper tại phần này” → nhận nhiều phương án.

19) Gắn thông tin AR/POI & góc nhìn giả lập

  • Annotate POI từ ảnh thực tế (“bạn là engine AR, highlight & chú thích địa danh”).
  • “Mũi tên đỏ thấy gì?”: sinh ảnh từ vị trí/điểm nhìn giả lập trong khung cảnh (khá đúng, không hoàn toàn chính xác).

20) Ảnh đẳng trắc (isometric)

  • Chuyển ảnh kiến trúc/địa danh thành isometric ban ngày (ví dụ đền, Petco Park).
  • Kết quả sát bố cục tổng thể.

21) Trang tô màu & “hiện thực hoá” tranh trẻ em

  • Convert ảnh thành line art đen-trắng để tô màu.
  • Tranh trẻ em → ảnh thực (đôi khi ra chất sơn dầu/phấn; chỉnh prompt để sát ảnh thật hơn).

22) Hậu trường & “tách lớp”

  • Behind-the-scenes cho cảnh Marvel (giữ pose, thêm đèn/green screen/camera).
  • Deconstructed (ví dụ Apple Vision Pro “bóc tách” — mang tính phỏng đoán, không đúng cấu tạo thật).

23) “Nano bananas” cho vui

  • Tạo nano banana, chữ “strawberry” bằng… nano banana.

Dùng ảnh tạo ra để làm tiếp ở công cụ khác

A) 3D từ ảnh isometric

  • Copilot 3D (Microsoft): chuyển ảnh isometric → 3D (mất chi tiết).
  • Meshy.ai: kết quả tốt hơn, nhưng mô hình phức tạp (như Petco Park) vẫn chưa tinh tế.
  • Với mẫu đơn giản, có thể tạo 3D rồi in 3D.

B) Tạo video từ ảnh (Kling AI)

Yêu cầu:

Ảnh vẽ tay cảnh thành phố → video có chuyển động.

Trình tự:

  • Dùng Gemini yêu cầu thêm màu sắc, và biến nét vẽ thành ảnh thực
  • Dùng King AI, yêu cầu các phương tiện, người trong ảnh di duyển

Kết quả:

C) Cách làm intro video (RunwayML – Act Two)

  1. Quay video thật nói phần intro.
  2. Chụp frame tĩnh (screengrab).
  3. Dùng Nano Banana:
    • Đổi nền → rừng xanh (giữ người).
    • Đổi người → phong cách Rick & Morty; rồi lai người-khỉ (giữ nền).
  4. Vào RunwayML → Generate Video → Act Two:
    • Driving performance = video thật (giọng/khớp miệng).
    • Image = ảnh đã chỉnh (rừng / Rick & Morty / khỉ).
  5. Ghép các video đầu ra → thành intro.

Ghi chú hạn chế & mẹo

  • Tạo chữ phức tạp/layering: chưa ổn định → cân nhắc Photoshop/Canva.
  • Ảnh toàn thân từ headshot: có thể mềm/giảm chi tiếtupscale sau.
  • Deconstructed/POV tái tạo: thiên về ước đoán, đừng dùng cho thông tin kỹ thuật thực.
  • 3D từ ảnh: mẫu phức tạp dễ mất chi tiết; ưu tiên đơn giản.

Kết

  • Nano Banana rất mạnh cho chỉnh sửa ảnhworkflow đa công cụ (AI Studio → Cling/Meshy/Runway).
  • Tác giả nhấn mạnh: video không được Google tài trợ; chỉ vì đam mê dùng nhiều.
  • Lời kêu gọi: chia sẻ thêm ý tưởng/cách dùng khác; theo dõi Future Tools (site/newsletter, mạng xã hội).

Danh mục nhanh (cheat sheet prompt)

  • Xoá người/vật: “Remove all people in the background.” / “Remove the traffic cone and sign.”
  • Thay vật thể: “Replace the phone with a banana.”
  • Đổi bối cảnh: “Put this person holding a banana in a monkey enclosure at the zoo.”
  • Đổi góc: “Change the camera angle to side view of this person.”
  • Headshot: “Make a professional studio-quality headshot of this person.”
  • Toàn thân: “Create a full-body professional photo of this person.”
  • Thử đồ tóc: “Combine person (img1) with outfit/hairstyle (img2).”
  • Đổi màu: “Change the green chair in the foreground to purple.”
  • Tô màu: “Colorize this image.” → “Make colors more vibrant and modern.”
  • Đổi perspective: “View from above looking down.”
  • Theo thập niên: “Make it look like taken in the 1940s; change outfit accordingly.”
  • Bìa tạp chí/poster: “Put this person on the cover of People magazine …” / “Make a movie poster of …”
  • Chuyển style từ ảnh: “Transform photo into the artistic style of image2; preserve composition.”
  • Chỉ đổi một phần: “Turn the ramen bowl into 2D hand-drawn anime; keep the rest unchanged.”
  • Chữ trong ảnh: “Change billboard text ‘X’ to ‘Y’.” / “Add ‘Subscribe…’ behind the person.”
  • Collage workaround: “Create an image of a desk containing all items in this collage, neatly organized.”
  • AR/POI: “You are a location-based AR generator; highlight the POI and annotate relevant info.”
  • Isometric: “Make image daytime and isometric, [object] only.”
  • Coloring page: “Convert this image into a black-and-white outline for a coloring book.”
  • Tranh trẻ em → thật: “Create a real-world photo of a house based on the uploaded drawing.”
  • Behind-the-scenes: “Create the BTS view of shooting this movie scene.”
  • Deconstructed: “Create a deconstructed version of this device.”

Để lại một bình luận