Tóm tắt sự kiện Google I/O ’25

Mở đầu sự kiện

Sự kiện Google I/O 2025 diễn ra tại Shoreline Amphitheatre (California, Mỹ) với phần mở màn bằng đoạn video ngắn giới thiệu tinh thần “Gemini Era”. CEO Sundar Pichai bước lên sân khấu trong tiếng vỗ tay của hàng nghìn người tham dự và hàng triệu khán giả theo dõi trực tuyến.


Phần trình bày của Sundar Pichai: “Gemini Era”

Sundar khẳng định năm qua là giai đoạn tăng tốc lớn nhất của Google về AI, với hơn 20 sản phẩm AI lớn được phát hành kể từ I/O 2024.

  • Gemini 2.5 Pro hiện dẫn đầu bảng LMArena ở mọi hạng mục, tăng hơn 300 Elo so với bản Gemini Pro đầu tiên.
  • Gemini 2.5 Pro cho lập trình đứng đầu WebDev Arena, vượt 140 Elo so với bản cũ, trở thành model phát triển nhanh nhất trên các nền tảng như Cursor.
  • Theo ông, Gemini hiện xử lý 480 nghìn tỷ token mỗi tháng, tăng 50 lần chỉ sau một năm.
  • Gemini App đạt 400 triệu người dùng hàng tháng, trong khi hơn 7 triệu nhà phát triển đã sử dụng Gemini API qua Google AI StudioVertex AI.

Hạ tầng AI cũng được nâng cấp mạnh mẽ với TPU thế hệ 7 – Ironwood, đạt 42,5 exaFLOPS mỗi pod và hiệu năng cao hơn 10 lần thế hệ trước, sẽ mở cho khách hàng Google Cloud cuối năm nay.


Dự án & sản phẩm được công bố

  1. Google Beam (tiếp nối Starline)
    • Nền tảng gọi video 3D đầu tiên sử dụng AI để hợp nhất sáu luồng camera thành hình ảnh người thật ở không gian 3D.
    • Hợp tác với HP để thương mại hóa trong năm nay.
  2. Google Meet – Dịch song ngữ thời gian thực
    • Tính năng dịch trực tiếp giọng nói Anh–Tây Ban Nha đã khả dụng cho thuê bao trả phí, thêm nhiều ngôn ngữ trong thời gian tới.
  3. Gemini Live (từ dự án Astra)
    • Cho phép tương tác qua camera và chia sẻ màn hình.
    • Phát hành cho AndroidiOS ngay trong ngày sự kiện.
  4. Project Mariner – Agent & Computer-use
    • Có thể thực hiện nhiều tác vụ song song (tối đa 10).
    • Tính năng “Teach & repeat” cho phép người dùng hướng dẫn 1 lần, AI tự động thực hiện tương tự về sau.
    • Tích hợp trong Gemini API cho đối tác như UiPath, Automation Anywhere.
  5. Agent Mode trong Gemini App
    • Trợ lý AI tự động tìm và lọc thông tin, ví dụ tìm nhà thuê hoặc đặt lịch xem căn hộ qua MCP (Model Context Protocol).
    • Phiên bản thử nghiệm sẽ ra mắt người dùng trả phí trong mùa hè.
  6. Personal Context
    • AI có thể dùng dữ liệu Gmail, Docs, Drive… (khi người dùng cho phép) để tạo phản hồi cá nhân hóa, ví dụ “Smart Reply” mô phỏng phong cách viết của chính người dùng.

DeepMind & Gemini cho nhà phát triển

Demis Hassabis, CEO của Google DeepMind, công bố:

  • Gemini 2.5 Pro là model nền tảng thông minh nhất hiện nay, dẫn đầu trong các bài kiểm thử về ngôn ngữ, lập trình và học tập.
  • Gemini 2.5 Flash – phiên bản nhẹ hơn, hiệu quả hơn – sẽ ra mắt đầu tháng 6.
  • Gemini Diffusion, model mới dùng kỹ thuật “text diffusion”, giúp tạo văn bản và mã nhanh gấp 5 lần so với Flash-Lite.
  • Jules, agent tự động cho lập trình, hiện mở beta công khai, có thể cập nhật mã trong các kho lớn chỉ trong vài phút.
  • Tính năng “Thinking Budget” giúp người dùng điều chỉnh chi phí và thời gian xử lý theo nhu cầu (hiệu năng hoặc tốc độ).

Search – AI Mode & AI Overviews

Sundar PichaiLiz Reid (Trưởng nhóm Tìm kiếm) công bố:

  • AI Overviews hiện phục vụ 1,5 tỷ người/tháng, mở rộng ra hơn 200 quốc gia.
  • AI Mode – giao diện tìm kiếm AI toàn diện – chính thức mở cho người dùng Mỹ từ hôm nay.
    • Hệ thống Query Fanout tự động tách và thực hiện hàng trăm truy vấn phụ để tạo câu trả lời chi tiết.
    • Sắp có thêm Deep Search (báo cáo chuyên sâu) và Personal Context (gợi ý theo dữ liệu Gmail, lịch, tìm kiếm cũ).
  • Tính năng mới:
    • Data Visualization cho thể thao và tài chính (ra mắt mùa hè).
    • Agentic Search: đặt vé, nhà hàng, dịch vụ trực tiếp từ kết quả tìm kiếm.
    • Search Live: dùng camera để hỏi-đáp trực tiếp.
    • Shopping Try-on & Agentic Checkout: thử đồ ảo từ ảnh cá nhân, theo dõi giá và tự động thanh toán qua Google Pay.

Gemini App & Sản phẩm sáng tạo

Josh Woodward (Giám đốc sản phẩm Gemini) công bố loạt cập nhật:

  • Gemini Live hỗ trợ 45 ngôn ngữ, 150 quốc gia, miễn phí trên Android và iOS.
  • Deep Research cho phép tải tài liệu cá nhân để AI tổng hợp.
  • Canvas: chuyển báo cáo, tài liệu sang infographic, web hoặc podcast chỉ với 1 cú nhấp.
  • Gemini trong Chrome: trợ lý AI hiểu ngữ cảnh trang web.
  • Imagen 4: model tạo ảnh mới, chi tiết hơn, hiển thị văn bản chuẩn hơn.
  • Veo 3: model tạo video có âm thanh gốc (Native Audio), hiện khả dụng ngay.

Sáng tạo & truyền thông

Jason Baldridge (Google Research) công bố:

  • Lyria 2: model âm nhạc mới, hỗ trợ sáng tác chuyên nghiệp.
  • SynthID: watermark chống giả mạo được áp dụng hơn 10 tỷ nội dung, nay hỗ trợ cả video và âm thanh.
  • Hợp tác với đạo diễn Darren AronofskyEliza McNitt trong phim ngắn “Ancestra” sử dụng AI video Veo.
  • Ra mắt Flow – công cụ dựng phim AI kết hợp Veo, Imagen, Gemini – cho phép tạo cảnh quay, nhân vật, chỉ đạo camera trực tiếp bằng mô tả văn bản.

Android XR – Hệ sinh thái mở rộng

Shahram Izadi (Phó Chủ tịch Android) giới thiệu:

  • Android XR – nền tảng thực tế mở đầu tiên cho kỷ nguyên Gemini, hợp tác SamsungQualcomm.
  • Headset Project Moohan sẽ ra mắt cuối năm 2025, cho phép xem phim, họp và khám phá 3D cùng Gemini.
  • Kính Android XR có camera, micro, màn hình trong tròng, hỗ trợ dịch hội thoại thời gian thực, chỉ đường AR, và nhận diện ngữ cảnh.
  • Hai thương hiệu Gentle MonsterWarby Parker là đối tác đầu tiên phát triển kính chạy Android XR.

Kết thúc & Dự án nhân đạo

Sundar Pichai kết thúc với hai dự án tiêu biểu cho ứng dụng AI xã hội:

  • FireSat – chòm vệ tinh AI phát hiện cháy rừng, độ chính xác đến 25 m², cập nhật hình ảnh 20 phút/lần (so với 12 giờ hiện nay).
  • Wing + Walmart + Red Cross – dự án giao hàng cứu trợ bằng drone trong thiên tai.

Ông nhấn mạnh: “AI đang chuyển từ nghiên cứu sang thực tế, và nhiệm vụ của chúng ta là bảo đảm lợi ích ấy đến được với tất cả mọi người.”

Để lại một bình luận