Josh Woodward mở màn phần dành cho lập trình viên: đưa các năng lực mới của Gemini 2.5 Pro/Flash vào công cụ và SDK để xây nhanh ứng dụng web/Android, agent đa phương thức và các tính năng AI trong Chrome/DevTools. Toàn bộ session được tổ chức dạng chuỗi demo ngắn, liên tiếp.
1) Google Labs – Stitch: từ prompt → giao diện → mã
- Sản phẩm: thử nghiệm mới tên Stitch (Labs).
- Chức năng: nhập prompt (“ứng dụng khám phá California”) → sinh thiết kế có thể chỉnh sửa (không phải ảnh tĩnh), hỗ trợ các biến thể (dark mode, màu, bo góc lớn), xuất markup, copy sang IDE hoặc Figma để tiếp tục thiết kế.
- Model: phối hợp Gemini 2.5 Pro/Flash cho khâu phát ý tưởng và remix giao diện.
- Truy cập: Labs.Google/Stitch (thử nghiệm).
2) AI Studio & Live API – xây tác tử thoại đa phương thức
Logan Kilpatrick
- Live API (mới):
- 2.5 Flash Native Audio: thoại bản địa, 24 ngôn ngữ, Proactive audio (bỏ qua tạp âm/giọng nền).
- Quản lý ngữ cảnh session (session context) tốt hơn.
- Function calling và search counting cải tiến.
- URL Context (mới): đưa tối đa 20 URL để mô hình tự lấy ngữ cảnh web, giúp phản hồi có căn cứ & cập nhật.
- AI Studio Code Editor:
- Tích hợp Gemini 2.5 Pro để tạo full stack mẫu (ví dụ game web dùng Gemini + Imagen), tự sửa lỗi trong quá trình sinh mã, hỗ trợ đa vòng lặp.
- MCP:
- Google GenAI SDK nay hỗ trợ MCP gốc, dễ nối vào hệ sinh thái công cụ mở (ví dụ app tích hợp Google Maps qua MCP).
3) Demo agent trên web: (Key Note companion)
Paige Bailey
- Mục tiêu: web app nghe keynote, nhận diện từ khóa (“AI”, “Gemini”), cập nhật UI, điều hướng bản đồ/địa điểm.
- Kỹ thuật:
- Live API sliding context window cho session dài.
- Function calling dạng NON_BLOCKING (mới): thực thi bất đồng bộ để hội thoại không bị chặn khi call tool/MCP.
- Structured outputs: ràng buộc JSON schema để UI nhận dữ liệu chuẩn.
- Triển khai: 1-click Cloud Run trực tiếp từ AI Studio; chạy trên IDE/VS Code sau deploy.

4) Xây app hiệu năng, đa thiết bị trong hệ sinh thái Android
Diana Wong & Florina Muntenescu

- Androidify (mẫu):
- Ảnh selfie → mô tả ảnh bằng Gemini (multimodal) → tạo Android bot qua Imagen 3 (Cloud qua Firebase). Mã mẫu trên GitHub.
- On-device AI:
- Gen AI APIs dùng Gemini Nano (tóm tắt/viết lại/mô tả ảnh) xử lý cục bộ khi cần.
- UI/Thiết kế:
- Material 3 Expressive (Compose): thư viện shape/animation mới (ví dụ nút Camera “cookie shape”).
- Android 16 – Live updates với ProgressStyle cho điều hướng/giao đồ/đi xe.
- Hiệu năng:
- Khuyến nghị R8 + Baseline Profiles (đã cho thấy cải thiện rating thực tế – case Reddit).
- Đa thiết bị:
- Android 16 nới ràng buộc orientation/resizable/aspect-ratio để UI phản hồi tốt mặc định.
- Hợp tác Samsung DeX: desktop windowing nâng cao.
- Compose Adaptive Layouts (pane expansion) – làm một lần cho foldable/tablet/Chromebook.
- Ô tô & XR: app adaptive có thể phân phối xe (đỗ/đang sạc) và Android XR (kính trực quan):
- Headset Samsung Project Moohan (ra tay người dùng cuối 2025).
- XREAL Project Aura (Developer edition) sắp phát hành.
- Android XR SDK DP2: Material XR components, emulator nâng cấp, spatial video cho listing Play.
- Năng suất dev:
- Jetpack Compose: bản ổn định mới (autofill, text autosize, visibility tracking), hiệu năng giảm jank; thêm CameraX Compose, Media3 Compose.
- Compose Navigation viết lại: đơn giản hơn, giữ state, animation/adaptive tốt hơn.
- Android Studio + Gemini:
- Test E2E bằng ngôn ngữ tự nhiên (chọn ảnh “woman with pink dress”, xác nhận hiển thị).
- Agent cập nhật dependencies: phân tích module, build, sửa lỗi tự động, giải thích thay đổi; mục tiêu kết thúc ở trạng thái build thành công.
- Doanh nghiệp: đăng ký Gemini Code Assist để dùng Android Studio for Business (quyền riêng tư/bảo mật/quản trị).
5) Web – CSS mới, DevTools có AI, Gemini Nano in Chrome
Una Kravets & Addy Osmani

- UI bằng CSS gốc (Chrome 135+):
- Carousel: scroll-snap, scroll buttons (pseudo-elements), scroll markers + :target-current; scroll-driven animations.
- Tooltip/hover card: interest invoker API + anchor positioning + popover → UI phức tạp không cần JS cho phần lớn logic.
- Case Pinterest: giảm ~2000 → 200 dòng JS (-90%), tăng 15% tốc độ load pin.
- Baseline trong công cụ:
- Tooltip tương thích ngay trong VS Code, ESLint cảnh báo lệch baseline; sắp có cho IDE dựa VS Code/JetBrains.
- DevTools có AI (Chrome 137):
- Ask AI giải thích và đề xuất fix CSS; Apply to Workspace ghi thẳng mã nguồn.
- Performance panel mới + Ask AI: phân tích layout shift, gợi ý khắc phục (ví dụ web font gây CLS).
- Gemini Nano trong Chrome:
- Công bố 7 AI APIs (nhiều mức độ sẵn sàng), ưu tiên on-device (trường học, chính phủ, doanh nghiệp).
- Multimodal on-device (âm thanh/ảnh) + hybrid với Firebase (“prefer_on_device” nếu có, fallback Cloud).
- Demo: chụp vé bằng webcam → trích khu/ngồi và highlight trong app (AI “usher”).
- Link để đăng ký Chrome built-in AI Early Preview Program: https://developer.chrome.com/docs/ai/join-epp
6) Firebase Studio – từ Figma → mã code → backend → deploy
David East
- Figma → Firebase Studio (qua plugin Builder.io):
- Xuất component-based code (không phải “khối khổng lồ”), chạy ngay trong workspace.
- Prompt Gemini 2.5 Pro tạo product detail page, cập nhật routing, truyền dữ liệu đúng, tự tạo mô tả sản phẩm nếu thiếu.
- Blueprint có Backend (mới):
- Nếu prompt nêu database/auth, Firebase Studio sẽ:
- Thêm mục Backend vào blueprint.
- Provision cấu hình dịch vụ (Auth/DB), sinh mã tích hợp.
- Deploy qua Firebase App Hosting.
- Vẫn có thể mở rộng/đổi stack sau đó.
- Nếu prompt nêu database/auth, Firebase Studio sẽ:
7) Gemma – mở rộng mô hình mở: 3n, MedGemma, SignGemma
Gus Martins
- Gemma 3n (preview):
- Chạy trên thiết bị chỉ ~2GB RAM; kiến trúc họ hàng Gemini Nano, thêm hiểu âm thanh → multimodal.
- Có trên AI Studio, AI Edge; sẽ lên Hugging Face, Ollama, Unsloth…
- MedGemma:
- Bộ model mở đa phương thức y tế (text+image): hỗ trợ tóm tắt hồ sơ, phân tích ảnh chẩn đoán, v.v.
- AI-first Colab (mới):
- Trải nghiệm agentic trong Colab; demo fine-tune bằng Unsloth (nhanh/nhẹ) cho tác vụ “dịch emoji cá nhân”.
- Hệ sinh thái:
- 150M+ lượt tải Gemma, gần 70k biến thể cộng đồng; hỗ trợ 140+ ngôn ngữ.
- SignGemma: dịch ngôn ngữ ký hiệu → văn bản (tốt nhất cho ASL→English hiện tại).
- DolphinGemma:
- LLM đầu tiên cho cá heo, fine-tune từ 40 năm dữ liệu nghiên cứu (Georgia Tech & Wild Dolphin Project); thiết bị CHAT JUNIOR phát âm thanh tổng hợp dưới nước; mục tiêu hỗ trợ phân tích mẫu giao tiếp loài cá heo. Bản chạy trên rig Pixel 9.
8) Kết
Josh Woodward tổng kết: toàn bộ tài nguyên có trên I/O.Google; khuyến khích tham gia cộng đồng Google Developer địa phương. Phần “KC” (keynote companion) chạy live kết lại session, nhấn mạnh các công cụ mới cho dev (AI trong DevTools, Gemini API/MCP, Firebase Studio…).
Kênh Youtube: Google for Developers
Để lại một bình luận
Bạn phải đăng nhập để gửi bình luận.