Các Phát triển về AI, Security, Web và Hơn thế nữa
Tác giả: Mike Loukides
Ngày: tháng 9, 2025
Dù muốn hay không, AI đã chiếm lĩnh danh sách này một cách triệt để đến mức bản thân AI giờ đây chỉ là một chuỗi các thông báo về các mô hình mới hoặc được nâng cấp. Nhưng vẫn còn những điểm thú vị khác. Có phải chỉ là sự trùng hợp (có thể liên quan đến BlackHat) mà rất nhiều điều đã xảy ra trong lĩnh vực security vào tháng trước? Chúng ta vẫn đang chứng kiến các ngôn ngữ lập trình—thậm chí là một số ngôn ngữ lập trình mới để viết AI prompts! Nếu bạn quan tâm đến retrocomputing, chiếc Commodore 64 được nhiều người yêu thích đã trở lại—với chip âm thanh nâng cấp, bộ xử lý mới, nhiều RAM hơn đáng kể và tất cả các port cũ của bạn. Các thiết bị ngoại vi Heirloom vẫn sẽ hoạt động.
Artificial Intelligence
OpenAI đã phát hành Realtime APIs. Mô hình này hỗ trợ các máy chủ MCP, các cuộc gọi điện thoại sử dụng giao thức SIP và đầu vào hình ảnh (image inputs). Bản phát hành bao gồm gpt-realtime, một mô hình speech-to-speech tiên tiến.
ChatGPT hiện hỗ trợ project-only memory. Project memory, có thể sử dụng các cuộc trò chuyện trước đó để cung cấp thêm context, có thể được giới hạn cho một dự án cụ thể. Project-only memory cung cấp nhiều quyền kiểm soát hơn đối với context và ngăn context của dự án này làm ô nhiễm dự án khác.
FairSense là một framework để điều tra xem các hệ thống AI có công bằng hay không ngay từ giai đoạn đầu. FairSense chạy các mô phỏng dài hạn để phát hiện xem một hệ thống có trở nên không công bằng khi nó phát triển theo thời gian hay không.
Agents4Science là một hội nghị học thuật mới, nơi tất cả các bài nộp sẽ được nghiên cứu, viết, đánh giá và trình bày chủ yếu bởi AI (sử dụng text-to-speech để thuyết trình).
Cheat sheet của Drew Breunig về sự kết hợp các job titles (chức danh công việc) AI là một tài liệu kinh điển.
Command A Reasoning của Cohere là một mô hình reasoning mạnh mẽ khác, một phần là open. Nó có sẵn trên Hugging Face. Nó tuyên bố vượt trội hơn gpt-oss-120b và DeepSeek R1-0528.
DeepSeek đã phát hành DeepSeekV3.1. Đây là một mô hình hybrid hỗ trợ cả mục đích sử dụng reasoning và không reasoning. Nó cũng nhanh hơn R1 và đã được thiết kế cho các tác vụ agentic. Nó sử dụng reasoning tokens tiết kiệm hơn và việc đào tạo nó ít tốn kém hơn nhiều so với GPT-5.
Anthropic đã thêm khả năng chấm dứt các cuộc trò chuyện (terminate chats) vào Claude Opus. Các cuộc trò chuyện có thể bị chấm dứt nếu người dùng cố chấp đưa ra các yêu cầu có hại (harmful requests). Các cuộc trò chuyện bị chấm dứt không thể được tiếp tục, mặc dù người dùng có thể bắt đầu một cuộc trò chuyện mới. Tính năng này hiện đang ở dạng thử nghiệm (experimental).
Google đã phát hành mô hình nhỏ nhất của mình cho đến nay: Gemma 3 270M. Mô hình này được thiết kế để fine-tuning và để triển khai trên các phần cứng nhỏ, hạn chế. Dưới đây là một bedtime story generator (công cụ tạo truyện kể trước khi ngủ) chạy trong trình duyệt, được xây dựng bằng Gemma 3 270M.
ChatGPT đã thêm GMail, Google Calendar và Google Contacts vào nhóm các connector của mình, giúp tích hợp ChatGPT với các ứng dụng khác. Thông tin này sẽ được sử dụng để cung cấp thêm context—và có lẽ sẽ được sử dụng cho việc training hoặc discovery trong các vụ kiện đang diễn ra. May mắn thay, (ở thời điểm này) đây là tính năng opt-in (người dùng tự chọn tham gia).
Anthropic đã nâng cấp Claude Sonnet 4 với cửa sổ context window 1M token. Cửa sổ context window lớn hơn này chỉ có sẵn thông qua API.
OpenAI phát hành GPT-5. Bài review của Simon Willison là xuất sắc. Nó không giống như một bước đột phá (breakthrough), nhưng nó lại tốt hơn một cách lặng lẽ trong việc mang lại kết quả tốt. Nó được cho là ít bị hallucination và đưa ra câu trả lời sai hơn. Một điểm đặc biệt là với ChatGPT, GPT-5 sẽ xác định mô hình nào nên phản hồi lại prompt của bạn.
Anthropic đang nghiên cứu persona vectors như một phương tiện để đào tạo một language model hành xử đúng đắn. Việc hướng mô hình đến hành vi không phù hợp trong quá trình training có thể là một loại “tiêm chủng” chống lại hành vi đó khi mô hình được triển khai, mà không ảnh hưởng đến các khía cạnh khác trong hành vi của mô hình.
Darwin Gödel Machine là một agent có thể đọc và sửa đổi mã của chính nó để cải thiện hiệu suất thực hiện nhiệm vụ. Nó có thể thêm tools, tổ chức lại workflows và đánh giá liệu những thay đổi này có cải thiện hiệu suất của nó hay không.
Grok lại tiếp tục: tạo ra deepfakes khỏa thân của Taylor Swift mà không cần được prompt làm như vậy. Tôi chắc chắn chúng ta sẽ được cho biết rằng đây là kết quả của một sự sửa đổi trái phép đối với system prompt. Trong AI, một số điều là có thể dự đoán được.
Anthropic đã phát hành Claude Opus 4.1, một bản nâng cấp cho mô hình chủ lực của họ. Chúng tôi kỳ vọng đây sẽ là “tiêu chuẩn vàng” (gold standard) cho generative coding.
OpenAI đã phát hành hai mô hình open-weight, lần đầu tiên kể từ GPT-2: gpt-oss-120b và gpt-oss-20b. Chúng là các mô hình reasoning được thiết kế để sử dụng trong các ứng dụng agentic. Hiệu suất được tuyên bố là tương tự như o3 và o4-mini của OpenAI.
OpenAI cũng đã phát hành một “response format” có tên là Harmony. Nó không hẳn là một giao thức (protocol), nhưng nó là một tiêu chuẩn chỉ định định dạng của các cuộc trò chuyện bằng cách xác định các roles (như system, user, v.v.) và các channels (final, analysis, commentary) cho đầu ra của mô hình.
Liệu AIs có thể phát triển cảm giác tội lỗi (evolve guilt) không? Cảm giác tội lỗi được thể hiện bằng ngôn ngữ con người; nó nằm trong dữ liệu training. AI đã xóa một cơ sở dữ liệu sản xuất (production database) vì nó “hoảng loạn” chắc chắn đã bày tỏ cảm giác tội lỗi. Việc liệu sự bày tỏ cảm giác tội lỗi của một AI có ý nghĩa gì không lại là một câu hỏi khác.
Claude Code Router là một tool để định tuyến các yêu cầu Claude Code đến các mô hình khác nhau. Bạn có thể chọn các mô hình khác nhau cho các loại yêu cầu khác nhau.
Qwen đã phát hành một phiên bản thinking của mô hình chủ lực của họ, được gọi là Qwen3-235B-A22B-Thinking-2507. Thinking không thể được bật hoặc tắt. Mô hình được đào tạo bằng một thuật toán reinforcement learning mới gọi là Group Sequence Policy Optimization. Nó đốt rất nhiều tokens, và nó không giỏi về pelicans cho lắm.
ChatGPT đang phát hành các “personalities” (tính cách) kiểm soát cách nó xây dựng các phản hồi của mình. Người dùng có thể chọn personality mà họ muốn phản hồi: robot, cynic, listener, sage, và có lẽ sẽ còn nhiều hơn nữa.
DeepMind đã tạo ra Aeneas, một mô hình mới được thiết kế để giúp các học giả hiểu các mảnh vỡ cổ đại. Trong văn bản cổ đại, thường thiếu sót những phần lớn. Liệu AI có thể giúp đặt những mảnh vỡ này vào các contexts nơi chúng có thể được hiểu hay không? Hiện tại, chỉ áp dụng cho tiếng Latinh (Latin) mà thôi.
More from the Learning Platform
- Hands-On Large Language Models (sách)
- Build a Large Language Model (From Scratch) (sách)
Security
US Cybersecurity and Infrastructure Security Agency (CISA) đã cảnh báo rằng một code execution vulnerability nghiêm trọng trong Git hiện đang bị khai thác trong thực tế (in the wild).
Liệu có thể xây dựng một trình duyệt agentic an toàn khỏi prompt injection không? Có lẽ là không. Việc tách biệt các hướng dẫn của người dùng khỏi nội dung website là không thể. Nếu một trình duyệt không thể nhận chỉ đạo từ nội dung của một trang web, thì làm sao nó có thể hoạt động như một agent?
Giải pháp cho Phần 4 của Kryptos, tác phẩm điêu khắc mật mã kéo dài hàng thập kỷ của CIA, đang được rao bán! Jim Sanborn, người tạo ra Kryptos, đang đấu giá giải pháp. Ông hy vọng rằng người chiến thắng sẽ giữ bí mật và tiếp quản việc xác minh các tuyên bố đã giải được câu đố của mọi người.
Nhớ về XZ, cuộc tấn công supply-chain cấp quyền truy cập backdoor thông qua một thư viện nén bị trojaned chứ? Nó vẫn chưa biến mất. Mặc dù các thư viện bị ảnh hưởng đã nhanh chóng được vá, nhưng nó vẫn đang hoạt động và lan truyền, thông qua các Docker images được xây dựng bằng các thư viện chưa được vá. Một số món quà cứ mãi tiếp diễn.
Trong tháng 8, Embrace the Red đã xuất bản The Month of AI Bugs, một bài đăng hàng ngày về các lỗ hổng AI (chủ yếu là các hình thức khác nhau của prompt injection). Loạt bài này là tài liệu đọc thiết yếu cho các nhà phát triển AI và cho các chuyên gia security.
NIST đã hoàn thiện một standard cho lightweight cryptography. Lightweight cryptography là một hệ thống mật mã được thiết kế để sử dụng bởi các thiết bị nhỏ. Nó hữu ích cho cả việc mã hóa dữ liệu nhạy cảm và authentication (xác thực).
Dark Patterns Tip Line là một trang web để báo cáo dark patterns: các tính năng thiết kế trong websites và ứng dụng được thiết kế để lừa chúng ta hành động ngược lại lợi ích của chính mình.
OpenSSH hỗ trợ post-quantum key agreement, và trong các phiên bản 10.1 trở lên, sẽ cảnh báo người dùng khi họ chọn một non-post-quantum key agreement scheme.
Các tệp SVG có thể mang theo một malware payload; các SVG khiêu dâm bao gồm JavaScript payloads tự động nhấp vào “thích”. Đó là một cuộc tấn công đơn giản với ít hậu quả, nhưng nhiều điều hơn nữa là có thể, bao gồm cross-site scripting, denial of service và các khai thác khác.
AI agent của Google để khám phá các lỗ hổng security, Big Sleep, đã tìm thấy 20 lỗ hổng trong phần mềm phổ biến. DeepMind đã phát hiện và tái tạo các lỗ hổng, sau đó được các chuyên gia security con người xác minh và báo cáo. Chi tiết sẽ không được cung cấp cho đến khi các lỗ hổng đã được sửa.
US CISA (Cybersecurity and Infrastructure Security Agency) đã open-sourced Thorium, một nền tảng để phân tích malware và forensic.
Prompt injection, một lần nữa: Một cuộc tấn công prompt injection mới nhúng instructions (hướng dẫn) vào ngôn ngữ có vẻ là các thông báo bản quyền (copyright notices) và các legal fine print (điều khoản pháp lý nhỏ) khác. Để tránh kiện tụng, nhiều mô hình được cấu hình để ưu tiên các legal instructions.
Ánh sáng có thể được watermarked (đóng dấu); điều này có thể hữu ích như một kỹ thuật để phát hiện video giả mạo hoặc bị thao túng.
Các dịch vụ vCISO (Virtual CISO) đang phát triển mạnh, đặc biệt là trong các doanh nghiệp nhỏ và vừa không đủ khả năng thuê một nhóm security đầy đủ. Việc sử dụng AI đang cắt giảm khối lượng công việc vCISO. Nhưng ai sẽ chịu trách nhiệm khi có sự cố?
Một phishing attack chống lại người dùng PyPI hướng họ đến một trang PyPI giả mạo yêu cầu họ xác minh login credentials (thông tin đăng nhập). Credentials bị đánh cắp có thể được sử dụng để cấy malware vào kho lưu trữ PyPI chính hãng. Người dùng của add-on repository của Mozilla cũng đã trở thành mục tiêu của các cuộc tấn công phishing.
Một nhóm ransomware mới tên là Chaos dường như là sự đổi tên (rebranding) của nhóm BlackSuit, vốn đã bị đánh sập gần đây. Bản thân BlackSuit là sự đổi tên của nhóm Royal, nhóm này lại là hậu duệ của nhóm Conti. Cuộc chơi “đập chuột chũi” (Whack-a-mole) vẫn tiếp diễn.
Dự án OSS Rebuild của Google là một bước tiến quan trọng trong supply chain security. Rebuild cung cấp các build definitions cùng với metadata có thể xác nhận các dự án đã được xây dựng đúng cách. OSS Rebuild hiện hỗ trợ các ecosystems NPM, PyPl và Crates.
JavaScript package “is”, thực hiện một số kiểm tra kiểu đơn giản (simple type checking), đã bị nhiễm malware. Supply chain security là một vấn đề lớn—hãy cẩn thận với những gì bạn cài đặt!
More from the Learning Platform
- Security Superstream: Secure Code in the Age of AI (hội nghị trực tuyến trực tiếp)
- AI Security and Responsible AI Practices (video)
Programming
Claude Code PM là một hệ thống quản lý workflow để programming với Claude. Nó quản lý PRDs, GitHub và việc thực thi song song các coding agents. Nó tuyên bố tạo điều kiện hợp tác giữa nhiều Claude instances làm việc trên cùng một dự án.
Rust ngày càng được sử dụng để implement performance-critical extensions cho Python, dần dần thay thế C. Polars, Pydantic và FastAPI là ba thư viện dựa vào Rust.
Prompt Orchestration Markup Language (POML) của Microsoft là một ngôn ngữ markup giống HTML để viết prompts. Sau đó nó được compiled thành prompt thực tế. POML giỏi về templating và có các tags cho dữ liệu dạng tabular và document. Đây có phải là một bước tiến? Bạn hãy tự đánh giá.
Claudia là một “elegant desktop companion” (người bạn đồng hành máy tính để bàn trang nhã) cho Claude Code; nó biến Claude Code dựa trên terminal thành một cái gì đó giống IDE hơn, mặc dù có vẻ tập trung nhiều hơn vào workflow hơn là coding.
LangExtract của Google là một thư viện Python đơn giản nhưng mạnh mẽ để trích xuất văn bản từ các tài liệu. Nó dựa vào các ví dụ (examples), thay vì regular expressions hoặc các hacks khác, và hiển thị ngữ cảnh (context) chính xác nơi các phần trích xuất xảy ra. LangExtract là open source.
Microsoft dường như đang tích hợp GitHub vào đội ngũ AI của mình thay vì điều hành nó như một tổ chức độc lập. Điều này có ý nghĩa gì đối với người dùng GitHub vẫn chưa rõ ràng.
Cursor hiện có một command-line interface, gần như chắc chắn là một phản ứng muộn màng trước thành công của Claude Code CLI và Gemini CLI.
Latency (độ trễ) là một vấn đề đối với enterprise AI. Và nguyên nhân gốc rễ của latency trong các ứng dụng AI thường là database.
Commodore 64 đã trở lại. Với số lượng RAM nhiều hơn vài bậc độ lớn. Và tất cả các ports gốc, cộng thêm HDMI.
Google đã thông báo Gemini CLI GitHub Actions, một bổ sung cho agentic coder của họ cho phép nó hoạt động trực tiếp với các kho lưu trữ GitHub.
JetBrains đang phát triển một ngôn ngữ lập trình mới để sử dụng khi programming với LLMs. Ngôn ngữ đó có thể là một dialect (tiếng địa phương/phương ngữ) của tiếng Anh. (Formal informal languages, có ai muốn không?)
Pony là một ngôn ngữ lập trình mới có type-safe, memory-safe, exception-safe, race-safe và deadlock-safe. Bạn có thể thử nó trong một playground dựa trên trình duyệt.
More from the Learning Platform
- Beyond Vibe Coding (sách)
- Coding with AI: The End of Software Development as We Know It (hội nghị)
Web
AT Protocol là cốt lõi của Bluesky. Dưới đây là một tutorial; hãy sử dụng nó để xây dựng các dịch vụ Bluesky của riêng bạn, từ đó làm cho Bluesky thực sự federate (liên kết).
Social media (mạng xã hội) đã bị hỏng, và có lẽ không thể sửa được. Bây giờ bạn đã biết. Điều đáng ngạc nhiên là vấn đề không phải là “algorithms” để tối đa hóa engagement; loại bỏ algorithms và mọi thứ vẫn giữ nguyên hoặc trở nên tồi tệ hơn.
Tiny Awards Finalists cho thấy mức độ khả thi của những gì trên Web. Chúng cảm động, sáng tạo và vui tươi. Ví dụ, Traffic Cam Photobooth cho phép mọi người sử dụng camera giao thông để chụp ảnh chính mình, đùa giỡn với sự giám sát tự động luôn hiện diện.
Một tòa án liên bang US đã phán quyết rằng Facebook đã thu thập dữ liệu bất hợp pháp từ ứng dụng sức khỏe phụ nữ Flo.
HTML Hobbyist là một trang web tuyệt vời dành cho những người muốn tạo sự hiện diện của riêng mình trên web—bên ngoài các walled gardens (vườn tường bao), mà không cần các frameworks gây đau đầu. Nó không khó, và nó không tốn kém.
More from the Learning Platform
- ActivityPub (sách)
Biology and Quantum Computing
Các nhà khoa học đã tạo ra biological qubits: các quantum qubits được xây dựng từ proteins trong các tế bào sống. Những thứ này có lẽ sẽ không được sử dụng để phá vỡ mật mã, nhưng chúng có khả năng cung cấp cho chúng ta cái nhìn sâu sắc về cách các quá trình quantum hoạt động bên trong các sinh vật sống.
More from the Learning Platform
- Superconducting Qubit Design Using Qiskit Metal: Engineering of Superconducting Quantum Architecture (sách)
Để lại một bình luận
Bạn phải đăng nhập để gửi bình luận.