OpenAI vừa tung bản cập nhật lớn nhất của Codex kể từ ngày đổi tên — rơi đúng một tiếng sau khi Anthropic công bố Opus 4.7 hôm thứ Năm. Timing thì không phải tình cờ đâu, và bộ tính năng cũng không. Codex Desktop giờ có thể nhìn màn hình Mac, click app, gõ vào cửa sổ, và tiếp tục làm việc trong khi bạn đang bận việc khác.
48 giờ qua, dân tình đã dùng nó để phân loại email, mở nhạc trong app Music, chạy song song nhiều task reproduce bug, và trong một demo viral, chơi hết một ván Slay the Spire 2 chỉ với một prompt duy nhất. Nhưng cũng có mặt xịt: Intel Mac bị lỗi, EU / UK / Thụy Sĩ chưa mở, và tính năng Memory sẽ làm app chậm như rùa ngay khi bạn bật lên.
Ở Việt Nam thì hên — bạn access được bình thường, không bị chặn như khu vực EU. Nhưng trước khi cài, cần biết rõ cái gì chạy được, cái gì chưa, và có đáng bỏ cuối tuần này ra test hay không.
Codex Desktop là cái gì?
Ngắn gọn: Codex là coding agent của OpenAI. Cứ hình dung nó là anh em họ xịn hơn của ChatGPT, sống trong app Mac, nói chuyện được với editor của bạn, tự chạy test, và từ 16/4 có thêm kỹ năng mới — tự điều khiển bất kỳ app nào trên máy bằng con trỏ riêng của nó.
Chi tiết hơn cho dân pro: phiên bản 26.415. Chạy trên macOS (Intel vừa được hỗ trợ nhưng có bug — xem bên dưới). Dùng model gpt-image-1.5 cho phần sinh ảnh. Kèm 90+ plugin từ Atlassian Rovo, Remotion, Microsoft Suite. Có bản preview của memory persistent. Và có gói Codex Pro mới giá $100/tháng, gấp 5 lần giới hạn của gói Plus $20.
Câu tóm tắt quan trọng: Codex giờ dùng được máy tính của bạn. Không phải kiểu “chúng tôi biến tool call thành cú click trá hình” đâu. Là con trỏ thật, trên màn hình thật, đi qua các app thật. Song song với bạn. Không chiếm bàn phím.
Đấy là pitch. Thực tế thì thú vị hơn.
Với dev Việt Nam, cần biết trước vài điều
Intel Mac đang bị vỡ. Một user Nhật báo trên X rằng Computer Use không bật được trên Intel, dù spec ghi là support. Nếu bạn đang xài MacBook Pro đời 2019 trở về trước, khoan cài. Apple Silicon (M1 trở đi) thì ngon lành.
Gõ tiếng Việt với Computer Use chưa test kỹ. Một user Nhật cũng phàn nàn rằng Computer Use gõ tiếng Nhật bị lỗi. Chưa thấy report cụ thể về tiếng Việt, nhưng cả hai đều dùng IME tương tự, nên trước khi giao task quan trọng có gõ tiếng Việt (ví dụ: soạn email khách hàng, fill form VN), chạy thử một task nhỏ trước.
EU/UK/Thụy Sĩ bị chặn hoàn toàn — nhưng Việt Nam thì không. Nếu bạn đang làm remote cho công ty châu Âu, đây là cơ hội test giúp team, vì họ chưa bật được.
Gói Plus $20 sẽ bốc hơi nhanh hơn bạn tưởng. Trước khi có Computer Use, Plus đã đủ căng. Giờ một task có thể bao gồm nhiều agent chạy song song và chục lần đọc màn hình mỗi phút. Một user đã báo rằng usage limit hết chỉ sau 6 phút chạy trong chế độ intensive. Nếu định xài serious, tính ngay gói Pro $100 — 5× limit.
Phần còn lại của bài giả định bạn có Apple Silicon và ChatGPT Plus trở lên.
Cài đặt (và màn quyền macOS)
Cài thì nhanh. Mở Codex → Settings → Computer Use → Install. Sau đó macOS kéo bạn vào màn nhảy truyền thống: System Settings > Privacy & Security > Screen Recording > tick Codex > đóng mở lại app. Rồi Accessibility. Rồi lại đóng mở app.
Một dev Mac đã viết thẳng trên X điều nhiều người nghĩ: cái flow cấp quyền này là tệ. Không phải lỗi Codex — macOS bắt mọi app muốn “nhìn và click” phải qua màn drag-and-drop nhiều bước này. OpenAI đã làm những gì có thể (màn onboarding đẹp hơn đa số app khác). Nhưng vẫn phải click qua 5 panel để mở một quyền, thì vẫn là 5 panel.
Xong layer đầu, còn layer thứ hai. Codex sẽ hỏi trước khi chạm vào bất kỳ app nào lần đầu. Bạn có thể “Always allow” với app tin tưởng. Có thể giữ whitelist chặt — chỉ Safari và Keynote — hoặc mở hết.
Hai thứ không thể bật dù tick bao nhiêu ô: Codex không được tự động hóa chính nó (để không tự bypass approval của chính nó), và không được phê duyệt prompt sudo hộ bạn. Khi hệ thống hỏi mật khẩu admin, bạn vẫn phải gõ.
5 Thứ Dân Tình Đã Làm Trong 48 Giờ
Không phải demo OpenAI chọn. Task thật từ 48 giờ đầu sau ra mắt.
1. Sắp xếp inbox Mac Mail theo chủ đề và độ khẩn
Một demo sớm nhất là của một nhà khoa học: yêu cầu Codex mở Mac Mail, đọc tất cả email từ hôm qua, và nhóm theo chủ đề + độ khẩn. Codex mở app, cuộn qua các thread, quay lại với bản tóm tắt gọn gàng. Kiểu task mà bình thường phải thuê trợ lý làm.
Điểm khác Claude Computer Use và Perplexity Personal Computer là Codex không chắn đường. Federico Viticci của MacStories gọi đây là “tính năng [Computer Use] tốt nhất tôi từng test” — một phần vì nó đọc accessibility tree của macOS (cái mà VoiceOver dùng), thay vì chỉ screenshot + click ước lượng. Chính xác hơn. Và Mail không cần kéo ra trước. Nghĩa là bạn có thể tiếp tục công việc chính của mình.
2. Vừa viết email vừa cho Codex dùng Messages
Một user khác yêu cầu Codex chụp screenshot cuộc trò chuyện hiện tại, mở Messages, gửi screenshot cho một người bạn. Không có gì khó. Nhưng user này vẫn đang viết email khác trên cùng Mac trong khi con trỏ Codex tự bay trong Messages.
Đây là phần “magic” xuất hiện lặp đi lặp lại trong các phản ứng đầu tiên. Hai con trỏ, hai agent, một máy Mac. Song song, không tuần tự. Claude Code của Anthropic ra Agent Teams một ngày trước đó (15/4) — ý tưởng giống, triển khai khác. Cảm giác Codex thiên về “background job” hơn là “nhìn nó làm”.
3. Chạy nhiều bug reproduction song song
Một dev tên @rudrank đăng workflow được cộng đồng thích: 3 agent, mỗi agent reproduce một bug khác, tất cả chạy song song trong khi anh ăn trưa. Một dùng plugin Slack kéo context từ thread. Một dùng GitHub. Cái thứ ba trực tiếp thao tác app.
90+ plugin lên tiếng ở đây. Mỗi plugin là một kết nối tới service đã được dây sẵn — Jira, Linear, Notion, GitHub, CircleCI, GitLab, Render, Remotion, Vercel, Microsoft Suite. Không phải tự setup OAuth cho từng cái. Codex lo. Đây là câu trả lời của OpenAI với hệ sinh thái Claude Skills của obra/superpowers và ui-ux-pro-max. Hai hãng giờ đang đấu nhau xem ai sở hữu stack “agent + ecosystem”.
4. Mirror iPhone và điều khiển app trên điện thoại
Cái này bất ngờ. Với tính năng iPhone Mirror của macOS bật, Computer Use của Codex lan được tới điện thoại. Một user đã cho Codex tap qua một app iOS qua cửa sổ mirror. Chạy được. Chậm và kém chính xác hơn so với app Mac native, nhưng chạy.
Cả một hạng mục automation mà một tuần trước không ai bàn tới. Nếu bạn cần làm gì trong app iOS không có API, giờ có đường.
5. Dựng deck Keynote từ outline trong lúc họp
Chưa thấy demo public nào cho cái này, nhưng use case này liên tục xuất hiện trong chat riêng: đưa cho Codex một outline dạng bullet, chỉ Keynote, rồi vào họp. Nó mở app, gõ text, chọn template, nhét ảnh do gpt-image-1.5 tạo.
Ở đây Codex thoát khỏi vai trò “công cụ code” và chuyển thành Mac assistant general-purpose. Đúng như tagline của OpenAI: “Codex for (almost) everything”.
Cái Gì Không Chạy (Thật Lòng)
Phần này mọi bài PR ra mắt đều bỏ. Đây:
Intel Mac vỡ. OpenAI thêm support Intel trong release này — tin vui cho ai còn xài MacBook Pro 2019. Nhưng một user Nhật báo rằng tính năng chính Computer Use không bật được trên Intel. “Phải hỗ trợ được, nhưng có bug gì đó.” Apple Silicon thì ok. Intel thì chờ 26.416.
Memory làm app chậm. Memory preview (cái nhớ preference giữa các thread) gây chậm rõ rệt. Một user bật lên, Codex chạy như rùa, tắt đi, rồi post commands để tắt. Memory là tính năng “đợi production mới bật”.
Rate limit đập nhanh trên gói $20 Plus. Đã nói ở trên. Không nhắc lại.
Asana không chạy. Một user thử setup project Asana qua Computer Use. Chạy lâu. Fail. Đổi sang “tạo cho tôi CSV để import”, dưới 1 phút là có CSV, 5 phút là project live. Bài học: Computer Use dành cho thứ không có cách nào khác. Có API hoặc import path thì dùng cái đó.
Task code vẫn gãy giữa chừng. Một dev yêu cầu Codex sửa React component, chạy test, commit. 2/3 lần chạy đều kẹt ở bước test. Demo mượt, xài hằng ngày thì xóc. Không chỉ riêng Codex — agent nào cũng vậy. Computer Use không fix chuyện đó.
Đôi khi chiếm màn hình. Pitch của OpenAI là Computer Use chạy background. Đa số đúng. Nhưng một user báo rằng Codex đã chiếm luôn máy Mac của anh, đến mức đang tính mua máy riêng chỉ để chạy Codex. Tùy app.
Terminal và chính Codex bị khóa. Không thể dùng Computer Use điều khiển Terminal (thiết kế bảo mật — không cho bypass sandbox qua đường ngang). Codex cũng không thể điều khiển Codex. Mà cũng không nên muốn thế.
Codex vs Claude Code sau bản cập nhật này
Trước tuần này, so sánh đại khái: Codex rẻ hơn mỗi token, mạnh ở benchmark terminal. Claude Code viết code sạch hơn trong blind evaluation. Giờ vẫn đúng phần lớn.
Cái đã thay đổi: Codex giờ có Computer Use, agent song song, memory persistent, 90+ plugin trong một app Mac được đầu tư kỹ. Claude Code ra Agent Teams 2 ngày trước, và có Computer Use từ tháng 3. Feature parity giờ đã đạt mức báo chí dự đoán. Quyết định mua trở nên thú vị hơn, không đơn giản hơn.
| Khía cạnh | Codex Desktop (17/4) | Claude Code (hiện tại) |
|---|---|---|
| Computer Use trên Mac | Có — con trỏ background, đọc AX tree | Có — dựa trên screenshot |
| Agent song song | Có — nhiều con trỏ cùng lúc | Có — qua Agent Teams |
| Hệ sinh thái plugin/skill | 90+ plugin chính thức | obra/superpowers, skill cộng đồng |
| Memory persistent | Preview (bug hôm nay) | Có — trưởng thành hơn |
| Polish trên macOS | App Mac riêng | Cross-platform, chạy trong terminal |
| Sinh ảnh | Built-in (gpt-image-1.5) | Không — dùng công cụ ngoài |
| Giá trị ở gói $20 | Plus nhiều usage hơn mỗi đô | Hết trong một session tập trung |
| SWE-bench Pro | Tương đương Claude Code | Tương đương Codex |
| Terminal-Bench 2.0 | Dẫn trước rõ | Kém một chút |
| Chất lượng code blind | 25% được chọn | 67% được chọn |
| Phủ sóng | Mac trước, chưa có EU/UK | Mọi nơi |
Ngắn gọn: bạn xài Mac, công việc đụng tới app không API, tuần này Codex là tool tốt hơn. Bạn ship code production, chất lượng review quan trọng hơn tốc độ, Claude Code vẫn là cái viết ra code mà dev chọn trong blind test.
Mà khỏi phải chọn một. OpenAI cũng ship luôn repo chính thức codex-plugin-cc — cho user Claude Code giao task cho Codex như một sub-agent. Cuộc chiến feature parity đang lặng lẽ chuyển thành công tác ống nước liên hệ sinh thái.
Điều này có nghĩa gì với bạn
Nếu bạn là dev solo trên Mac: Bạn có tool giờ test được frontend qua app thật (Chrome, Safari, Electron build) mà không cần tự viết test suite. Test 48h “cài thử xem sao” đáng dành sáng thứ Bảy.
Nếu bạn là prosumer — consultant, indie, solo operator: Bỏ góc độ coding đi. Email, Messages, Keynote, research workflow là nơi kiếm lại $20. Cho Codex quyền truy cập inbox và Slack, đưa nó outline, để nó draft trong lúc bạn họp.
Nếu bạn đang xài ChatGPT Plus, phân vân có lên Pro không: Ở Plus 2 tuần nữa. Xài hết cái có. Nếu hit rate limit hơn 2 lần/ngày, cân nhắc Pro. Không thì chưa cần.
Nếu bạn dùng Intel Mac, ở EU/UK/CH, hoặc workflow tiếng Việt/Nhật chủ đạo: Đợi. Lần ra mắt này OpenAI để lộ 3 cạnh gồ. Họ sẽ mài. Tính năng không biến mất.
Kết: Cài lên (nếu tới được), dành nửa ngày giao task thật, tìm 2–3 thứ nó làm tốt hơn bạn, nhét vào routine tuần. Bỏ qua hype. Bỏ qua mấy take kiểu “sẽ thay thế job bạn”. Coi nó đúng bản chất — một trợ lý junior biết click trong app. Việc junior làm tốt cũng là việc Codex làm tốt.
Ai nên cài cuối tuần này?
Ngắn: Ai có Mac Apple Silicon, ChatGPT Plus hoặc Pro, và có ít nhất một workflow đa-app lặp lại đã định automate mãi mà chưa làm.
Dài hơn:
- Cài ngay nếu: macOS 14+, M1 trở đi, và có sẵn task cụ thể trong đầu (lọc inbox, test frontend, tổng hợp research, build Keynote từ outline).
- Cài nhưng đừng tin ngay nếu: Có hardware nhưng chưa có workflow cụ thể — demo sẽ làm bạn trầm trồ, nhưng ROI chỉ tới khi có việc thật.
- Đợi một tuần nếu: Dùng Intel, ở EU/UK/CH, hoặc phụ thuộc vào Memory, hoặc workflow gõ nhiều tiếng Việt.
- Bỏ qua lúc này nếu: Đang happy với Claude Code và việc chủ yếu là production code. Lợi thế Computer Use của Codex là thật, nhưng hôm nay chưa đủ bù lại lợi thế chất lượng của Claude Code cho pure coding.
Tóm lại
Đây là bản cập nhật Codex lớn nhất kể từ ngày đổi tên, và có thể đẩy category “agent cho prosumer” tiến hơn trong 48 giờ này so với 6 tháng trước cộng lại. Không phải Claude Code killer — cả hai giờ đều có cùng feature list, khác biệt thật nằm ở polish và khả năng phán đoán. Nhưng nếu bạn làm trên Mac và việc bạn đụng tới app không phơi bày API sạch, Codex Desktop vừa trở thành thứ có khả năng nhất bạn có thể cài hôm nay.
90+ plugin là phần ngấm từ từ. Computer Use cướp hết headline tuần sau. Nhưng hệ sinh thái plugin — khả năng chạy 3 agent xuyên Slack, Jira, codebase trong một workflow — mới là thứ dính lại sau 6 tháng.
Cài lên. Dành một buổi chiều. Tìm một task. Automate task đó. Quay lại sau một tháng và quyết định xem nó có xứng chỗ không.
Nguồn
- OpenAI — Codex for (almost) everything
- OpenAI Developers — Computer Use in Codex
- OpenAI Developers — Codex Changelog v26.415
- MacStories — Federico Viticci về Codex Computer Use
- VentureBeat — OpenAI cập nhật Codex Desktop mạnh tay
- 9to5Mac — Codex Mac thêm 3 tính năng chủ đạo
- MacRumors — OpenAI Codex cập nhật trên Mac
- TechCrunch — OpenAI ngắm Anthropic với Codex nâng cấp
- GitHub — openai/codex-plugin-cc