OpenAI Codex trên Mac: 48 Giờ Xài Thử (Và Những Gì Vỡ)

OpenAI vừa tung bản cập nhật lớn nhất cho Codex kể từ lần đổi tên — trùng khớp đúng một giờ sau khi Anthropic công bố Opus 4.7 vào thứ Năm. Việc chọn thời điểm này không phải ngẫu nhiên, và danh sách tính năng mới cũng vậy. Giờ đây, Codex Desktop không chỉ đọc được màn hình Mac, mà còn có thể click vào ứng dụng, gõ phím vào cửa sổ, và vẫn cứ làm việc âm thầm trong khi bạn bận những việc khác.

Trong 48 giờ qua, cộng đồng đã dùng nó để sắp xếp email, mở nhạc trên app Music, chạy song song nhiều tác vụ tìm lỗi (reproduce bug), và thậm chí có một demo viral khi nó chơi trọn vẹn một ván Slay the Spire 2 chỉ với một câu lệnh duy nhất. Tất nhiên, không có gì hoàn hảo: bản Intel Mac còn lỗi, chưa mở rộng rãi ở EU/Anh/Thụy Sĩ, và tính năng Memory nếu bật sẽ khiến app chạy ì ạch ngay lập tức.

May mắn cho anh em Việt Nam là chúng ta vẫn dùng được bình thường, không bị chặn vùng miền như EU. Nhưng trước khi tải về, bạn nên nắm rõ xem thứ gì đã chạy ổn, thứ gì còn ngổn ngang, và có đáng bỏ thời gian cuối tuần này ra test hay không.

Codex Desktop là cái gì?

Ngắn gọn: Codex là trợ lý lập trình (coding agent) của OpenAI. Bạn cứ tưởng tượng nó như một phiên bản nâng cấp của ChatGPT, được đóng gói thành app Mac. Nó giao tiếp trực tiếp với editor bạn đang dùng, tự chạy test, và kể từ 16/4, nó còn học thêm kỹ năng mới — tự động điều khiển bất kỳ ứng dụng nào trên máy bằng một con trỏ chuột riêng biệt.

Chi tiết hơn cho dân kỹ thuật: Đây là phiên bản 26.415. Hỗ trợ macOS (Intel vừa được thêm vào nhưng còn lỗi — xem phần dưới). Dùng model gpt-image-1.5 để tạo ảnh. Bao gồm 90+ plugin tích hợp sẵn từ Atlassian Rovo, Remotion, Microsoft Suite. Có bản thử nghiệm tính năng Memory persistent (nhớ ngữ cảnh liên phiên). Và đi kèm gói Codex Pro mới với giá $100/tháng, cao gấp 5 lần giới hạn của gói Plus $20.

Điểm cốt lõi cần nhớ: Codex giờ đã “sờ” được vào máy tính của bạn. Không phải kiểu “gọi API trá hình” nữa. Nó dùng con trỏ thật, thao tác trên màn hình thật, di chuyển qua lại giữa các app thật. Nó chạy song song cùng bạn, không chiếm bàn phím.

Đấy là phần marketing. Còn thực tế sử dụng thì còn thú vị hơn nhiều.

Với dev Việt Nam, cần biết trước vài điều

Intel Mac đang gặp lỗi. Một người dùng Nhật trên X đã báo rằng tính năng Computer Use không kích hoạt được trên chip Intel, dù tài liệu kỹ thuật vẫn ghi là hỗ trợ. Nếu bạn còn dùng MacBook Pro đời 2019 hoặc cũ hơn, hãy cân nhắc hoãn lại. Chip Apple Silicon (M1 trở đi) thì chạy rất mượt.

Gõ tiếng Việt với Computer Use chưa được kiểm chứng kỹ. Người dùng Nhật cũng than phiền về lỗi gõ tiếng Nhật trên tính năng này. Dù chưa có báo cáo cụ thể về tiếng Việt, nhưng cơ chế IME của hai ngôn ngữ này khá tương đồng. Vì vậy, trước khi giao những task quan trọng cần gõ tiếng Việt (như soạn email cho khách, điền form nội bộ), bạn nên chạy thử một tác vụ nhỏ trước.

EU/UK/Thụy Sĩ bị chặn hoàn toàn — nhưng tại Việt Nam thì vẫn dùng được bình thường. Nếu bạn làm remote cho công ty châu Âu, đây cũng là lúc bạn có thể test giúp team, vì họ đang bị khóa tính năng.

Gói Plus $20 sẽ “cháy” nhanh hơn bạn nghĩ. Trước khi có Computer Use, gói Plus đã khá căng thẳng. Giờ đây, một task có thể đòi hỏi nhiều agent chạy song song và hàng chục lần quét màn hình mỗi phút. Một user chia sẻ rằng hạn mức dùng thử của họ cạn kiệt chỉ sau 6 phút chạy ở chế độ liên tục. Nếu định dùng cho công việc thực tế, cân nhắc ngay lên gói Pro $100 — với giới hạn cao gấp 5 lần.

Phần còn lại của bài viết này giả định máy bạn chạy chip Apple Silicon và đang dùng gói ChatGPT Plus trở lên.

Cài đặt (và màn quyền macOS)

Quá trình cài đặt khá nhanh. Mở Codex → Settings → Computer Use → Install. Ngay sau đó, macOS sẽ dẫn bạn qua màn hình cấp quyền quen thuộc: System Settings > Privacy & Security > Screen Recording > tick vào Codex > tắt mở lại app. Tiếp đến là mục Accessibility. Và lại một lần nữa, bạn phải tắt mở app để cập nhật.

Một dev Mac từng thẳng thắn nhận định trên X: quy trình cấp quyền này thực sự phiền phức. Không phải do lỗi của Codex, mà do macOS yêu cầu mọi ứng dụng muốn “nhìn và thao tác” đều phải trải qua loạt bước xác minh này. OpenAI đã cố gắng hết sức (giao diện onboarding của họ vẫn đẹp hơn nhiều đối thủ), nhưng việc vẫn phải click qua tới 5 panel chỉ để mở một quyền thì đúng là điều khó tránh khỏi.

Sau bước đầu tiên, bạn sẽ đối mặt với lớp bảo vệ thứ hai. Codex sẽ luôn hỏi ý kiến trước khi chạm vào bất kỳ ứng dụng nào lần đầu. Bạn có thể chọn “Always allow” cho những app tin cậy, giữ whitelist chặt chẽ (chỉ Safari và Keynote), hoặc mở rộng quyền cho tất cả.

Có hai điều bạn sẽ không bao giờ bật được, dù có tick hết ô: Codex không được phép tự động hóa chính nó (tránh việc tự thông qua yêu cầu của chính mình), và không được phép phê duyệt lệnh sudo thay bạn. Khi hệ thống yêu cầu mật khẩu admin, bạn vẫn phải tự tay nhập.

5 Thứ Dân Tình Đã Làm Trong 48 Giờ

Đây không phải những cảnh quay chọn lọc từ phần demo của OpenAI. Đây là những tác vụ thực tế được cộng đồng chạy ngay trong 48 giờ đầu tiên sau khi bản cập nhật ra mắt.

1. Sắp xếp inbox Mac Mail theo chủ đề và độ khẩn

Một trong những demo đầu tiên đến từ một nhà nghiên cứu: anh yêu cầu Codex mở Mac Mail, quét toàn bộ email hôm qua, và tự động gom nhóm theo chủ đề cùng mức độ ưu tiên. Codex mở ứng dụng, cuộn qua các cuộc hội thoại, rồi trả về một bản tóm tắt cực kỳ gọn gàng. Đây đúng là kiểu task mà trước đây bạn phải nhờ trợ lý cá nhân làm.

Khác với Claude Computer Use hay Perplexity Personal Computer, điểm cộng lớn của Codex là nó không chiếm trọn màn hình. Federico Viticci từ MacStories thậm chí nhận xét đây là “tính năng [Computer Use] tốt nhất tôi từng dùng” — một phần nhờ khả năng đọc trực tiếp accessibility tree của macOS (cùng công nghệ với VoiceOver) thay vì chỉ dựa trên screenshot và click ảo. Kết quả chính xác hơn, và quan trọng là Mac Mail không cần kéo ra phía trước. Bạn vẫn có thể âm thầm làm việc chính của mình.

2. Vừa viết email vừa cho Codex dùng Messages

Một người dùng khác yêu cầu Codex chụp màn hình cuộc hội thoại hiện tại, mở Messages, rồi gửi tấm ảnh đó cho một người bạn. Nghe có vẻ đơn giản, nhưng điều thú vị là người dùng này vẫn đang soạn thảo một email khác trên cùng máy Mac đó, trong khi con trỏ của Codex tự động bay lượn trong Messages.

Đây chính là điểm “đắt giá” xuất hiện liên tục trong những phản hồi đầu tiên. Hai con trỏ, hai agent, một máy Mac. Hoạt động song song, không phải theo trình tự chờ đợi. Anthropic cũng tung ra Agent Teams trên Claude Code chỉ một ngày trước đó (15/4) — cùng ý tưởng nền tảng nhưng cách triển khai khác. Cảm giác Codex thiên về chạy ngầm (background job) hơn là bắt bạn ngồi nhìn nó thao tác.

3. Chạy nhiều bug reproduction song song

Một dev với tài khoản @rudrank đã chia sẻ một workflow cực kỳ được cộng đồng hưởng ứng: 3 agent cùng lúc, mỗi cái xử lý một bug khác nhau, chạy song song trong khi anh ấy thong thả ăn trưa. Một agent dùng plugin Slack để kéo ngữ cảnh từ thread, cái kia kết nối GitHub, và agent thứ ba trực tiếp thao tác trên ứng dụng.

Con số 90+ plugin của Codex thực sự toát lên ở đây. Mỗi plugin là một đường dây kết nối trực tiếp tới các dịch vụ quen thuộc — Jira, Linear, Notion, GitHub, CircleCI, GitLab, Render, Remotion, Vercel, Microsoft Suite. Bạn không cần mất công setup OAuth cho từng app. Codex lo hết. Đây chính là nước đi của OpenAI nhằm cạnh tranh với hệ sinh thái Claude Skills (obra/superpowers và ui-ux-pro-max). Rõ ràng, hai gã khổng lồ này đang âm thầm đua nhau xem ai sẽ sở hữu stack “agent + hệ sinh thái” bền vững hơn.

4. Mirror iPhone và điều khiển app trên điện thoại

Điều này khá bất ngờ. Khi bật tính năng iPhone Mirror trên macOS, Computer Use của Codex đã có thể “mở rộng” sang điện thoại. Một người dùng đã cho phép Codex thao tác chạm (tap) vào một app iOS thông qua cửa sổ mirror. Nó chạy được. Tất nhiên sẽ chậm và kém chính xác hơn so với app Mac native, nhưng về cơ bản là hoạt động.

Đây là một phân khúc automation hoàn toàn mới, tuần trước còn chưa ai nghĩ tới. Nếu bạn từng bí khi cần thao tác trên app iOS nhưng lại không có API, giờ đã có lối thoát.

5. Dựng deck Keynote từ outline trong lúc họp

Chưa có demo công khai nào cho trường hợp này, nhưng nó xuất hiện liên tục trong các nhóm chat riêng: đưa cho Codex một dàn ý dạng gạch đầu dòng, ra lệnh mở Keynote, sau đó bạn bước vào cuộc họp. Ứng dụng tự động mở, nhập text, chọn template, và chèn ảnh do gpt-image-1.5 tạo ra.

Tại đây, Codex chính thức bước ra khỏi vỏ bọc “công cụ code” để trở thành trợ lý đa năng trên Mac. Đúng như câu slogan của OpenAI: “Codex for (almost) everything”.

Cái Gì Không Chạy (Thật Lòng)

Phần này thường bị các bài PR bỏ qua. Nhưng thực tế thì đây là:

Intel Mac vẫn còn lỗi. Dù OpenAI đã thêm hỗ trợ Intel vào bản phát hành này — tưởng là tin vui cho ai còn giữ MacBook Pro 2019. Nhưng một user Nhật đã báo rằng tính năng chính Computer Use không thể kích hoạt trên chip Intel. “Về lý thuyết phải chạy được, nhưng đang có lỗi gì đó.” Chip Apple Silicon thì ổn, còn Intel thì hãy chờ bản vá 26.416.

Tính năng Memory làm app ì ạch. Bản preview Memory (khả năng ghi nhớ thiết lập giữa các thread) gây chậm rõ rệt. Một user thử bật lên, thấy Codex chạy như rùa, đành tắt đi và đăng bài hướng dẫn lệnh tắt. Tính năng này tốt nhất là nên để chế độ production mới bật.

Hạn mức gói $20 Plus bị chặn nhanh. Đã đề cập ở trên, xin phép không nhắc lại.

Asana chưa chạy ổn. Một người dùng thử dựng project Asana qua Computer Use. Chạy rất lâu và cuối cùng thất bại. Nhưng khi đổi lệnh sang “tạo cho tôi file CSV để import”, dưới 1 phút có CSV, 5 phút sau project đã live. Bài học rút ra: Computer Use chỉ nên dùng cho những việc không còn đường nào khác. Nếu đã có API hoặc đường dẫn import, hãy dùng cách đó.

Viết code vẫn bị ngắt quãng. Một dev yêu cầu Codex sửa React component, chạy test, rồi commit. 2/3 lần thực hiện đều bị kẹt ở bước test. Demo thì mượt, còn dùng hàng ngày thì khá chập chờn. Đây không phải riêng Codex — hầu hết agent đều vậy. Computer Use cũng chưa giải quyết được vấn đề này.

Đôi khi vẫn chiếm màn hình. OpenAI quảng cáo Computer Use chạy ngầm. Đại đa số trường hợp là đúng. Nhưng có một user chia sẻ rằng Codex từng chiếm trọn máy Mac của anh, đến mức anh suýt mua thêm một máy chỉ để chạy riêng nó. Tùy thuộc vào ứng dụng bạn dùng.

Terminal và chính Codex bị khóa. Bạn không thể dùng Computer Use để điều khiển Terminal (đây là thiết kế bảo mật — nhằm tránh việc bypass sandbox qua ngã phụ). Codex cũng không thể tự điều khiển chính nó. Và thực ra, bạn cũng không nên muốn thế.

Codex vs Claude Code sau bản cập nhật này

Trước tuần này, bức tranh so sánh khá rõ ràng: Codex rẻ hơn trên mỗi token và mạnh về benchmark terminal. Claude Code thì viết code sạch hơn trong các bài đánh giá mù (blind evaluation). Phần lớn nhận định này vẫn còn đúng.

Cái đã thay đổi: Codex giờ sở hữu Computer Use, agent chạy song song, memory persistent, cùng 90+ plugin tích hợp sẵn trong một app Mac được đầu tư kỹ lưỡng. Claude Code cũng tung ra Agent Teams 2 ngày trước, và đã có Computer Use từ tháng 3. Mức độ ngang hàng (feature parity) giờ đã đạt đúng như giới công nghệ dự đoán. Việc đưa ra quyết định mua hàng sẽ thú vị hơn, chứ không hề đơn giản hơn.

Khía cạnh	Codex Desktop (17/4)	Claude Code (hiện tại)
Computer Use trên Mac	Có — con trỏ background, đọc AX tree	Có — dựa trên screenshot
Agent song song	Có — nhiều con trỏ cùng lúc	Có — qua Agent Teams
Hệ sinh thái plugin/skill	90+ plugin chính thức	obra/superpowers, skill cộng đồng
Memory persistent	Preview (bug hôm nay)	Có — trưởng thành hơn
Polish trên macOS	App Mac riêng	Cross-platform, chạy trong terminal
Sinh ảnh	Built-in (`gpt-image-1.5`)	Không — dùng công cụ ngoài
Giá trị ở gói $20	Plus nhiều usage hơn mỗi đô	Hết trong một session tập trung
SWE-bench Pro	Tương đương Claude Code	Tương đương Codex
Terminal-Bench 2.0	Dẫn trước rõ	Kém một chút
Chất lượng code blind	25% được chọn	67% được chọn
Phủ sóng	Mac trước, chưa có EU/UK	Mọi nơi

Ngắn gọn: bạn xài Mac, công việc đụng tới app không API, tuần này Codex là tool tốt hơn. Bạn ship code production, chất lượng review quan trọng hơn tốc độ, Claude Code vẫn là cái viết ra code mà dev chọn trong blind test.

Mà khỏi phải chọn một. OpenAI cũng ship luôn repo chính thức codex-plugin-cc — cho user Claude Code giao task cho Codex như một sub-agent. Cuộc chiến feature parity đang lặng lẽ chuyển thành công tác ống nước liên hệ sinh thái.

Điều này có nghĩa gì với bạn

Nếu bạn là dev solo trên Mac: Bạn đã có công cụ để test frontend trực tiếp trên app thật (Chrome, Safari, bản build Electron) mà không cần tự viết test suite. 48 giờ thử nghiệm loại “cài vào xem sao” này xứng đáng dành cho sáng thứ Bảy.

Nếu bạn là prosumer — consultant, freelancer, hoặc người làm việc độc lập: Hãy tạm gác vấn đề coding sang một bên. Email, Messages, Keynote và quy trình research mới là nơi bạn kiếm lại khoản $20 bỏ ra. Cho phép Codex truy cập inbox và Slack, cung cấp dàn ý, và để nó soạn thảo bản nháp trong khi bạn họp.

Nếu bạn đang dùng ChatGPT Plus mà phân vân có nên lên Pro không: Hãy cứ dùng gói Plus thêm 2 tuần nữa. Dùng hết những gì đang có. Nếu bạn chạm rate limit hơn 2 lần mỗi ngày, lúc đó hãy tính tới Pro. Chưa thì chưa cần vội.

Nếu bạn dùng Intel Mac, đang ở EU/UK/Thụy Sĩ, hoặc workflow chủ yếu dùng tiếng Việt/Nhật: Hãy chờ đợi. Bản cập nhật này của OpenAI vẫn còn vài góc chưa được mài dũa. Họ sẽ khắc phục. Tính năng sẽ không biến mất, chỉ là chưa kịp thời.

Tổng kết: Hãy cài nó lên (nếu máy bạn tương thích), dành nửa ngày để giao những tác vụ thực tế, tìm ra 2–3 việc nó làm tốt hơn bạn, và đưa vào quy trình làm việc hàng tuần. Bỏ qua những tin tức thổi phồng. Bỏ qua những nhận định kiểu “sẽ thay thế công việc của bạn”. Hãy nhìn nhận nó đúng bản chất — như một trợ lý junior biết thao tác click trong ứng dụng. Những việc junior làm tốt, Codex cũng sẽ làm tốt.

Ai nên cài cuối tuần này?

Ngắn gọn: Dành cho ai có máy Mac chip Apple Silicon, đăng ký ChatGPT Plus hoặc Pro, và đang ít nhất một workflow đa ứng dụng lặp lại mà bạn muốn tự động hóa nhưng mãi chưa làm được.

Chi tiết hơn:

Cài ngay nếu: Bạn dùng macOS 14+ trở lên, chip M1 trở đi, và trong đầu đã có sẵn tác vụ cụ thể (lọc inbox, test frontend, tổng hợp tài liệu research, dựng slide Keynote từ dàn ý).
Cài nhưng đừng thần thánh hóa ngay: Nếu có phần cứng tốt nhưng chưa xác định rõ workflow cụ thể — demo sẽ khiến bạn trầm trồ, nhưng tỷ lệ hoàn vốn (ROI) chỉ thực sự đến khi bạn áp dụng vào việc thật.
Chờ thêm một tuần nếu: Bạn còn dùng Intel Mac, đang ở khu vực EU/UK/Thụy Sĩ, phụ thuộc nhiều vào tính năng Memory, hoặc quy trình làm việc đòi hỏi gõ tiếng Việt/Nhật nhiều.
Bỏ qua lúc này nếu: Bạn đang rất hài lòng với Claude Code và công việc chính là viết code production. Lợi thế Computer Use của Codex là có thật, nhưng hôm nay nó chưa đủ lớn để bù lại ưu thế về chất lượng code thuần túy của Claude Code.

Tóm lại

Đây là bản cập nhật lớn nhất của Codex kể từ lần đổi tên, và có thể đẩy toàn bộ phân khúc “agent dành cho prosumer” tiến một bước dài trong 48 giờ qua, tương đương cả nửa năm trước đó cộng lại. Nó không phải là “vũ khí diệt” Claude Code — cả hai giờ đều sở hữu danh sách tính năng ngang ngửa, điểm khác biệt thực sự nằm ở độ tinh chỉnh (polish) và khả năng ra quyết định. Nhưng nếu bạn làm việc trên Mac và công việc thường xuyên phải tương tác với những ứng dụng không cung cấp API rõ ràng, thì Codex Desktop chính là lựa chọn khả thi nhất bạn có thể cài đặt ngay hôm nay.

Con số 90+ plugin sẽ cần thời gian để ngấm. Computer Use sẽ chiếm trọn tiêu đề trên báo chí trong tuần tới. Nhưng chính hệ sinh thái plugin — khả năng chạy đồng thời 3 agent xuyên suốt Slack, Jira và codebase trong một workflow liên tục — mới là thứ thực sự bám trụ được sau 6 tháng.

Cài lên. Dành một buổi chiều. Tìm một tác vụ cụ thể. Tự động hóa nó. Quay lại kiểm tra sau một tháng và quyết định xem nó có xứng đáng chiếm chỗ trong routine của bạn hay không.