Claude Ultrathink: 5 Cấp Độ Tư Duy Ẩn Mà Ít Người Biết (2026)

Mấy anh em ơi, hôm nay mình muốn mách ngay một tính năng vừa hay ho vừa khiến mình bất ngờ. Thật tình là dùng Claude cũng lâu rồi, vậy mà giờ mới biết đến nó.

Đó là extended thinking - hay nói nôm na là chế độ “nghĩ kỹ” của Claude. Và ở cấp độ cao nhất thì nó có cái tên “ngầu” hẳn: ultrathink.

Chuyện Là Thế Này

Dạo này mình đang code một dự án hơi phức tạp, dính đến việc tái cấu trúc cả hệ thống xác thực. Hỏi Claude kiểu bình thường thì nó cũng trả lời được, nhưng mình thấy câu trả lời hơi… thiếu chiều sâu.

Lên Reddit mò mẫm mới biết, Claude Code có sẵn tính năng cho phép AI “nghĩ kỹ hơn” trước khi xuất kết quả. Anthropic ra mắt tính năng này từ bản Claude 3.7 Sonnet hồi tháng 2/2025, nhưng thật ra anh em mình ở Việt Nam dùng ít phết.

Nói thật, lần đầu tiên bật chế độ này lên, mình thấy kết quả khác hẳn. Nó không chỉ đưa ra đáp án ngay, mà còn phân tích, so sánh các hướng xử lý rồi mới chốt giải pháp. Chuẩn luôn.

Suy Nghĩ Mở Rộng Hoạt Động Thế Nào?

Bình thường, mình hỏi Claude một câu là nó trả lời luôn, kiểu như hỏi đồng nghiệp và họ đáp ngay cái ý nghĩ đầu tiên lóe lên trong đầu.

Nhưng với chế độ suy nghĩ mở rộng, Claude sẽ được cấp một “ngân sách token” riêng để nghĩ trước. Kiểu như đồng nghiệp mình bảo: “Khoan đã, để mình nhẩm lại chút” - rồi ngồi phân tích bài toán thật kỹ.

Trong quá trình này, Claude sẽ:

Đếm xem có bao nhiêu hướng đi khác nhau
So kỹ ưu và nhược của mỗi hướng
Nghĩ đến cả những trường hợp hiếm hoặc biên
Sau đó mới chốt câu trả lời cuối cùng

À mà điểm đáng giá đây: toàn bộ quá trình suy nghĩ này mình xem được hết. Anthropic gọi là “visible extended thinking” - nghĩa là mình biết rõ Claude đang tính toán gì, cân nhắc ra sao. Cực hay.

Các Mức Độ “Nghĩ Sâu”

Đoạn này mới thú vị. Trong Claude Code, anh em chỉ cần gõ mấy từ khóa nhất định để kích hoạt các cấp độ suy nghĩ khác nhau:

Từ Khóa	Ngân Sách Token	Khi Nào Dùng
think	~4,000 token	Sửa lỗi đơn giản, tái cấu trúc nhỏ
think hard / megathink	~10,000 token	Thiết kế API, lược đồ cơ sở dữ liệu
think harder / ultrathink	~32,000 token	Kiến trúc hệ thống, sự cố sản phẩm nghiêm trọng

Nói đơn giản thì “ultrathink” cấp cho Claude gần 32K token để tư duy - nhiều gấp 8 lần so với mức mặc định đấy.

Mình thường hay gõ “think about this” hoặc “think deeply” - mấy cụm này sẽ kích hoạt mức megathink (~10K token). Còn muốn đẩy lên cao nhất thì cứ gõ “ultrathink” hoặc “think really hard” là xong.

Lưu Ý Cực Kỳ Quan Trọng (Đọc Kỹ Nhé!)

Cái này quan trọng lắm, nhớ đọc kỹ nhé: Ultrathink và mấy từ khóa kia CHỈ chạy được trong Claude Code - tức là công cụ dòng lệnh (CLI) của Anthropic.

Mình thấy có nhiều anh em mách nhau mẹo “thêm từ ultrathink vào prompt là AI sẽ suy nghĩ kỹ hơn” - nhưng mẹo này chỉ đúng khi anh em đang xài Claude Code.

Nếu anh em dùng web Claude.ai hoặc gọi API trực tiếp, mà có gõ “ultrathink” vào thì… cũng chẳng ăn thua gì đâu. Nó chỉ coi đó là một từ bình thường trong prompt thôi.

Còn với API, muốn bật tính năng này thì phải config tham số thinking trong request - không có từ khóa “thần thánh” nào cả.

Mình phải nhắc lại điều này vì đọc mấy bài tiếng Việt gần đây thấy hướng dẫn nhầm khá nhiều. Anh em đừng mất công làm theo những hướng dẫn đó nhé.

Khi Nào Nên Dùng Ultrathink?

Thật ra không phải lúc nào cũng phải bật ultrathink đâu. Thường thì mình chỉ kích hoạt nó trong mấy trường hợp sau:

Nên bật ultrathink khi:

Tái cấu trúc cả một module lớn, bắt buộc phải giữ tương thích ngược
Debug lỗi hệ thống mà log dài cả màn hình
Thiết kế mới kiến trúc microservices
Refactor code ảnh hưởng đến nhiều service
Nhờ Claude review và góp ý cải thiện một tài liệu thiết kế

Không cần ultrathink:

Fix lỗi nhỏ, lỗi cú pháp
Viết một hàm đơn giản
Hỏi giải thích thuật ngữ/khái niệm
Viết code mẫu (boilerplate)

Lý do thì đơn giản: ultrathink tốn thời gian và tiền (nếu tính theo token). Với những task đơn giản, việc bắt AI nghĩ thêm cũng không giúp đáp án tốt hơn, mà chỉ làm chậm tiến độ thôi.

Chi Phí Thực Tế

Mà nói đến đây thì cũng nên tính toán chi phí một chút. Theo bảng giá hiện tại của Claude:

think (~4K token): khoảng $0.06/tác vụ
megathink (~10K token): khoảng $0.15/tác vụ
ultrathink (~32K token): khoảng $0.48/tác vụ

Với dev làm dự án cá nhân hay startup nhỏ thì mức này coi như bỏ túi. Nhưng nếu chạy cho cả team hay tích hợp vào quy trình tự động hóa thì cũng nên tính kỹ lại.

Mình thường để mặc định mức “think” cho các task hàng ngày, chỉ nâng cấp khi thực sự cần độ chính xác cao.

Cập Nhật Mới: Suy Nghĩ Xen Kẽ Trong Claude 4

Với dòng Claude 4.5 (Sonnet và Opus), Anthropic còn tung thêm tính năng interleaved thinking - cho phép Claude xen kẽ việc suy nghĩ giữa các bước thực thi.

Trước đây, Claude chỉ nghĩ một lần ở đầu rồi lao vào làm hết. Giờ thì nó có thể linh hoạt hơn:

Đọc file → dừng lại suy ngẫm về nội dung
Chạy lệnh → phân tích kết quả trả về
Sửa code → cân nhắc tác động lan tỏa
Tiếp tục bước tiếp theo…

Với các task phức tạp, phải đọc nhiều file và chạy nhiều lệnh, tính năng này giúp Claude ra quyết định chính xác hơn ở từng bước. Mình thấy kết quả cuối cùng chuẩn xác hơn hẳn, ít khi bị “đi lạc” giữa chừng.

Cách Mình Hay Dùng

Chia sẻ luôn vài prompt mẫu mình hay xài trong Claude Code:

Khi cần thiết kế API:

Think hard about this API design. We need endpoints for user
management - consider REST conventions, error handling,
and pagination patterns.

Khi gỡ lỗi sự cố sản phẩm:

Ultrathink về lỗi này. Dịch vụ A hết thời gian chờ khi gọi Dịch vụ B,
nhưng Dịch vụ B kiểm tra sức khỏe vẫn thành công. Đây là nhật ký...

Khi tái cấu trúc code cũ:

Think deeply about how to refactor this module. Need to
maintain backward compatibility while improving testability.

Anh em có thể đặt từ khóa ở đầu, cuối hoặc xen giữa câu lệnh - Claude Code sẽ tự nhận diện và cấp phát ngân sách token tương ứng.

Tổng Kết

Suy nghĩ mở rộng là một tính năng rất hay - nhưng chỉ phát huy tác dụng đúng lúc đúng chỗ thôi nhé.

Nếu anh em dùng Claude Code: Thuần thục cách dùng think/megathink/ultrathink sẽ giúp nâng chất lượng kết quả lên đáng kể, nhất là với các task phức tạp.

Nếu anh em dùng web Claude.ai hoặc gọi API trực tiếp: Đừng tốn công gõ mấy từ khóa này, nó không ăn thua. Thay vào đó, hãy tập trung viết prompt rõ ràng, cung cấp đủ ngữ cảnh và trình bày yêu cầu mạch lạc.

Và nhớ kỹ nguyên tắc cốt lõi: không phải cứ AI nghĩ nhiều là kết quả sẽ tốt hơn. Hãy dùng đúng công cụ cho đúng task, và chỉ kích hoạt ultrathink cho những bài toán thực sự đáng giá.

Có gì thắc mắc hay muốn trao đổi thêm, anh em cứ comment bên dưới nhé. Mình sẽ cố gắng reply hết!

Tham khảo thêm: