Claude Haiku 3 ngừng hoạt động ngày 19/4 — Hướng dẫn chuyển đổi trước khi API của bạn hỏng

Claude Haiku 3 ngừng chạy từ 19/4. Haiku 4.5 đắt gấp 4 lần. Hướng dẫn từng bước với so sánh giá và các lựa chọn thay thế.

Nếu app của bạn đang gọi API qua Claude Haiku 3, tính đến thời điểm này bạn chỉ còn 8 ngày nữa thôi là các request sẽ bắt đầu đổ lỗi. Anthropic chính thức tắt hoàn toàn model claude-3-haiku-20240307 vào ngày 19 tháng 4 năm 2026. Hết hạn là sập, không gia hạn, không có phương án dự phòng nào khác. Đơn giản là không dùng được nữa. Lộ trình lúc này chỉ có một: nâng cấp lên Claude Haiku 4.5. Model này mạnh hơn hẳn, nhưng giá cũng nhỉnh hơn gấp 4 lần. Bài này sẽ tổng hợp những gì bạn cần nắm để chuyển đổi mượt mà, vừa giữ app ổn định, vừa không ‘đỏ mắt’ vì hóa đơn API.


Chuyện gì đang xảy ra

Anthropic chạy theo một quy tắc tắt model chuẩn mực:

  1. Legacy — model vẫn chạy bình thường nhưng nhà phát triển không còn khuyến khích dùng
  2. Retired — model ngừng tiếp nhận hoàn toàn mọi request

Claude Haiku 3 đã nằm ở nhóm Legacy từ vài tháng nay. Sang ngày 19/4, nó sẽ chuyển hẳn sang Retired. Nghĩa là đoạn code nào còn giữ claude-3-haiku-20240307 làm tên model sẽ lập tức ‘đứt’ kết nối. Anthropic đã công bố lịch trình chi tiết trong tài liệu về việc ngừng hỗ trợ model. Nếu chưa xem, hãy tranh thủ 8 ngày còn lại để update ngay.

Claude Haiku là gì

Dành cho bạn nào chưa rành API: Claude Haiku là model nhanh nhất và rẻ nhất trong hệ sinh thái Anthropic. Có thể hình dung nó như “hạng phổ thông” trong gia đình Claude — không phải để đua tốc độ đỉnh cao, mà để chạy trơn tru, tiết kiệm.

Dev thường dùng Haiku cho những việc mà tốc độ phản hồi và chi phí quan trọng hơn độ ’thông minh’ vượt trội:

  • Chốt đơn, phân loại ticket hỗ trợ khách hàng
  • Cắt dữ liệu (extract) từ file PDF, hóa đơn
  • Tóm tắt văn bản ngắn gọn
  • Làm chatbot phản hồi nhanh, ít phức tạp
  • Xử lý số lượng lớn (batch processing) cùng lúc

Nói ngắn gọn, đây là model bạn chọn khi cần gọi API hàng nghìn lần mỗi giờ mà vẫn muốn giữ chi phí ở mức vừa túi tiền, không đụng hàng các model cao cấp.

Haiku 3 vs Haiku 4.5: Thay đổi gì

Đặc điểmHaiku 3Haiku 4.5
Giá input$0.25 / 1M token (~6.450 VNĐ)$1.00 / 1M token (~25.800 VNĐ)
Giá output$1.25 / 1M token (~32.250 VNĐ)$5.00 / 1M token (~129.000 VNĐ)
Max output4.096 token64.000 token
Cửa sổ ngữ cảnh200K token200K token
Tư duy mở rộngKhông
Sử dụng công cụCơ bảnNâng cao
Nhìn hình ảnh
Giá batchKhông có$0.50 / $2.50 mỗi 1M
Hiệu suấtTốt cho tác vụ đơn giảnChất lượng gần bằng Sonnet

Tóm lại: Giá có tăng gấp 4 lần, nhưng sức mạnh cũng nhảy vọt theo. Haiku 4.5 chỉ kém Sonnet khoảng 5 điểm phần trăm trên các bài benchmark, trong khi giá chỉ bằng 1/5 Sonnet. Đây là bước nâng cấp thực sự về chất, không phải kiểu “cắt giá rồi tăng giá” kiểu marketing. Quy đổi ra VNĐ: giá token đầu vào tăng từ khoảng 6.450 đồng lên 25.800 đồng, giá token đầu ra từ 32.250 đồng lên 129.000 đồng cho mỗi triệu token. Với anh em dev Việt, đây là con số tăng khá rõ rệt, nên cần tính toán kỹ.

Chuyển đổi từng bước

Bước 1: Tìm tất cả các tham chiếu Haiku 3

Dùng công cụ tìm kiếm trong toàn bộ codebase để quét qua các đoạn code cũ:

grep -r "claude-3-haiku" --include="*.py" --include="*.js" --include="*.ts" .

Mẹo nhanh: bạn chỉ cần search chuỗi claude-3-haiku-20240307.

Bước 2: Đổi model string

Thay chuỗi model cũ bằng tên mới: claude-haiku-4-5-20251001

# Trước
response = client.messages.create(
    model="claude-3-haiku-20240307",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Xin chào"}]
)

# Sau
response = client.messages.create(
    model="claude-haiku-4-5-20251001",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Xin chào"}]
)

Bước 3: Cập nhật các tham số

Model mới có một vài điểm thay đổi kỹ thuật quan trọng bạn cần lưu ý:

Temperature và top_p: Giờ đây bạn chỉ được phép dùng MỘT tham số trong hai cái, không thể set đồng thời cả hai. Nếu code hiện tại đang gán cả hai, hãy giữ lại một cái phù hợp nhất và xóa cái kia.

# Trước (Haiku 3 cho phép cả hai)
response = client.messages.create(
    model="claude-3-haiku-20240307",
    temperature=0.7,
    top_p=0.9,  # Xóa dòng này
    ...
)

# Sau (chọn một)
response = client.messages.create(
    model="claude-haiku-4-5-20251001",
    temperature=0.7,
    ...
)

Phiên bản công cụ (Tools): Nếu app của bạn đang tích hợp tools, nhớ cập nhật lên bản mới nhất:

  • text_editor_20250728
  • code_execution_20250825

Xử lý từ chối (Refusal): Haiku 4.5 có cơ chế an toàn chặt hơn, nên đôi khi nó sẽ trả về lý do dừng là refusal. Code của bạn cần bắt lỗi này và xử lý mượt mà, đừng để app báo lỗi ầm ĩ như khi gặp bug thông thường.

Giới hạn tốc độ (Rate limits): Model mới có ngưỡng gọi API riêng. Hãy vào Anthropic dashboard để kiểm tra lại giới hạn hiện tại của tài khoản bạn.

Bước 4: Test trước khi deploy

Tuyệt đối đừng vừa đổi tên model vừa đẩy thẳng lên production. Haiku 4.5 “thông minh” hơn hẳn, nên output nó sinh ra sẽ khác với bản cũ:

  • Độ dài câu trả lời có thể lên tới 64K token (so với 4K trước đây)
  • Một số request Haiku 3 vẫn trả lời, nhưng Haiku 4.5 có thể từ chối vì chính sách an toàn
  • Định dạng JSON trả về có thể lệch nhẹ, ảnh hưởng đến parser bên bạn
  • Khả năng gọi tool (tool calling) tinh vi hơn, đôi khi cần điều chỉnh prompt

Hãy chạy test suite đầy đủ. Nếu chưa có hệ thống test, ít nhất hãy thử nghiệm 10 API call thường xuyên nhất trong quy trình thực tế.

Bước 5: Tối ưu chi phí

Nói thẳng là tăng 4 lần giá khá “cháy ví”. Với anh em dev Việt, mức lương phổ biến khoảng 15-30 triệu/tháng, việc hóa đơn API vọt từ $50 (~1,3 triệu VNĐ) lên $200 (~5,2 triệu VNĐ) là một khoản chi đáng kể. Dưới đây là vài mẹo để giảm tối đa chi phí:

Dùng batch processing. Giá batch của Haiku 4.5 chỉ còn $0.50 / $2.50 cho mỗi triệu token (~12.900/64.500 VNĐ) — tức chỉ tăng gấp 2 lần so với Haiku 3 cũ, không phải 4 lần. Nếu task của bạn không cần kết quả ngay lập tức (chấp nhận xử lý bất đồng bộ, đợi tối đa 24h), bạn sẽ tiết kiệm được rất nhiều.

Cắt giảm token đầu vào. Model mới thông minh hơn, nên đôi khi bạn chỉ cần prompt ngắn gọn vẫn đạt kết quả tương đương. Hãy thử tinh gọn system prompt và loại bỏ các instruction thừa.

Tận dụng cache prefix. Nếu bạn gửi liên tục cùng một system prompt, tính năng prompt caching của Anthropic có thể giảm tới 90% chi phí token đầu vào.

Tính toán trên hóa đơn thực tế. Nếu trước đây bạn đóng $50/tháng (~1,3 triệu VNĐ) cho Haiku 3, thì mức $200/tháng (~5,2 triệu VNĐ) cho Haiku 4.5 có thể vẫn hợp lý nếu chất lượng tốt hơn giúp bạn tiết kiệm thời gian dev hoặc tăng trải nghiệm người dùng. Đừng chỉ nhìn vào giá mỗi token, hãy tính trên tổng hóa đơn và hiệu quả thực tế.

Có nên chuyển sang đối thủ?

Khi Haiku 3 sắp “già”, nhiều dev bắt đầu nhìn sang các đối thủ khác để cân nhắc:

ModelGiá InputGiá OutputTốt nhất cho
Claude Haiku 4.5$1.00 / 1M (~25.800 VNĐ)$5.00 / 1M (~129.000 VNĐ)Chất lượng tốt nhất tier này
GPT-4o Mini$0.15 / 1M (~3.870 VNĐ)$0.60 / 1M (~15.480 VNĐ)Tiết kiệm, chất lượng đủ dùng
Gemini 2.5 Flash$0.15 / 1M (~3.870 VNĐ)$0.60 / 1M (~15.480 VNĐ)Rẻ nhất, hệ sinh thái Google
Mistral Small 3.1$0.20 / 1M (~5.160 VNĐ)$0.60 / 1M (~15.480 VNĐ)EU hosting, open-weight

Với anh em dev Việt, GPT-4o Mini và Gemini 2.5 Flash ở mức giá đầu vào 3.870 VNĐ/triệu token là con số cực kỳ hấp dẫn — rẻ hơn Haiku 4.5 gần 7 lần. Nếu Haiku 3 trước đây chỉ đủ dùng cho task của bạn, hãy cân nhắc benchmark thử hai model này xem sao.

Gemini 2.5 Flash còn nổi bật ở cửa sổ ngữ cảnh 1 triệu token — gấp 5 lần so với 200K của Haiku 4.5 — với mức giá tương đương. Nếu công việc của bạn thường xuyên xử lý tài liệu dài, slide hay báo cáo tổng hợp, đây là lợi thế rất lớn.

Tuy nhiên, nếu bạn chọn Claude vì những ưu điểm riêng của nó — như khả năng tuân thủ prompt cực tốt, độ an toàn cao, và tư duy suy luận mạch lạc — thì Haiku 4.5 vẫn là lựa chọn tự nhiên nhất. Chất lượng nâng cấp ở đây là có thật.

Những gì không thể

Không có cơ chế chuyển đổi tự động. Anthropic sẽ không tự động “quăng” request Haiku 3 sang Haiku 4.5 cho bạn. Hết hạn là request sẽ lỗi ngay lập tức sau ngày 19/4.

Không có gói gia hạn. Không có tùy chọn nào để trả tiền tiếp tục dùng Haiku 3 sau ngày deadline.

Không đảm bảo output giống hệt nhau. Kết quả từ Haiku 4.5 sẽ khác so với Haiku 3. Nếu hệ thống bạn đang dựa vào việc so khớp chuỗi ký tự (string matching) hoặc parsing cứng nhắc, hãy chuẩn bị sẵn sàng để nới lỏng logic xử lý.

Điều này có nghĩa gì với bạn

Nếu Haiku 3 đang chạy production: Ưu tiên số 1 trong 8 ngày tới là update ngay. Đừng hẵng đợi đến ngày 18/4 mới lo. Test kỹ trước khi lên sóng. Hãy tính toán kỹ việc chấp nhận tăng giá 4 lần để đổi chất lượng, hoặc chuyển sang batch processing để chỉ tăng gấp đôi.

Nếu bạn đang cân nhắc chọn AI API: Vụ tắt Haiku 3 là một bài học thực tế về rủi ro vận hành. Mọi model AI hôm nay rồi cũng sẽ bị thay thế. Hãy thiết kế code sao cho việc thay đổi model trở nên nhàn tênh — dùng một biến config để trỏ tên model, tuyệt đối không hardcode tràn lan khắp codebase.

Nếu đang lên kế hoạch cho dự án mới dùng Claude: Hãy bắt đầu thẳng với Haiku 4.5. Đừng xây dựng nền tảng trên một model sắp bị khai tử. Đồng thời, hãy so sánh kỹ xem việc trả cao hơn để lấy chất lượng tốt hơn có thực sự cần thiết cho use case cụ thể của bạn so với GPT-4o Mini hay Gemini Flash hay không.

Nếu bạn chưa từng chạm vào AI API: Bài này không ảnh hưởng trực tiếp đến bạn, nhưng nó cho thấy tốc độ thay đổi của ngành AI nhanh đến mức nào. Công nghệ bạn học hôm nay có thể “già” chỉ trong 18 tháng. Hãy tập trung vào nền tảng: prompt engineering, pattern thiết kế API, và cách tích hợp tool — thay vì bám死死 vào tên của một model cụ thể.

Kết luận

Tóm lại, Claude Haiku 3 chính thức “nghỉ hưu” vào ngày 19/4. Bạn chỉ còn 8 ngày để hành động.

Việc thay đổi kỹ thuật thực ra khá đơn giản: sửa một tên model, cập nhật vài tham số config, và chạy lại test output. Khó khăn thực sự nằm ở quyết định kinh doanh: liệu mức tăng giá gấp 4 lần có xứng đáng với chất lượng mới, hay một đối thủ rẻ hơn sẽ phù hợp hơn với ngân sách và công việc hiện tại?

Đừng để nước đến chân mới nhảy. Việc thay đổi ồ ạt vào tối thứ Sáu hoặc đêm giao thừa là kịch bản kinh điển của mọi dự án. Hãy lên kế hoạch và xử lý bài bản ngay.


Muốn nâng tầm kỹ năng AI? Tham khảo khóa học Claude AI Hướng Dẫn để làm chủ toàn bộ hệ sinh thái Claude, hoặc AI API Tích Hợp để xây dựng hệ thống API production-ready một cách bài bản.


Nguồn tham khảo:

Build Real AI Skills

Step-by-step courses with quizzes and certificates for your resume