Claude Haiku 3 ngừng hoạt động ngày 19/4 — Hướng dẫn chuyển đổi trước khi API của bạn hỏng

Claude Haiku 3 ngừng chạy từ 19/4. Haiku 4.5 đắt gấp 4 lần. Hướng dẫn từng bước với so sánh giá và các lựa chọn thay thế.

Nếu bạn đang dùng Claude Haiku 3 trong app, còn 8 ngày nữa là các API call sẽ bắt đầu lỗi.

Anthropic sẽ ngừng claude-3-haiku-20240307 vào ngày 19 tháng 4 năm 2026. Sau ngày đó, mọi request đến model này đều trả về lỗi. Không có thời gian gia hạn. Không có fallback. Đơn giản là hỏng.

Đường đi chuyển là Claude Haiku 4.5 — một model mạnh hơn nhiều nhưng cũng đắt gấp 4 lần. Đây là tất cả những gì bạn cần biết để chuyển đổi mà không làm hỏng app hay phá vỡ ngân sách.


Chuyện gì đang xảy ra

Anthropic theo một chu kỳ ngừng hỗ trợ chuẩn:

  1. Legacy — model vẫn hoạt động nhưng không còn được khuyến dùng
  2. Retired — model ngừng nhận request hoàn toàn

Claude Haiku 3 đã ở trạng thái legacy từ mấy tháng trước. Ngày 19/4, nó sẽ chuyển sang retired. Code của bạn dùng claude-3-haiku-20240307 làm model string sẽ ngừng hoạt động.

Anthropic đã công bố lịch trình trong tài liệu về việc ngừng hỗ trợ model. Nếu bạn bỏ lỡ, còn 8 ngày để chuyển đổi.

Claude Haiku là gì

Cho những ai chưa dùng API: Claude Haiku là model nhanh nhất và rẻ nhất của Anthropic. Giống như “hạng phổ thông” trong gia đình Claude vậy.

Các lập trình viên dùng nó cho những tác vụ mà tốc độ và chi phí quan trọng hơn trí thông minh tối đa:

  • Phân loại ticket hỗ trợ khách hàng
  • Trích xuất dữ liệu từ tài liệu
  • Tạo tóm tắt ngắn
  • Chatbot với phản hồi nhanh
  • Xử lý batch khối lượng lớn

Đây là model bạn dùng khi thực hiện hàng nghìn API call mỗi giờ mà không đủ tiền cho các model premium.

Haiku 3 vs Haiku 4.5: Thay đổi gì

Đặc điểmHaiku 3Haiku 4.5
Giá input$0.25 / 1M token (~6.450 VNĐ)$1.00 / 1M token (~25.800 VNĐ)
Giá output$1.25 / 1M token (~32.250 VNĐ)$5.00 / 1M token (~129.000 VNĐ)
Max output4.096 token64.000 token
Cửa sổ ngữ cảnh200K token200K token
Tư duy mở rộngKhông
Sử dụng công cụCơ bảnNâng cao
Nhìn hình ảnh
Giá batchKhông có$0.50 / $2.50 mỗi 1M
Hiệu suấtTốt cho tác vụ đơn giảnChất lượng gần bằng Sonnet

Tóm tắt: Đắt gấp 4 lần, nhưng mạnh hơn đáng kể. Haiku 4.5 chỉ chênh 5 điểm phần trăm so với Sonnet trên nhiều benchmark — với chỉ 1/5 giá của Sonnet. Đây là upgrade thực sự, không chỉ tăng giá.

Tính bằng VNĐ: giá input từ khoảng 6.450 đồng lên 25.800 đồng, giá output từ 32.250 đồng lên 129.000 đồng cho mỗi triệu token. Với developer Việt Nam, đây là một khoản tăng đáng kể.

Chuyển đổi từng bước

Bước 1: Tìm tất cả các tham chiếu Haiku 3

Tìm trong codebase bằng model string cũ:

grep -r "claude-3-haiku" --include="*.py" --include="*.js" --include="*.ts" .

Bạn đang tìm: claude-3-haiku-20240307

Bước 2: Đổi model string

Thay thế bằng: claude-haiku-4-5-20251001

# Trước
response = client.messages.create(
    model="claude-3-haiku-20240307",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Xin chào"}]
)

# Sau
response = client.messages.create(
    model="claude-haiku-4-5-20251001",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Xin chào"}]
)

Bước 3: Cập nhật các tham số

Haiku 4.5 có một số thay đổi quan trọng:

Temperature và top_p: Bây giờ chỉ dùng được MỘT trong hai, không dùng cả hai. Nếu code của bạn set cả hai, xóa bớt một cái.

# Trước (Haiku 3 cho phép cả hai)
response = client.messages.create(
    model="claude-3-haiku-20240307",
    temperature=0.7,
    top_p=0.9,  # Xóa dòng này
    ...
)

# Sau (chọn một)
response = client.messages.create(
    model="claude-haiku-4-5-20251001",
    temperature=0.7,
    ...
)

Phiên bản công cụ: Nếu dùng tools, cập nhật lên phiên bản mới nhất:

  • text_editor_20250728
  • code_execution_20250825

Xử lý từ chối: Haiku 4.5 có thể trả về stop reason là refusal. Code của bạn nên xử lý điều này một cách ổn hòa thay vì coi là lỗi.

Rate limits: Haiku 4.5 có rate limits riêng. Kiểm tra giới hạn của bạn trên Anthropic dashboard.

Bước 4: Test trước khi deploy

Đừng chỉ đổi model string rồi push lên production. Haiku 4.5 thông minh hơn, nghĩa là câu trả lời có thể khác:

  • Câu trả lời có thể dài hơn (max 64K vs 4K)
  • Có thể từ chối request mà Haiku 3 sẽ trả lời
  • Định dạng JSON output có thể thay đổi nhẹ
  • Tool calling tinh vi hơn

Chạy test suite. Nếu không có, test thử 10 API call thường dùng nhất.

Bước 5: Tối ưu chi phí

Tăng giá 4 lần là đau. Với developer Việt Nam, nơi lương trung bình của lập trình viên khoảng 15-30 triệu/tháng, việc API bill tăng từ $50 (~1,3 triệu VNĐ) lên $200 (~5,2 triệu VNĐ) là một phần đáng kể trong thu nhập. Đây là cách giảm thiểu:

Dùng batch processing. Giá batch của Haiku 4.5 là $0.50 / $2.50 mỗi triệu token (~12.900/64.500 VNĐ) — chỉ gấp 2 lần giá Haiku 3 cũ, không phải 4 lần. Nếu workload của bạn chấp nhận xử lý bất đồng bộ (kết quả trong vòng 24 giờ), tiết kiệm được nhiều.

Giảm token sử dụng. Haiku 4.5 thông minh hơn nên nhiều khi prompt ngắn hơn vẫn cho kết quả tương tự. Thử cắt ngắn system prompt.

Cache các prefix chung. Nếu gửi cùng system prompt liên tục, prompt caching có thể giảm chi phí input đến 90%.

Tính chi phí thực tế. Nếu đang trả $50/tháng (~1,3 triệu VNĐ) cho Haiku 3, $200/tháng (~5,2 triệu VNĐ) cho Haiku 4.5 có thể đáng với chất lượng nâng cấp. Tính toán từ hóa đơn thực, không phải giá mỗi token.

Có nên chuyển sang đối thủ?

Với Haiku 3 sắp hết, một số developer đang đánh giá các lựa chọn thay thế:

ModelGiá InputGiá OutputTốt nhất cho
Claude Haiku 4.5$1.00 / 1M (~25.800 VNĐ)$5.00 / 1M (~129.000 VNĐ)Chất lượng tốt nhất tier này
GPT-4o Mini$0.15 / 1M (~3.870 VNĐ)$0.60 / 1M (~15.480 VNĐ)Tiết kiệm, chất lượng đủ dùng
Gemini 2.5 Flash$0.15 / 1M (~3.870 VNĐ)$0.60 / 1M (~15.480 VNĐ)Rẻ nhất, hệ sinh thái Google
Mistral Small 3.1$0.20 / 1M (~5.160 VNĐ)$0.60 / 1M (~15.480 VNĐ)EU hosting, open-weight

Với dev Việt Nam, GPT-4o Mini và Gemini 2.5 Flash ở mức 3.870 VNĐ/triệu token input là cực kỳ hấp dẫn — rẻ hơn Haiku 4.5 gần 7 lần. Nếu Haiku 3 trước đó “đủ xài” cho use case của bạn, nên test thử hai model này nghiêm túc.

Gemini 2.5 Flash còn có ưu điểm là cửa sổ ngữ cảnh 1 triệu token — gấp 5 lần so với 200K của Haiku 4.5 — ở cùng mức giá. Nếu bạn cần xử lý tài liệu dài, đây là lợi thế đáng kể.

Nhưng nếu bạn chọn Haiku vì các thế mạnh riêng của Claude — theo sát chỉ dẫn, an toàn, suy luận tinh tế — thì Haiku 4.5 là bước đi tự nhiên. Chất lượng nâng cấp là thật.

Những gì không thể

Không có chuyển đổi tự động. Anthropic sẽ không âm thầm chuyển các call Haiku 3 sang Haiku 4.5. Request của bạn sẽ đơn giản thất bại sau ngày 19/4.

Không có hỗ trợ kéo dài. Không có tùy chọn trả tiền để tiếp tục dùng Haiku 3 sau deadline.

Không đảm bảo tương thích ngược. Câu trả lời của Haiku 4.5 có thể khác với Haiku 3. Nếu bạn đang làm string matching trên output, chuẩn bị cập nhật logic parsing.

Điều này có nghĩa gì với bạn

Nếu bạn có Haiku 3 trong production: Đây là ưu tiên số 1 trong 8 ngày tới. Chuyển đổi ngay bây giờ, đừng đợi đến ngày 18/4. Test kỹ lưỡng. Tính toán cho việc tăng giá 4 lần — hoặc chuyển sang batch processing để chỉ tăng 2 lần.

Nếu bạn đang chọn giữa các AI API: Việc ngừng Haiku 3 cho thấy việc ngừng hỗ trợ model là rủi ro vận hành thực sự. Bất kỳ model nào bạn xây dựng hôm nay cũng sẽ bị ngừng một ngày. Thiết kế code để việc đổi model dễ dàng — dùng config variable cho model string, không hardcode khắp codebase.

Nếu bạn đang đánh giá Claude cho dự án mới: Bắt đầu thẳng với Haiku 4.5. Đừng xây trên model sắp bị ngừng. Và xem xét liệu chất lượng tốt hơn có xứng đáng với chi phí so với GPT-4o Mini hay Gemini Flash cho use case cụ thể của bạn.

Nếu bạn chưa bao giờ dùng AI API: Không ảnh hưởng trực tiếp, nhưng nó cho thấy thế giới AI đi chuyển nhanh thế nào. Model bạn học hôm nay có thể biến mất trong 18 tháng. Tập trung vào các khái niệm — prompt engineering, API patterns, sử dụng công cụ — không phải tên model cụ thể.

Kết luận

Claude Haiku 3 chết vào ngày 19/4. Bạn còn 8 ngày.

Bản thân việc chuyển đổi khá đơn giản — đổi một model string, cập nhật vài tham số, test output. Quyết định khó hơn là liệu tăng giá 4 lần có xứng với chất lượng nâng cấp hay không, hay một lựa chọn rẻ hơn phù hợp với use case của bạn hơn.

Đừng để chậm trễ. Chuyển đổi hoảng loạn vào tối thứ Sáu không phải là ý tưởng hay của bất kỳ ai.


Muốn nâng cao kỹ năng AI? Khóa học Claude AI Hướng Dẫn của chúng tôi giúp bạn làm chủ hệ sinh thái Claude, và AI API Tích Hợp dạy bạn cách xây dựng hệ thống API thực tế.


Nguồn tham khảo:

Build Real AI Skills

Step-by-step courses with quizzes and certificates for your resume