Một nhà phát triển phát hiện 2 lỗi cache trong Claude Code bản cài độc lập có thể làm chi phí API tăng 10–20 lần mà người dùng không biết.
Vụ việc đến từ quá trình reverse-engineer file nhị phân 228MB bằng Ghidra, MITM proxy và radare2; báo cáo đã được gửi lên GitHub (issue #40524) và được Anthropic gắn cờ là lỗi hồi quy, đã phân công xử lý.
- 2 lỗi cache có thể đẩy chi phí API tăng 10–20 lần.
- Lỗi 1: logic thay thế định danh tính phí khiến cache bị rebuild mỗi request.
- Lỗi 2: v2.1.69 làm sai prefix cache khi dùng –resume/–continue.
Hai lỗi cache gây đội chi phí API
Một phân tích kỹ thuật cho thấy Claude Code standalone có hai lỗi cache độc lập, có thể khiến API bị tính phí tăng 10–20 lần do cơ chế cache hoạt động sai và bị kích hoạt lại liên tục.
Nhà phát triển đã reverse-engineer file nhị phân 228MB của trình cài Claude Code dạng standalone, sử dụng Ghidra, MITM proxy và radare2. Kết quả được gửi lên GitHub với mã issue #40524. Anthropic đã đánh dấu đây là lỗi hồi quy (regression) và đưa vào quy trình xử lý.
Trước đó, các kỹ sư của Anthropic từng xác nhận tình trạng giới hạn sử dụng của người dùng bị chạm tới nhanh hơn nhiều so với dự kiến, phù hợp với giả thuyết cache không phát huy tác dụng, làm tăng số lần gọi API thực tế.
Chi tiết lỗi 1 và lỗi 2 trong runtime và chế độ tiếp tục phiên
Lỗi 1 nằm ở custom Bun runtime của bản standalone; lỗi 2 xuất hiện với người dùng dùng cờ –resume hoặc –continue và được giới thiệu từ phiên bản v2.1.69.
Với lỗi thứ nhất, logic thay thế định danh tính phí (billing identifier) bị sai, dẫn tới việc mỗi request đều kích hoạt rebuild toàn bộ cache. Điều này có thể làm mất lợi ích của cache và khiến các thao tác vốn có thể đọc từ cache lại trở thành các lượt xử lý/gọi API mới.
Với lỗi thứ hai, khi người dùng tiếp tục phiên bằng –resume hoặc –continue, xảy ra mismatch tiền tố cache (cache prefix mismatch). Thay vì đọc từ cache, hệ thống ghi lại toàn bộ lịch sử hội thoại, làm tăng khối lượng xử lý lặp và kéo theo khả năng tăng mạnh chi phí API trong quá trình sử dụng.





