Theo 1M AI News, một nhà phát triển đã dùng Ghidra, proxy MITM và radare2 để phân tích ngược tệp nhị phân bản cài đặt độc lập của Claude Code có dung lượng 228MB và phát hiện hai lỗi bộ nhớ đệm riêng biệt. Hai lỗi này có thể làm tăng chi phí API lên 10–20 lần mà người dùng không hề hay biết. Phân tích liên quan đã được gửi lên GitHub (issue #40524), và Anthropic đánh dấu là lỗi hồi quy (regression) rồi phân công xử lý.
Bug đầu tiên nằm trong runtime Bun tùy chỉnh được dùng cho bản cài đặt độc lập. Mỗi khi thực hiện yêu cầu API, runtime sẽ tìm một định danh tính phí trong phần body của yêu cầu và thay thế nó, nhưng logic thay thế lại khớp vào mục đầu tiên phù hợp trong phần body. Nếu lịch sử hội thoại tình cờ chứa chuỗi đó (ví dụ: cuộc thảo luận về cơ chế tính phí nội bộ của Claude Code), thì phần thay thế sẽ khớp vào nội dung tin nhắn thay vì lời nhắc hệ thống, khiến mỗi lần yêu cầu đều kích hoạt việc xây dựng lại toàn bộ bộ nhớ đệm. Cách né tạm thời là chuyển sang chạy bằng npx @anthropic-ai/claude-code; phiên bản gói npm không chứa đoạn logic thay thế này.
Bug thứ hai ảnh hưởng đến tất cả người dùng khôi phục hội thoại bằng --resume hoặc --continue, được đưa vào từ v2.1.69. Khi khôi phục hội thoại, vị trí chèn thông tin bổ sung của hệ thống khác với hội thoại mới, dẫn đến tiền tố bộ nhớ đệm không khớp hoàn toàn: toàn bộ lịch sử hội thoại sẽ chuyển từ đọc từ bộ nhớ đệm sang ghi lại toàn bộ. Các vòng sau khi khôi phục hoạt động bình thường, nhưng bản thân thao tác khôi phục đã tạo ra nhiều chi phí bổ sung; hiện tại không có phương án né tránh từ bên ngoài.
Nhà phát triển ước tính rằng, với một cuộc hội thoại dài khoảng 50 vạn token, Bug 1 sẽ làm tiêu tốn thêm khoảng 0,04 USD mỗi lần yêu cầu, và Bug 2 làm tiêu tốn thêm khoảng 0,15 USD mỗi lần khôi phục. Cộng dồn lại, chi phí cho một lần yêu cầu có thể vượt 0,20 USD. Trước đó, kỹ sư của Anthropic là Lydia Hallie đã xác nhận tốc độ người dùng chạm ngưỡng giới hạn sử dụng “nhanh hơn nhiều so với dự kiến”. Trong khu bình luận Reddit, nhiều người dùng cho rằng hai lỗi bộ nhớ đệm này có thể là một trong những nguyên nhân cốt lõi gây ra mức tiêu hao bất thường về dung lượng sử dụng.