Anthropic Vô Tình Rò Rỉ Nguồn Code của Claude—Internet Sẽ Giữ Lại Mãi Mãi

Decrypt

Tóm tắt nhanh

  • Anthropic vô tình đã lộ 512.000 dòng mã của Claude Code thông qua rò rỉ source map.
  • Các yêu cầu gỡ bỏ theo DMCA thất bại vì bản sao (mirrors) và bản viết lại trong “phòng sạch” lan truyền ngay lập tức.
  • Các kho lưu trữ phi tập trung khiến việc rò rỉ trở nên gần như vĩnh viễn và không thể kiểm soát.

Anthropic không có ý định mã hoá mở (open-source) Claude Code. Nhưng vào hôm thứ Ba, công ty đã thực sự làm điều đó—và thậm chí không phải cả một đội ngũ luật sư cũng có thể đưa kem đánh răng ngược lại vào ống. Mọi thứ bắt đầu từ một tệp duy nhất. Phiên bản 2.1.88 của Claude Code, được đẩy lên registry npm vào những giờ đầu của sáng thứ Ba, kèm theo một source map JavaScript nặng 59.8MB—tệp gỡ lỗi có thể tái dựng lại mã gốc từ dạng đã nén. Các tệp này được tạo tự động và được cho là phải giữ riêng tư. Nhưng chỉ một dòng trong phần cài đặt “ignore” đã cho phép nó đi kèm với bản phát hành. Thực tập sinh và nhà nghiên cứu Chaofan Shou—người dường như nằm trong số những người đầu tiên phát hiện ra tệp—đã đăng một liên kết tải xuống lên X khoảng 4:23 a.m. ET, và theo dõi 16 triệu người đổ về chủ đề. Anthropic đã rút gói npm, nhưng internet đã kịp lưu trữ 512.000 dòng mã trên 1.900 tệp khác nhau tạo thành một phần lớn của dự án.

Claude code source code đã bị rò rỉ thông qua một tệp map trong registry npm của họ!

Code: https://t.co/jBiMoOzt8G pic.twitter.com/rYo5hbvEj8

— Chaofan Shou (@Fried_rice) March 31, 2026

“Ngay hôm nay, một bản phát hành của Claude Code có bao gồm một số mã nguồn nội bộ. Không có dữ liệu khách hàng nhạy cảm hoặc thông tin xác thực nào liên quan hoặc bị phơi bày,” phát ngôn viên của Anthropic nói với Decrypt. “Đây là một vấn đề đóng gói bản phát hành gây ra bởi lỗi con người, không phải sự cố vi phạm an ninh. Chúng tôi đang triển khai các biện pháp để ngăn chặn việc này xảy ra lần nữa.” Vụ rò rỉ phơi bày toàn bộ kiến trúc nội bộ của thứ mà có thể nói là một trong—nếu không phải là—tác nhân lập trình AI tinh vi nhất trên thị trường: điều phối LLM API, phối hợp đa tác nhân, logic phân quyền, các luồng OAuth, và 44 hidden feature flags (cờ tính năng ẩn) bao phủ các chức năng chưa được phát hành. Trong số những phát hiện có: Kairos, một daemon nền luôn bật dùng để lưu nhật ký bộ nhớ và thực hiện “giấc mơ” hằng đêm để hợp nhất tri thức. Và Buddy, một thú cưng AI theo kiểu Tamagotchi với 18 loài, các bậc hiếm, và các chỉ số bao gồm debugging (gỡ lỗi), patience (kiên nhẫn), chaos (hỗn loạn) và wisdom (thông thái). Có một bản xem trước dự kiến cho việc triển khai “Buddy” này—dường như được lên kế hoạch trong khoảng 1–7 tháng 4. Rồi còn có chi tiết khiến mọi người trên Hacker News bật cười khanh khách. Theo người rò rỉ Kuberwastaken, được chôn trong mã là “Undercover Mode”—một hệ thống con hoàn chỉnh được thiết kế để ngăn AI vô tình rò rỉ các tên mã nội bộ của Anthropic và tên dự án khi đóng góp vào các kho mã nguồn mở. Lệnh prompt (system prompt) được chèn vào ngữ cảnh của Claude thực sự nói: “Do not blow your cover.”

Có vẻ như Anthropic bắt đầu gửi các yêu cầu gỡ bỏ theo DMCA nhắm vào các bản mirror trên GitHub. Đó là lúc mọi thứ trở nên thú vị. Một nhà phát triển Hàn Quốc tên Sigrid Jin—được _Wall Street Journal _nêu trong đầu tháng này vì đã tiêu thụ 25 tỷ token Claude Code—đã thức dậy lúc 4 giờ sáng trước tin tức. Anh ngồi xuống, chuyển cốt lõi kiến trúc sang Python từ đầu bằng một công cụ điều phối AI tên oh-my-codex, và đẩy claw-code trước bình minh. Repo nhanh chóng đạt 30.000 sao GitHub hơn bất kỳ repo nào trong lịch sử. Về cơ bản, đó là bản dịch toàn bộ mã từ ngôn ngữ gốc sang Python, nên về mặt kỹ thuật không phải thứ tương tự, đúng không? Chúng ta sẽ để chuyện đó cho luật sư và các nhà triết học công nghệ. Lập luận pháp lý ở đây sắc bén. Gergely Orosz, người sáng lập bản tin The Pragmatic Engineer, đã lập luận trong một bài đăng trên X: “Hoặc là tuyệt vời hoặc là đáng sợ: Anthropic đã vô tình rò rỉ mã nguồn TS của Claude Code. Các repo chia sẻ nguồn sẽ bị gỡ xuống theo DMCA. NHƯNG repo này đã viết lại mã bằng Python, nên nó không vi phạm bản quyền nào & không thể bị gỡ xuống!” Đó là một bản viết lại trong “phòng sạch”. Một tác phẩm sáng tạo mới. Chống DMCA theo thiết kế.

Đây hoặc là tuyệt vời, hoặc là đáng sợ:

Anthropic đã vô tình rò rỉ mã nguồn TS của Claude Code (mã nguồn đóng). Các repo chia sẻ mã nguồn bị gỡ xuống theo DMCA.

NHƯNG repo này đã viết lại mã bằng Python, nên nó không vi phạm bản quyền nào & không thể bị gỡ xuống! pic.twitter.com/uSrCDgGCAZ

— Gergely Orosz (@GergelyOrosz) March 31, 2026

Khía cạnh bản quyền trở nên rắc rối hơn khi xét đến tình trạng pháp lý của các công việc do AI tạo ra, và tiêu chí bị làm cho mờ đi khi luật sư phải phán xét liệu nó có mang bản quyền tự động hay không. Tòa án DC Circuit đã giữ vững quan điểm đó vào tháng 3 năm 2025, và Tòa án Tối cao từ chối thụ lý vụ kiện.

Nếu các phần đáng kể của Claude Code được viết bởi chính Claude—điều mà CEO của Anthropic đã ngụ ý—thì cơ sở pháp lý cho bất kỳ yêu cầu bản quyền nào sẽ còn mù mờ hơn theo từng ngày. Phi tập trung tạo thêm một lớp “tính vĩnh cửu”. Tài khoản @gitlawb đã phản chiếu mã gốc sang Gitlawb, một nền tảng git phi tập trung, với một thông điệp đơn giản: “Sẽ không bao giờ bị gỡ xuống.” Bản gốc vẫn có thể truy cập ở đó. Một repo riêng biệt đã tổng hợp tất cả các system prompts nội bộ của Claude, điều mà các prompt engineer và những kẻ jailbreakers sẽ đánh giá cao vì nó mang lại thêm thông tin về cách Anthropic “điều kiện hoá” các mô hình của họ.

https://t.co/yCSEKer2tn

— GitLawb (@gitlawb) March 31, 2026

Điều này quan trọng vượt ra khỏi màn kịch. Các lệnh gỡ bỏ DMCA hoạt động chống lại các nền tảng tập trung. GitHub tuân thủ vì nó phải làm vậy. Hạ tầng phi tập trung—vốn vận hành Gitlawb, torrents, và chính cả tiền mã hoá—không có cùng một điểm lỗi duy nhất. Khi một công ty cố kéo thứ gì đó trở lại khỏi internet, câu hỏi duy nhất là có bao nhiêu bản mirror tồn tại và chúng nằm trên loại hạ tầng nào. Câu trả lời ở đây, trong vòng vài giờ, là: đủ nhiều.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận