Anthropic mới đây đã công bố ra mắt mô hình AI mới Claude Mythos Preview, đồng thời khởi động song song kế hoạch phòng thủ an ninh mạng mang tên “Project Glasswing”. Do khả năng của mô hình này trong việc phát hiện lỗ hổng phần mềm vượt xa công nghệ hiện có, Anthropic quyết định tạm thời không công khai phát hành rộng rãi ra bên ngoài, chỉ cấp quyền sử dụng cho 40 tập đoàn công nghệ và doanh nghiệp hạ tầng, bao gồm cả Apple và Google, nhằm ngăn chặn năng lực của mô hình rơi vào tay những kẻ xấu.
Anthropic ra mắt Claude Mythos Preview, trao năng lực an ninh mạng cho AI
Thông báo định vị Claude Mythos Preview là mô hình AI đa dụng. Với khả năng lập trình và năng lực suy luận xuất sắc, nó đã cho thấy những màn thể hiện đáng kinh ngạc trong lĩnh vực an ninh mạng.
Anthropic cho biết, trong các buổi thử nghiệm nội bộ diễn ra trong nhiều tuần qua, Mythos Preview đã phát hiện hàng nghìn lỗ hổng zero-day (lỗ hổng zero-day) chưa từng được nhận ra trước đây trên tất cả hệ điều hành phổ biến và các trình duyệt phổ biến. Trong đó, nhiều lỗ hổng được xếp ở mức độ nguy hiểm cao; một số lỗ hổng thậm chí đã âm thầm tồn tại trong hệ thống đến hàng chục năm.
Một trong những ví dụ là Mythos Preview đã hoàn toàn tự chủ nhận diện và khai thác một lỗ hổng thực thi mã từ xa tồn tại trong hệ điều hành FreeBSD suốt 17 năm. Lỗ hổng này có thể cho phép người không được ủy quyền chiếm quyền kiểm soát hoàn toàn máy chủ từ bất kỳ vị trí nào trên mạng.
Anthropic nhấn mạnh rằng, trong số các lỗ hổng được phát hiện hiện nay, hơn 99% vẫn chưa được khắc phục, vì vậy không thể công khai tiết lộ các chi tiết liên quan.
Project Glasswing: vá các hệ thống then chốt toàn cầu trước khi kẻ tấn công ra tay
Nhằm để năng lực của Mythos Preview phục vụ cho phòng thủ chứ không phải tấn công, Anthropic đã khởi động kế hoạch Project Glasswing. Tên kế hoạch được lấy cảm hứng từ hình ảnh con bướm cánh kính, tượng trưng cho đặc tính “mỏng và vô hình” của các lỗ hổng phần mềm, giống như cánh bướm.
Các đối tác hợp tác cốt lõi bao gồm Amazon Web Services, Apple, Broadcom, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia, v.v., cùng với 40 tổ chức chịu trách nhiệm xây dựng hoặc duy trì các hạ tầng phần mềm then chốt được cấp quyền truy cập mô hình.
Anthropic cam kết cung cấp hạn mức sử dụng mô hình lên tới 1 trăm triệu USD, để các doanh nghiệp tham gia có thể sử dụng miễn phí ở giai đoạn nghiên cứu an ninh mạng, đồng thời bổ sung quyên góp 4 triệu USD cho các tổ chức an ninh nguồn mở, bao gồm tài trợ thông qua Linux Foundation cho Alpha-Omega và OpenSSF, cũng như quyên góp cho Quỹ phần mềm Apache. Các đối tác sẽ chia sẻ kết quả thử nghiệm, nhằm giúp cả ngành công nghệ được hưởng lợi.
Bài toán con dao hai lưỡi: vì sao Anthropic từ chối công khai phát hành?
Trưởng nhóm an ninh mạng của Anthropic, Newton Cheng, khẳng định rõ rằng không có ý định mở Claude Mythos Preview cho công chúng sử dụng. Lý do là ông lo ngại về rủi ro tấn công tiềm ẩn:
Khi năng lực AI tiếp tục phát triển nhanh chóng, các công cụ mạnh tương tự sớm muộn gì cũng sẽ lan sang tay những kẻ thực hiện hành vi xấu. Chỉ cần điều đó xảy ra, nó sẽ gây ảnh hưởng nghiêm trọng đến kinh tế, an ninh công cộng và an ninh quốc gia.
Trưởng bộ phận quản lý sản phẩm nghiên cứu của Anthropic, Dianne Penn, cho biết bà đang hợp tác thảo luận với chính phủ Mỹ, bao gồm Cơ quan an ninh mạng và hạ tầng (CISA) của Mỹ, cũng như các tổ chức như Trung tâm tiêu chuẩn và đổi mới AI.
Cần lưu ý rằng thời điểm lần này diễn ra đúng vài tuần sau khi xảy ra tranh cãi về cách sử dụng an toàn đối với các mô hình Claude giữa Anthropic và Bộ Quốc phòng Mỹ. Cho đến nay, hai bên vẫn còn vướng trong tranh chấp pháp lý.
(Anthropic kiện Lầu Năm Góc: cấm khỏi danh sách đen có thể dẫn tới thiệt hại hàng chục tỷ USD, đồng thời làm suy yếu nghiêm trọng năng lực huy động vốn)
Dario Amodei: AI sẽ khiến thế giới mạng an toàn hơn, nhưng giai đoạn chuyển tiếp đầy thách thức
Anthropic thừa nhận rằng việc bảo vệ hạ tầng mạng toàn cầu có thể cần vài năm, và giai đoạn chuyển tiếp cũng sẽ đầy biến số. Tuy nhiên, công ty vẫn giữ thái độ thận trọng lạc quan về triển vọng dài hạn, dự đoán rằng năng lực phòng thủ của AI cuối cùng sẽ giành vị trí chủ đạo, từ đó hỗ trợ xây dựng một hệ sinh thái phần mềm an toàn hơn.
Anthropic cũng có kế hoạch đưa trước các cơ chế phòng vệ an ninh mạng đối với các đầu ra có rủi ro cao vào dòng mô hình Claude Opus sắp được ra mắt. Sau khi công nghệ trưởng thành, công ty sẽ từng bước thúc đẩy việc triển khai quy mô lớn các mô hình cấp Mythos. Như giám đốc điều hành Dario Amodei của công ty đã nói trên X:
Nếu chúng ta làm đúng, thì chúng ta có cơ hội tạo dựng một internet và một thế giới an toàn hơn, so với thời điểm mà năng lực tấn công mạng do AI dẫn dắt bắt đầu xuất hiện.
Bài viết này: Anthropic ra mắt kế hoạch an ninh mạng toàn cầu Glasswing, vì sao mô hình mới Mythos không mở cho công chúng sử dụng? Lần đầu xuất hiện tại Chuỗi tin ABMedia.