GPT-5.5 của OpenAI Sánh Vai Với Claude Mythos Trong Khả Năng Tấn Công Mạng: Viện An Ninh AI

Tóm tắt ngắn gọn

  • GPT-5.5 có thể tự động thực hiện các cuộc tấn công mạng tinh vi, hoàn thành một mô phỏng mạng doanh nghiệp gồm 32 bước và phá vỡ một câu đố an ninh kéo dài 12 giờ chỉ trong 10 phút.
  • Khả năng tấn công AI đang ngày càng cải thiện nhanh chóng trên các nhà phát triển, với cảnh báo của AISI rằng các bước tiến xa hơn có thể đến trong thời gian ngắn.
  • Các nhà nghiên cứu đã phát hiện ra một lỗ hổng jailbreak hoàn toàn vượt qua các rào cản an toàn của GPT-5.5, gây lo ngại.

Một cơ quan chính phủ Vương quốc Anh đã phát hiện ra rằng mô hình trí tuệ nhân tạo mới nhất của OpenAI có thể tự động thực hiện các cuộc tấn công mạng phức tạp—và nó đã phá vỡ một thử thách đảo ngược trong chưa đầy 10 phút, trong khi một chuyên gia an ninh con người mất khoảng 12 giờ. Viện An ninh AI (AISI), một tổ chức nghiên cứu thuộc Bộ Khoa học, Đổi mới và Công nghệ của Anh, đã công bố kết quả vào thứ Năm cho thấy GPT-5.5 nằm trong số các mô hình mạnh nhất mà họ đã đánh giá về khả năng tấn công mạng, gần như ngang bằng với Claude Mythos của Anthropic. Báo cáo cho biết GPT-5.5 là mô hình thứ hai hoàn thành thử thách khó nhất của AISI—một cuộc tấn công mô phỏng mạng doanh nghiệp gồm 32 bước gọi là “The Last Ones”—tự động trong hai lần trong 10 lần thử. Mô hình đầu tiên đạt thành tích này là Claude Mythos Preview của Anthropic, hoàn thành mô phỏng trong ba lần trong 10 lần thử.

Mô phỏng mạng doanh nghiệp, được xây dựng cùng công ty an ninh mạng SpecterOps, yêu cầu một tác nhân kết nối các bước trinh sát, đánh cắp thông tin xác thực, di chuyển ngang qua nhiều rừng Active Directory, một bước chuyển đổi chuỗi cung ứng qua pipeline CI/CD, và cuối cùng là rút trích dữ liệu từ một cơ sở dữ liệu nội bộ được bảo vệ—các bước mà AISI ước tính một chuyên gia con người sẽ mất khoảng 20 giờ để hoàn thành.  Có lẽ kết quả ấn tượng nhất là một câu đố đảo ngược cực kỳ khó khăn. GPT-5.5 đã giải quyết thử thách—đòi hỏi phải tái tạo bộ lệnh của một máy ảo tùy chỉnh, viết một trình phân tích mã từ đầu, và khôi phục mật khẩu mã hóa thông qua giải pháp ràng buộc—in 10 phút 22 giây, với chi phí 1,73 đô la trong việc sử dụng API. Một chuyên gia con người, sử dụng các công cụ chuyên nghiệp, cần khoảng 12 giờ. Trong loạt nhiệm vụ an ninh mạng nâng cao của AISI, GPT-5.5 đạt tỷ lệ thành công trung bình 71,4% trong cấp độ “Chuyên gia” khó nhất, vượt xa Mythos Preview với 68,6% và vượt trội rõ rệt so với GPT-5.4 với 52,4%.

Các phát hiện này mang ý nghĩa rõ ràng về hướng phát triển của AI. AISI kết luận rằng hiệu suất của GPT-5.5 cho thấy sự cải thiện nhanh chóng về khả năng tấn công mạng có thể là một xu hướng chung thay vì một bước đột phá riêng lẻ—và cảnh báo rằng nếu kỹ năng tấn công mạng có thể xuất hiện như một sản phẩm phụ của sự tiến bộ trong lý luận, lập trình và hoàn thành nhiệm vụ tự động, thì các bước tiến xa hơn có thể đến trong thời gian ngắn. Báo cáo cũng nêu lên những lo ngại đáng kể về các rào cản an toàn của mô hình. Các nhà nghiên cứu đã xác định một lỗ hổng jailbreak phổ quát kích hoạt nội dung có hại trong tất cả các truy vấn tấn công mạng độc hại đã thử nghiệm, kể cả trong các thiết lập đa vòng. Cuộc tấn công này mất sáu giờ đội đỏ thử nghiệm để phát triển. OpenAI sau đó đã cập nhật hệ thống bảo vệ của mình, mặc dù một vấn đề cấu hình đã ngăn AISI xác minh xem phiên bản cuối cùng có hiệu quả hay không. AISI cảnh báo rằng các đánh giá khả năng của họ được thực hiện trong môi trường nghiên cứu có kiểm soát và không nhất thiết phản ánh những gì người dùng bình thường có thể truy cập, lưu ý rằng các triển khai công khai bao gồm các biện pháp bảo vệ và kiểm soát truy cập bổ sung. Báo cáo này diễn ra trong bối cảnh lo ngại về an ninh mạng của Anh. Khảo sát An ninh Mạng Hàng năm của chính phủ Vương quốc Anh, cũng được công bố vào thứ Năm, cho thấy 43% doanh nghiệp đã gặp phải một cuộc tấn công hoặc vi phạm an ninh mạng trong 12 tháng qua. Để đối phó, chính phủ đã công bố 90 triệu bảng Anh trong khoản tài trợ mới nhằm nâng cao khả năng phòng thủ mạng, và cho biết đang tiến hành dự luật An ninh Mạng và Khả năng chống chịu để bảo vệ các dịch vụ thiết yếu. Các quan chức cũng đã công bố hướng dẫn khuyến khích các tổ chức chuẩn bị cho sự gia tăng tiềm năng của các lỗ hổng phần mềm mới được phát hiện khi AI thúc đẩy tốc độ phát hiện và sử dụng các lỗ hổng bảo mật.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim