Anthropic нещодавно оголосила про запуск нового AI-моделю Claude Mythos Preview, а також одночасно ініціювала план кіберзахисту під назвою «Project Glasswing». Оскільки здатність цієї моделі знаходити вразливості у програмному забезпеченні значно перевершує наявні на сьогодні технології, Anthropic вирішила поки що не публікувати її для загального доступу, а натомість надати ліцензію на використання, зокрема, 40 технологічним гігантам і компаніям інфраструктури, включно з Apple та Google, щоб не допустити, аби можливості моделі потрапили до рук зловмисників.
Anthropic представила Claude Mythos Preview, наділивши AI можливостями у сфері кібербезпеки
У повідомленні Claude Mythos Preview позиціонують як універсальний AI-модельний продукт, а її видатні можливості програмування та міркування забезпечують вражаючі результати у сфері кібербезпеки.
Anthropic зазначає, що протягом останніх кількох тижнів внутрішніх тестів Mythos Preview уже виявив у всіх основних операційних системах і в усіх основних браузерах тисячі ніколи раніше не помічених нульових днів (zero-day vulnerabilities), причому багато з них віднесені до категорії високого рівня небезпеки, а деякі вразливості навіть десятиліттями «ховались» у системах.
Серед одного з таких випадків — Mythos Preview повністю автономно ідентифікувала та використала віддалену вразливість у FreeBSD, яка існувала 17 років і дозволяє неуповноваженим особам з будь-якого місця в мережі отримати повний контроль над сервером.
Anthropic підкреслює, що станом на зараз, серед виявлених уразливостей понад 99% досі не були виправлені, тож неможливо оприлюднити відповідні деталі.
Project Glasswing: залатати діри по всьому світу раніше за атакувальників
Щоб можливості Mythos Preview працювали на захист, а не на атаку, Anthropic запустила план Project Glasswing. Назва проєкту походить від образу склянокрилої метеликової істоти — «склянокрила метелика», що символізує властивість вразливостей у програмному забезпеченні бути «тонкими та непомітними», наче крила метелика.
Ключові партнерські організації включають Amazon Web Services, Apple, Broadcom, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia тощо, а також 40 організацій, відповідальних за створення або підтримку критично важливої програмної інфраструктури, які отримали доступ до моделі.
Anthropic пообіцяла надати до 100 млн доларів США в рамках лімітів на використання моделі, щоб учасники могли безкоштовно застосовувати її на етапі досліджень з кібербезпеки, а також додатково пожертвувати 4 млн доларів США на користь відкритих (open-source) організацій безпеки, зокрема шляхом фінансування Alpha-Omega та OpenSSF через Linux Foundation, а також донатів Apache Software Foundation. Партнери поділяться результатами тестувань, щоб отримала користь вся індустрія технологій.
Дилема з двома лезами: чому Anthropic відмовляється оприлюднити реліз?
Керівник команди з кібербезпеки Anthropic Ньютон Ченг (Newton Cheng) чітко заявив, що не має наміру надавати Claude Mythos Preview у відкритий доступ для широкого загалу, оскільки побоюється потенційних ризиків атак:
Оскільки можливості AI продовжують швидко еволюціонувати, подібні потужні інструменти рано чи пізно поширяться серед зловмисників, і якщо це станеться, це матиме серйозний вплив на економіку, публічну та національну безпеку.
Керівник менеджменту продуктів досліджень Anthropic Діанн Пенн (Dianne Penn) зазначила, що наразі веде співпрацю та обговорення з урядом США, включно з Агентством з кібербезпеки та безпеки інфраструктури США (CISA) та Центром стандартів і інновацій у сфері AI тощо.
Варто зауважити, що час цього релізу припадає на період через кілька тижнів після спалаху суперечки між Anthropic і Міністерством оборони США щодо безпечного використання моделей Claude, і станом на зараз між сторонами досі триває юридичний спір.
(Anthropic подає до суду на Пентагон: чорні списки можуть призвести до втрат на десятки мільярдів доларів і завдати серйозної шкоди здатності залучати фінансування)
Dario Amodei: AI зробить кіберсвіт безпечнішим, але перехідний період сповнений викликів
Anthropic відверто визнає, що робота з захисту глобальної кіберінфраструктури може зайняти кілька років, а перехідний період також буде сповнений змінних факторів. Водночас компанія з обережним оптимізмом дивиться в довгострокову перспективу та очікує, що оборонні можливості AI врешті домінуватимуть і допоможуть створити безпечнішу екосистему програмного забезпечення.
Також Anthropic планує в найближчих серіях моделей Claude Opus першими впровадити механізми захисту для виведення (output) високого ризику, а після того, як технологія дозріє, поступово просувати масштабоване розгортання моделей рівня Mythos. Як зазначив генеральний директор компанії Dario Amodei у дописі в X:
Якщо ми зробимо все правильно, то матимемо шанс створити інтернет і світ, які будуть безпечнішими, ніж той світ, який з’явився б до виникнення атакувальних можливостей, керованих AI.
Ця стаття «Anthropic запускає глобальний план з кібербезпеки Glasswing: чому нова модель Mythos не віддається у вільний доступ?», вперше з’явилася на сайті «ABMedia» ланцюгових новин.