Непокритий релізом попередній огляд Claude Mythos від Anthropic автономно ідентифікував тисячі високосерйозних уразливостей нульового дня в усіх основних операційних системах і веббраузерах, спонукавши компанію запустити Project Glasswing — оборонну коаліцію з кібербезпеки, підкріплену до $100 мільйона кредитів на використання ШІ.
Ключові висновки:
Модель, яку Anthropic описує як найбільше одиночне підсилення можливостей у фронтирному ШІ за всю історію, завершила тренування й була оголошена публічно 7 квітня 2026 року після того, як у кінці березня спливли внутрішні деталі через неправильно налаштовану систему керування контентом, що розкрила приблизно 3,000 внутрішніх файлів.
Anthropic не випускає попередній огляд Claude Mythos для публіки та не надає його через свій загальний API. Компанія обмежила доступ перевіреною групою партнерів після того, як модель продемонструвала, що здатна знаходити й експлуатувати невідомі програмні вади зі швидкістю та масштабом, які випереджають і людських експертів, і попередні ШІ-системи.
На бенчмарках з кібербезпеки розрив між Mythos і Claude Opus 4.6 складно ігнорувати. Mythos набрав 83,1% у Cybergym проти 66,6% для Opus 4.6, а також 93,9% проти 80,8% на SWE-bench Verified. На SWE-bench Pro він показав 77,8% проти 53,4% — різниця в 24 пункти. Він набрав 56,8% на Humanity’s Last Exam без інструментів порівняно з 40,0% у свого попередника.
Моделі не потрібне спеціалізоване тренування з кібербезпеки, щоб знаходити ці баги. Її приріст походить від ширших досягнень у міркуванні, плануванні в кілька етапів і автономній agentic-поведінці. За наявності цільової кодової бази в ізольованому контейнері вона читає вихідний код, формує гіпотези щодо вад безпеки пам’яті, компілює та запускає програмне забезпечення, використовує відладчики на кшталт Address Sanitizer, ранжує файли за імовірністю уразливості та формує валідовані звіти про баги з робочими proof-of-concept експлойтами.
Деякі з цих експлойтів вимагали майже ніякого людського керівництва. Tomshardware.com повідомляє, що уразливість OpenBSD TCP SACK 27-річної давності — тонке переповнення цілого, яке дозволяє атакувальнику віддалено спричинити аварійне завершення будь-якого хоста, що відповідає, шляхом створення шкідливих пакетів — була знайдена автономно після приблизно 1,000 запусків із загальною вартістю менш ніж $20,000. Баг FFmpeg H.264 16-річної давності пройшов більше ніж п’ять мільйонів автоматизованих тестів і кілька аудитів, перш ніж Mythos зловив його.
Результати для браузерів привернули особливу увагу. Під час тестування JavaScript-движка Firefox 147 Mythos створив 181 повний shell-експлойт і 29 випадків керування регістрами. Claude Opus 4.6 створив два shell-експлойти в рамках того самого набору тестів. Також модель побудувала робочі ланцюжки підвищення привілеїв ядра Linux — від користувача до root на серверах — після відфільтрування 100 останніх CVE до 40 кандидатів, які можна експлуатувати, і успішної експлуатації більш ніж половини з них.
Людські валідатори переглянули 198 звітів моделі про вразливості й погодилися з її оцінками серйозності 89% часу, при цьому 98% погодження було в межах одного рівня серйозності.
Поки що менш ніж 1% із визначених багів повністю виправлено. Anthropic координує відповідальне розкриття, публікує криптографічні commitments SHA-3 для невиправлених проблем і дотримується таймлайну 90-plus-45 днів перед публікацією повних деталей. Баг віддаленого виконання коду на сервері FreeBSD NFS CVE-2026-4747, якому 17 років і який надає повний необмежений (unauthenticated) доступ root, є серед названих прикладів, які вже фігурують у disclosure.

Project Glasswing, оголошений разом із моделлю, — це спроба Anthropic спрямувати ці можливості на захист, перш ніж подібні інструменти стануть широко доступними. Партнерами-засновниками є Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia та Palo Alto Networks. Доступ розширюють для більш ніж 40 додаткових критичних організацій у сфері програмного забезпечення.
Компанія зобов’язалася виділити $4 мільйона на безпекові пожертви з відкритим кодом: $2.5 мільйона для Alpha-Omega через OpenSSF за посередництва Linux Foundation і $1.5 мільйона для Apache Software Foundation.
Компанія визнала, що ШІ-інструменти на кшталт Mythos знижують бар’єр для пошуку та експлуатації вразливостей, і вказала на ризик найближчим часом з боку державних акторів, Китаю, Ірану, Північної Кореї та Росії, а також кримінальних груп, якщо подібні можливості поширяться без контролю. Вона описала період перехідних заворушень, перш ніж захисники повністю інтегрують технологію.
Anthropic повідомила, що майбутні релізи Claude Opus міститимуть запобіжники для виявлення й блокування небезпечних виходів у кібербезпеці, і планує запровадити Cyber Verification Program для перевірених фахівців із безпеки. Очікується, що публічний звіт про знахідки партнерів і виправлені вразливості з’явиться протягом 90 днів.