Попередній перегляд Claude Mythos: ненадрукований ШІ Anthropic виправив уразливості Linux і OpenBSD, які люди не помічали десятиліттями

Coinpedia

2026-04-10 05:00:03

Непокритий релізом попередній огляд Claude Mythos від Anthropic автономно ідентифікував тисячі високосерйозних уразливостей нульового дня в усіх основних операційних системах і веббраузерах, спонукавши компанію запустити Project Glasswing — оборонну коаліцію з кібербезпеки, підкріплену до $100 мільйона кредитів на використання ШІ.

Ключові висновки:

Попередній огляд Claude Mythos від Anthropic набрав 83,1% у Cybergym, виявивши тисячі zero-days у кожній основній ОС і браузері.
Project Glasswing стартував 7 квітня 2026 року: має 11 партнерів-засновників і до $100 мільйона кредитів на використання Mythos для захисників.
Уразливість у OpenBSD 27-річної давності та баг FFmpeg 16-річної давності пройшли мільйони автоматизованих тестів, доки Mythos не виявив їх протягом кількох годин.

Claude Mythos AI набрав 83% у Cybergym і виявив критичні вади в кожному основному браузері та ОС

Модель, яку Anthropic описує як найбільше одиночне підсилення можливостей у фронтирному ШІ за всю історію, завершила тренування й була оголошена публічно 7 квітня 2026 року після того, як у кінці березня спливли внутрішні деталі через неправильно налаштовану систему керування контентом, що розкрила приблизно 3,000 внутрішніх файлів.

Anthropic не випускає попередній огляд Claude Mythos для публіки та не надає його через свій загальний API. Компанія обмежила доступ перевіреною групою партнерів після того, як модель продемонструвала, що здатна знаходити й експлуатувати невідомі програмні вади зі швидкістю та масштабом, які випереджають і людських експертів, і попередні ШІ-системи.

На бенчмарках з кібербезпеки розрив між Mythos і Claude Opus 4.6 складно ігнорувати. Mythos набрав 83,1% у Cybergym проти 66,6% для Opus 4.6, а також 93,9% проти 80,8% на SWE-bench Verified. На SWE-bench Pro він показав 77,8% проти 53,4% — різниця в 24 пункти. Він набрав 56,8% на Humanity’s Last Exam без інструментів порівняно з 40,0% у свого попередника.

Моделі не потрібне спеціалізоване тренування з кібербезпеки, щоб знаходити ці баги. Її приріст походить від ширших досягнень у міркуванні, плануванні в кілька етапів і автономній agentic-поведінці. За наявності цільової кодової бази в ізольованому контейнері вона читає вихідний код, формує гіпотези щодо вад безпеки пам’яті, компілює та запускає програмне забезпечення, використовує відладчики на кшталт Address Sanitizer, ранжує файли за імовірністю уразливості та формує валідовані звіти про баги з робочими proof-of-concept експлойтами.

Деякі з цих експлойтів вимагали майже ніякого людського керівництва. Tomshardware.com повідомляє, що уразливість OpenBSD TCP SACK 27-річної давності — тонке переповнення цілого, яке дозволяє атакувальнику віддалено спричинити аварійне завершення будь-якого хоста, що відповідає, шляхом створення шкідливих пакетів — була знайдена автономно після приблизно 1,000 запусків із загальною вартістю менш ніж $20,000. Баг FFmpeg H.264 16-річної давності пройшов більше ніж п’ять мільйонів автоматизованих тестів і кілька аудитів, перш ніж Mythos зловив його.

Результати для браузерів привернули особливу увагу. Під час тестування JavaScript-движка Firefox 147 Mythos створив 181 повний shell-експлойт і 29 випадків керування регістрами. Claude Opus 4.6 створив два shell-експлойти в рамках того самого набору тестів. Також модель побудувала робочі ланцюжки підвищення привілеїв ядра Linux — від користувача до root на серверах — після відфільтрування 100 останніх CVE до 40 кандидатів, які можна експлуатувати, і успішної експлуатації більш ніж половини з них.

Людські валідатори переглянули 198 звітів моделі про вразливості й погодилися з її оцінками серйозності 89% часу, при цьому 98% погодження було в межах одного рівня серйозності.

Project Glasswing

Поки що менш ніж 1% із визначених багів повністю виправлено. Anthropic координує відповідальне розкриття, публікує криптографічні commitments SHA-3 для невиправлених проблем і дотримується таймлайну 90-plus-45 днів перед публікацією повних деталей. Баг віддаленого виконання коду на сервері FreeBSD NFS CVE-2026-4747, якому 17 років і який надає повний необмежений (unauthenticated) доступ root, є серед названих прикладів, які вже фігурують у disclosure.

Project Glasswing, оголошений разом із моделлю, — це спроба Anthropic спрямувати ці можливості на захист, перш ніж подібні інструменти стануть широко доступними. Партнерами-засновниками є Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia та Palo Alto Networks. Доступ розширюють для більш ніж 40 додаткових критичних організацій у сфері програмного забезпечення.

Компанія зобов’язалася виділити $4 мільйона на безпекові пожертви з відкритим кодом: $2.5 мільйона для Alpha-Omega через OpenSSF за посередництва Linux Foundation і $1.5 мільйона для Apache Software Foundation.

Компанія визнала, що ШІ-інструменти на кшталт Mythos знижують бар’єр для пошуку та експлуатації вразливостей, і вказала на ризик найближчим часом з боку державних акторів, Китаю, Ірану, Північної Кореї та Росії, а також кримінальних груп, якщо подібні можливості поширяться без контролю. Вона описала період перехідних заворушень, перш ніж захисники повністю інтегрують технологію.

Anthropic повідомила, що майбутні релізи Claude Opus міститимуть запобіжники для виявлення й блокування небезпечних виходів у кібербезпеці, і планує запровадити Cyber Verification Program для перевірених фахівців із безпеки. Очікується, що публічний звіт про знахідки партнерів і виправлені вразливості з’явиться протягом 90 днів.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Прокоментувати

0/400

Немає коментарів