Правительство США приказало Anthropic отключить две мощные ИИ-модели из соображений безопасности
Правительство США в пятницу потребовало от Anthropic немедленно отключить доступ к двум её самым мощным ИИ-моделям — Claude Fable 5 и Claude Mythos 5 — ссылаясь на угрозу национальной безопасности. Компания выполнила требование, но оспорила его обоснование.

Правительство США в пятницу приказало компании Anthropic немедленно отключить доступ к двум её самым мощным моделям искусственного интеллекта — Claude Fable 5 и Claude Mythos 5 — сославшись на угрозу национальной безопасности. Anthropic объявила, что выполнила распоряжение, но дала понять, что считает его ошибочным.
Предписание, полученное в 17:21 по восточному времени, вынуждает компанию заблокировать обе модели для всех пользователей по всему миру, а не только для иностранных граждан, на которых изначально был направлен экспортный контроль. Доступ к другим моделям Anthropic не затрагивается.
Mythos — самая мощная модель Anthropic, представленная в начале апреля и с тех пор строго ограниченная из-за её исключительной способности находить уязвимости в программном обеспечении. По данным компании, Mythos выявила недостатки во всех основных операционных системах и веб-браузерах. Вместо широкого выпуска Anthropic запустила программу Project Glasswing, предоставив модель примерно 50 проверенным организациям, включая Amazon, Apple, Google, Microsoft и CrowdStrike, для оборонительных кибербезопасных работ.
Fable 5 была выпущена всего три дня назад как коммерчески безопасная версия Mythos с защитными барьерами, блокирующими ответы в областях повышенного риска, таких как кибербезопасность и биология. Согласно тестам Vals AI, она стала самой мощной публично доступной моделью.
Предписание правительства оформлено как мера экспортного контроля, но в блоге Anthropic утверждает, что реальной причиной является предполагаемый взлом (jailbreak) Fable 5. Компания заявляет, что правительство предоставило лишь устные свидетельства о «потенциальном узком, неуниверсальном взломе», который по сути заключается в подсказке модели прочитать определённую кодовую базу и найти программные ошибки. Anthropic добавляет, что такой уровень возможностей уже широко доступен в других публичных моделях, включая GPT-5.5 от OpenAI, и регулярно используется специалистами по кибербезопасности.
Компания также утверждает, что её самые сильные защитные механизмы работают через независимые классификаторы, отделённые от самой модели. Даже если кто-то убедит Fable продолжать разговор после отказа, базовые средства защиты от опасных результатов остаются в силе. Проверка недавнего использования не выявила доказательств успешного обхода этих средств.
«Мы не согласны с тем, что обнаружение узкого потенциального взлома должно быть причиной для отзыва коммерческой модели, развёрнутой для сотен миллионов людей», — написала компания. «Если бы этот стандарт применялся к отрасли в целом, мы полагаем, что это фактически остановило бы все новые развёртывания моделей для всех ведущих провайдеров».
Ожидается, что Anthropic проведёт первичное публичное размещение акций (IPO) в этом году и построила свой публичный имидж на осознанном подходе к безопасности. Ирония не ускользает от наблюдателей: именно осторожность, проявленная Anthropic в ограничении Mythos, привлекла внимание правительства, которое может нарушить её бизнес.
В апреле генеральный директор OpenAI Сэм Альтман в подкасте назвал подход Anthropic к Mythos «маркетингом, основанным на страхе». «Это явно невероятный маркетинг — говорить: „Мы создали бомбу. Мы собирались сбросить её на вашу голову. Мы продадим вам бомбоубежище за 100 миллионов долларов“», — сказал Альтман. Он не предсказал правительственное закрытие, но отметил, что если месяцами рассказывать миру, что ваш ИИ уникально опасен, мир — включая правительство США — склонен прислушиваться.


