Белый дом требует от Anthropic заблокировать все обходы ИИ-моделей, но это может быть невозможно
Администрация США требует от компании Anthropic устранить уязвимости в её ИИ-модели Claude Fable 5, однако эксперты считают, что полное предотвращение обходов может быть невыполнимым.

Спор между администрацией Трампа и Anthropic обостряется
Чиновники администрации Трампа заявили, что если Anthropic хочет повторно выпустить свою ИИ-модель Claude Fable 5, компания должна предпринять шаги для устранения alleged уязвимостей. Модель была отозвана на прошлой неделе в рамках экспортного контроля из-за опасений по поводу jailbreaking — использования подсказок для обхода защитных барьеров.
Anthropic в течение нескольких дней утверждала, что опасения администрации преувеличены, а последствия обходов минимальны. Компания подтвердила эту позицию на технической встрече в понедельник с Министерством торговли и Офисом национального кибердиректора.
Однако чиновники говорят, что споры о значимости обходов закончены, поскольку Агентство национальной безопасности (АНБ) пришло к выводу, что существуют способы отключить защитные барьеры Fable 5. Эти барьеры предназначены для предотвращения доступа пользователей к возможностям модели Mythos в области кибербезопасности, химии и биологии.
Требования администрации и мнение экспертов
По данным трёх источников, знакомых с обсуждениями, администрация считает, что решение проблемы лежит на Anthropic. У Центра стандартов и инноваций в области ИИ при Министерстве торговли и у АНБ нет персонала или ресурсов для отслеживания всех возможных обходов каждой модели, выходящей на рынок.
Поэтому администрация хочет, чтобы Anthropic была более проактивной и непрерывно тестировала не только Fable 5, но и все свои передовые ИИ-модели, чтобы находить потенциальные обходы и сообщать о них правительству.
Однако на более фундаментальном уровне остаётся неясным, как Anthropic должна предотвращать обходы. Независимые эксперты по кибербезопасности всё чаще считают, что защитные барьеры — лишь временное решение, так как опытные пользователи и будущие ИИ-модели найдут способы их обойти. Это означает, что требование Белого дома, вероятно, невыполнимо.
Представитель Белого дома отказался от комментариев.

