Anthropic: безопасность ИИ возможна только под нашим контролем
Компания Anthropic считает, что для обеспечения безопасности ИИ она должна оставаться на передовой технологии. Критики указывают на недостаток внутреннего плюрализма и потенциальные «слепые зоны».

Два столпа убеждений
Anthropic пять лет предупреждала об опасностях продвинутого ИИ, но при этом сама стала одним из главных двигателей его развития. Внутри компании это не видят противоречием: она исходит из того, что ИИ — неизбежная и преобразующая технология, а Anthropic должна оставаться в авангарде, чтобы ответственно управлять ею.
«Хорошие парни» и власть как средство
Бывшие сотрудники говорят, что компания считает себя «хорошими парнями», ответственными за безопасность ИИ. Власть, капитал и талант — не самоцель, а необходимость для выполнения миссии по безопасному переходу мира к преобразующему ИИ. Хелен Тонер из Джорджтаунского университета приводит аналогию: лес, полный сокровищ и монстров; Anthropic хочет зайти глубже всех, одновременно инвестируя в укрощение монстров.
Внутренняя культура и вызовы
Хотя Anthropic пропагандирует атмосферу высокого доверия и отсутствия эго, бывшие сотрудники отмечают, что отсутствие плюрализма может мешать ответственности. Дискуссии ведутся, но откровенная критика часто остаётся в частных чатах. Крупный спор возник осенью 2024 года, когда Anthropic заключила сделку с Palantir на предоставление ИИ разведке и обороне США. Позже Пентагон стал использовать Claude для идентификации целей в войне Израиля и Ирана.
Опасность концентрации власти
Гендиректор Дарио Амодей признаёт, что концентрация власти над ИИ в руках нескольких лабораторий — риск, но предлагаемые им меры (тщательный надзор и публичные обязательства) мало что меняют. Критики отмечают, что Anthropic считает, будто знает «правду о положении человечества» лучше других, однако никто не знает, как именно ИИ изменит мир — просто у некоторых больше влияния на этот процесс.


