Baltā māja pieprasa Anthropic bloķēt visus AI modeļu apiešanas veidus, taču tas var nebūt iespējams
ASV administrācija pieprasa uzņēmumam Anthropic novērst ievainojamības tās AI modelī Claude Fable 5, taču eksperti norāda, ka pilnīga apiešanas novēršana var būt neiespējama.

Strīds starp Trampa administrāciju un Anthropic saasinās
Trampa administrācijas amatpersonas paziņojušas, ka, ja Anthropic vēlas atkārtoti izlaist savu AI modeli Claude Fable 5, tam jāveic pasākumi, lai novērstu apgalvotās ievainojamības. Modelis pagājušajā nedēļā tika izņemts no apgrozības ar eksporta kontroli, bažījoties par tā aizsargbarjeru apiešanu.
Anthropic vairākas dienas apgalvoja, ka administrācijas bažas ir pārspīlētas un apiešanas radītās sekas ir minimālas. Uzņēmums šo nostāju atkārtoja pirmdienas tehniskajā sanāksmē ar Tirdzniecības departamentu un Nacionālā kiberdirektora biroju.
Tomēr amatpersonas norāda, ka diskusijas par apiešanas nozīmīgumu ir beigušās, jo Nacionālā drošības aģentūra (NSA) secinājusi, ka pastāv veidi, kā atspējot Fable 5 aizsargbarjeras. Šīs barjeras ir izveidotas, lai neļautu lietotājiem piekļūt Mythos modeļa iespējām kiberdrošībā, ķīmijā un bioloģijā.
Administrācijas prasības un ekspertu viedoklis
Saskaņā ar trim informētiem avotiem, administrācija uzskata, ka problēmas risināšana ir Anthropic atbildība. Tirdzniecības departamenta Mākslīgā intelekta standartu un inovāciju centram un NSA nav personāla vai resursu, lai izsekotu katra modeļa iespējamos apiešanas veidus.
Tādēļ administrācija vēlas, lai Anthropic būtu proaktīvāka un nepārtraukti testētu ne tikai Fable 5, bet visus savus modernākos AI modeļus, lai atrastu un ziņotu par potenciāliem apiešanas veidiem.
Tomēr fundamentāli joprojām nav skaidrs, kā Anthropic būtu jānovērš apiešanas iespējas. Neatkarīgi kiberdrošības eksperti arvien vairāk secina, ka AI modeļu aizsargbarjeras ir tikai pagaidu risinājums, jo prasmīgi lietotāji un nākotnes AI modeļi atradīs veidus, kā tās apiet. Tas nozīmē, ka Baltā nama prasība, iespējams, nav izpildāma.
Baltā nama pārstāvis atteicās komentēt situāciju.

