Jauna vietne ļauj ziņot par mākslīgā intelekta kļūdām un riskiem
Pētnieku grupa izveidojusi crowdsourcinga vietni FLARE-AI, kurā ikviens var ziņot par AI sistēmu nepilnībām, piemēram, kaitīgu saturu vai privātuma pārkāpumiem.

Mākslīgā intelekta pētnieku grupa ir izstrādājusi atvērtā koda tīmekļa vietni Flaw Reporting for AI jeb FLARE-AI, kas paredzēta AI sistēmu nepilnību ziņošanai un uzraudzībai. Tā darbojas līdzīgi kā Downdetector, apkopojot lietotāju ziņojumus par globāliem pakalpojumu traucējumiem, taču šoreiz saistībā ar mākslīgo intelektu. Vietnes atvērtais kods ļauj citiem pārbaudīt problēmu un nosūtīt ziņojumus modeļu izstrādātājiem, kā arī organizācijām, piemēram, bezpeļņas organizācijai MITRE, kas seko tehnisku sistēmu problēmām.
Projektu vada Avidžits Gošs no HuggingFace, kā arī datorzinātnieces Eleina Džu un Šeina Longpre. Tas tapis sadarbībā ar 49 mākslīgā intelekta ekspertiem no 32 dažādām organizācijām. Pētnieki uzsver, ka pašlaik nav centralizēta un pārskatāma veida, kā ziņot par AI kļūdām, un tas ir būtisks trūkums, ņemot vērā AI tehnoloģiju arvien plašāku izmantošanu un autonomo sistēmu pieaugošo ietekmi.
Problēmas, ko var reģistrēt FLARE-AI, ietver psiholoģisku kaitējumu, diskrimināciju, neobjektivitāti un dezinformāciju. Kā norāda Gošs, dažādiem uzņēmumiem ir atšķirīgi standarti šādu jautājumu risināšanā, tāpēc dažas problēmas paliek neatklātas. Nesen atklāti incidenti liecina, cik viegli AI var izraisīt problēmas –, piemēram, uzņēmums LayerX parādīja, kā apiet AI pārlūkprogrammu aizsargbarjeras, bet pētnieks Johans Rēbergers atklāja veidu, kā piespiest AI modeli Claude izpaust personas datus.
Tomēr iniciatīva saskaras ar izaicinājumiem. Raimana Čaudhri, Humane Intelligence PBC vadītāja, norāda, ka jāspēj pārvaldīt lielu ziņojumu apjomu, no kuriem daudzi var nebūt nopietni, un jānodrošina, ka ziņošanas sistēma balstās uz uzticamām organizācijām.
Jūnijā ASV Kongresā iesniegtais likumprojekts varētu palielināt valdības lomu. Tajā ierosināts, ka Nacionālais standartu un tehnoloģiju institūts (NIST) izstrādātu standartus AI kļūdu ziņošanai un uzturētu centralizētu datubāzi. Tas mudinātu izstrādātājus risināt problēmas un ļautu lietotājiem izvērtēt dažādu sistēmu drošumu.


