Žurnāls The Atlantic izveido meklējamu mūzikas datubāzi, ko izmanto mākslīgā intelekta apmācībai
The Atlantic žurnālists Alekss Reizners atklāja četras datu kopas ar miljoniem dziesmu, kas kalpo par pamatu MI modeļu apmācībai, un padarīja tās publiski meklējamas. Kopās iekļauti tādi mākslinieki kā Lady Gaga, Radiohead un Brūss Springstīns.

Žurnāla The Atlantic reportieris Alekss Reizners (Alex Reisner) ir identificējis četras mūzikas datu kopas, kas tiek izmantotas mākslīgā intelekta modeļu apmācībai, un padarījis tās pilnībā meklējamas sabiedrībai. Divas no kopām ir ārkārtīgi lielas – tajās ir attiecīgi 12 miljoni un 9 miljoni ierakstu. Pārējās divas ir mazākas, bet joprojām satur ievērojamu apjomu – katrā vairāk nekā 100 000 dziesmu.
Saskaņā ar Reiznera teikto, šīs kopas ir lejupielādētas tūkstošiem reižu, un, lai gan nav iespējams precīzi zināt, kas tās izmantojis, gan Google, gan Stability savos pētījumos ir apstiprinājuši to izmantošanu. Daži avoti, piemēram, Free Music Archive datu kopa, ir bezmaksas personīgai lietošanai straumēšanā, bet komerciālai izmantošanai nepieciešama licencēšana.
Lai gan teorētiski šīs kopas ir brīvi pieejamas internetā, to izmantošana kā apmācības dati nav tik vienkārša kā ZIP faila lejupielāde un ievadīšana MI modelī. Kā skaidro Reizners: trīs no četrām datu kopām tiek izplatītas kā saišu saraksti uz dziesmām vietnēs YouTube vai Spotify. MI izstrādātāji lejupielādē faktisko audio, izmantojot rīkus, kas automatizē darbu; daži no šiem rīkiem ļauj apiet pieteikšanos, reklāmas un mehānismus, kas radītu ieņēmumus vai abonentus satura veidotājiem. Šādi rīki pārkāpj šo platformu lietošanas noteikumus.
Datubāzē atrodami tādi vārdi kā popsensācija Lady Gaga, Fred Again.., Radiohead, Aphex Twin, Wu-Tang Clan, Brūss Springstīns un eksperimentālais komponists Hainbach. Ikviens var apmeklēt The Atlantic AI Watchdog vietni un pašrocīgi meklēt dziesmas, grāmatas un citus medijus, ko izmanto pasaules MI modeļu apmācībai.

