The Atlantic раскрыл базы данных миллионов песен, использованных для обучения ИИ
Журнал The Atlantic опубликовал четыре поисковые базы данных, содержащие миллионы треков, использованных для обучения моделей искусственного интеллекта, включая работы Тейлор Свифт и Bad Bunny.

Журнал The Atlantic опубликовал четыре поисковые базы данных, которые показывают масштаб использования музыкальных записей для обучения моделей искусственного интеллекта (ИИ). Одна база содержит 12 миллионов треков, другая – 9 миллионов, а две оставшиеся – примерно по 100 000 песен каждая. Автор статьи Алекс Рейснер отмечает, что в базы включена музыка, защищённая авторским правом, в том числе хиты Тейлор Свифт и Bad Bunny.
Публикация происходит на фоне судебных разбирательств против платформ Suno и Udio, которые ссылаются на добросовестное использование в качестве защиты от обвинений в незаконном копировании контента. В аналогичном деле о книгоиздании суд отклонил претензии о нарушении авторских прав, но обвинения в пиратстве оказались более убедительными. Первоначальное урегулирование составило 1,5 миллиарда долларов, однако окончательное решение ещё не принято.
Эксперты полагают, что эти базы данных могут помочь музыкальной индустрии в аналогичных исках в будущем. Многие стриминговые сервисы принимают меры для предотвращения, идентификации или маркировки контента, созданного ИИ, но их эффективность различается. Кроме того, они не остановили мошенников, которые создают имитации существующих групп с помощью ИИ и пытаются извлечь выгоду из их работ.


