суббота, 20 июня 2026 г.
Rīga TV

Мировые и латвийские новости в одном месте

ТехнологииОпубликовано: 20 июня 2026 г. в 22:21

The Atlantic создал поисковую базу данных музыки, используемой для обучения ИИ

Репортер The Atlantic Алекс Рейснер обнаружил четыре набора данных, содержащих миллионы треков для обучения моделей ИИ, и сделал их общедоступными для поиска. В наборы вошли такие артисты, как Леди Гага, Radiohead и Брюс Спрингстин.

Foto: The Verge

Репортер The Atlantic Алекс Рейснер (Alex Reisner) выявил четыре набора музыкальных данных, используемых для обучения моделей искусственного интеллекта, и сделал их полностью доступными для публичного поиска. Два из этих наборов огромны — содержат 12 миллионов и 9 миллионов треков соответственно. Два других меньше, но все еще представляют значительный объем — более 100 000 песен каждый.

По словам Рейснера, эти наборы были загружены тысячи раз, и хотя невозможно точно знать, кто их использовал, Google и Stability подтвердили их использование в исследовательских работах. Некоторые источники, например, набор Free Music Archive, бесплатны для потокового воспроизведения в личных целях, но для коммерческого использования требуется лицензирование.

Хотя теоретически эти наборы свободно доступны в интернете, их использование в качестве тренировочных данных не сводится к простой загрузке ZIP-файла и передаче его модели ИИ. Как объясняет Рейснер: три из четырех наборов данных распространяются в виде списков ссылок на песни на YouTube или Spotify. Разработчики ИИ загружают фактический аудиофайл с помощью инструментов, автоматизирующих эту задачу; некоторые из них позволяют обходить логины, рекламу и механизмы, которые приносят доход или подписчиков создателям контента. Такие инструменты нарушают условия использования этих платформ.

В базе данных фигурируют такие имена, как поп-звезда Леди Гага, Fred Again.., Radiohead, Aphex Twin, Wu-Tang Clan, Брюс Спрингстин и экспериментальный композитор Hainbach. Любой желающий может посетить сайт The Atlantic AI Watchdog и самостоятельно искать песни, книги и другие медиа, используемые для обучения мировых моделей ИИ.

Комментарии

0/1500

Комментарии модерируются автоматически. Запрещены ненависть, угрозы, личные данные и спам.

Загрузка комментариев…

Ещё в этой категории

Технологии

Глава Signal Мередит Уиттакер: ИИ-чатботы — не ваши друзья

Президент Signal Мередит Уиттакер предупреждает, что чатботы на основе ИИ не являются разумными существами, и их не следует воспринимать как друзей. Она критикует планы Microsoft позволить Copilot совершать покупки, называя это бэкдором в контексте Signal.

TechCrunch · 1 ч назад

Технологии

In the Weights: новый ИИ-центричный поиск, оценивающий, насколько хорошо модели «помнят» вас

Бывшие сотрудники OpenAI Томас Димсон и Джоуи Флинн запустили сайт In the Weights, который опрашивает различные ИИ-модели, чтобы узнать, насколько хорошо они могут вспомнить человека без использования веб-поиска, присваивая баллы.

TechCrunch · 2 ч назад

Технологии

In the Weights: новый инструмент для оценки того, насколько хорошо ИИ «помнит» вас

In the Weights — новый сайт, который оценивает, насколько хорошо различные модели ИИ могут вспомнить человека без поиска в интернете, присваивая оценку силы.

TechCrunch AI · 2 ч назад