Spotify, крупнейшая в мире платформа потокового аудио с сотнями миллионов активных пользователей и обширной музыкальной библиотекой, предположительно была взломана Anna’s Archive. Теневая библиотека, называющая себя архивариусами, якобы собрала почти всю платформу, скачав около 300 ТБ музыки, которая теперь незаконно распространяется через торренты.
Spotify уже признала и отреагировала на эту атаку, опубликовав следующее заявление для Android Authority: «Расследование несанкционированного доступа выявило, что третья сторона собрала общедоступные метаданные и использовала незаконные методы для обхода DRM с целью получения доступа к некоторым аудиофайлам платформы. Мы активно расследуем инцидент».
Ключевым моментом является слово «некоторые» в приведенном выше комментарии, поскольку утечка коллекции состоит примерно из 86 миллионов файлов, что составляет около 37% всей музыки, доступной на платформе (но 99,9% прослушиваний). Большинство из них сохранены в исходном формате Spotify OGG Vorbis 160 кбит/с, но если какая-либо песня имеет рейтинг популярности ровно 0, то она была перекодирована в 75 кбит/с для экономии места.
Кроме того, имеется 256 миллионов строк метаданных, которые составляют 99,6% всех прослушиваний на Spotify и были скомпилированы в доступные для запросов SQL базы данных. Группа провела почти без потерь реконструкцию API Spotify в формате JSON, включая 186 миллионов уникальных ISRС — идентификаторов для отдельных записей по всему миру; представьте их как ISBN для музыки. Вся информация об альбомах, исполнителях, обложках и т. д. включена.
В блоге, опубликованном Anna’s Archive и посвященном этой утечке, содержится удивительно много информации, включая множество диаграмм, разбивающих то, как Spotify в целом обрабатывает музыку. Например, около 70% всех песен на платформе почти не привлекают внимания, в то время как 0,1% треков являются самыми популярными за все время. Большинство песен — это синглы, а не часть альбома, и 120 ударов в минуту — самый распространенный темп.
В любом случае, причина этой масштабной хакерской атаки, как описано самой Anna’s Archive, — сохранение музыки. Поскольку группа печально известна тем, что выкладывает книги без согласия, она применяет здесь ту же логику, утверждая, что коллекция Spotify слишком явно ориентирована на популярных исполнителей и качество звука. Необходим «авторитетный список торрентов, призванный представить всю когда-либо созданную музыку».
Торренты размещаются самостоятельно, а файлы упаковываются с использованием Anna’s Archive Containers (AAC) — пользовательского формата, который группа использует уже много лет. Метаданные уже выпущены, а остальная часть данных будет выпущена поэтапно огромными порциями, сгруппированными по популярности. Следовательно, последствия этого сбора данных проявятся по-настоящему только в будущем.
Автор – Hassam Nasir




