alexeyfv

Опубликовано

- 7 мин чтения

Я выяснил, что Яндекс Музыка на треть состоит из нейрослопа

AI ML
img of Я выяснил, что Яндекс Музыка на треть состоит из нейрослопа

Возможно вы уже знаете, что в чарт «Яндекс Музыки» залетают треки, сгенерированные ИИ. Например, перепевка стихотворения Есенина «Сыпь, гармоника», которая сейчас на 16 месте чарта. Или трек «Ярмарка судеб» исполнителя Alena, который был даже спет в эфире телеканала Россия 1.

Мне нравились алгоритмы «Яндекс Музыки». Благодаря им в своё время я открыл много малоизвестных артистов, которых слушаю до сих пор. Но с появлением Suno, Lyria, Udio, алгоритмами рекомендаций Яндекса пользоваться стало невозможно. Мне то и дело подсовывались низкокачественные ИИ-треки.

В какой-то момент меня это достало. Я провёл своё расследование и получил неутешительные результаты. В базе «Яндекс Музыки» сейчас как минимум 140 тысяч ИИ-исполнителей. Ежемесячно они загружают больше 100 тысяч ИИ-треков, что составляет примерно 40% от всех загружаемых треков. А каждый 10-й трек в чарте – сгенерирован ИИ. И «Яндекс» ничего с этим не делает.

Краткое предисловие

Обычным будничным январским днём во время работы я слушал «Мою волну» на «Яндекс Музыке». В очередной раз алгоритмы мне подсунули ИИ-трек. То, что это нейрослоп было слышно отчётливо.

Я пошёл общаться с техподдержкой «Яндекса». Мне хотелось понять, а планирует ли «Яндекс» как-то маркировать такую музыку?

Поскольку в техподдержке «Яндекс» уже внедрил ИИ, мне не сразу удалось пробиться к человеку. Когда всё же удалось, то у меня попросили ссылку на ИИ-исполнителей, которые мне попались, и всё… На мои вопросы техподдержка не ответила. А заявка на следующий день была автоматически закрыта.

Пытаюсь достучаться до живого человека
Пытаюсь достучаться до живого человека
Всё ещё пытаюсь достучаться до живого человека
Всё ещё пытаюсь достучаться до живого человека
Наконец отправил ссылку на ИИ-артиста
Наконец отправил ссылку на ИИ-артиста
Они не ответили, и заявка автоматически закрылась
Они не ответили, и заявка автоматически закрылась

Маркировка ИИ-контента. Позиция «Яндекса» и государства.

Как выяснилось позже, «Яндекс» вообще не планировал добровольно заниматься маркировкой ИИ-музыки. Основная причина — деньги. Вот что сказал Арсений Козымаев, директор по контенту и партнёрствам «Яндекс Музыки» в дискуссии Института Музыкальных Инициатив:

Если трек нравится слушателям — он попадает в рекомендации, если нет — значит, трек не интересен аудитории. И это правило едино для всех — неважно, с помощью каких инструментов создаётся трек.

ИИ поможет музыкальной индустрии заработать больше денег. Мне нравится персональный подход Spotify, который размышляет о том, чтобы предложить пользователю генерировать собственную версию любимого трека прямо на площадке. Автор оригинала получит вознаграждение, а пользователь — версию трека, которую хочет послушать в моменте.

Такое публичное заявление — закономерность, ведь «Яндекс» доминирует среди музыкальных стримингов в России. А когда бизнес отказывался от 300% прибыли? Западные сервисы, которые добровольно маркируют ИИ-треки, недоступны для россиян. Можно делать то, что хочешь. Капитализм, счастье, зашибись!

Государство тоже не одобряет маркировку ИИ-контента. 15 апреля 2026 года профильный комитет Госдумы отклонил законопроект о маркировке ИИ-контента:

«Комитет не поддерживает, рекомендует отклонить», - сказал зампредкомитета Госдумы по информполитике Антон Горелкин на заседании комитета в среду.

По его словам, в случае принятия законопроекта «отмаркировать придётся 90% всего интернета, а мошенники, естественно, маркировать ничего не будут».

Отмечу, что я не против ИИ в целом. Как программист, я использую нейросети каждый день: на работе у меня корпоративная подписка на GitHub Copilot и Microsoft Copilot. Для пет-проектов сейчас я использую OpenCode с DeepSeek. В мои рабочие обязанности входит в том числе и внедрение агентов в наши приложения.

Пусть те, кому нравится ИИ-музыка, создают и слушают её сколько влезет. Но сложившуюся ситуацию считаю несправедливой ни по отношению к обычным группам и музыкантам, ни к слушателям. Если пользователю, например, не нравится электронная музыка, то он может отфильтровать плейлист. У любого стримингового сервиса есть такая возможность. С ИИ-треками так сделать не получается.

Расследование и его результаты

После того диалога с теходдержкой «Яндекса», я перестал включать «Мою волну» и слушал только несколько моих любимых групп. Это продолжалось примерно 2 месяца. За это время в одной запрещённой соцсети мне попадалось много рилсов от обычных музыкантов, которые так же как и я негодовали из-за засилья нейрослопа. В конце марта терпение закончилось и я начал делать браузерное расширение, которое бы автоматически маркировало ИИ-артистов, но об этом чуть позже.

Я изначально понимал, что браузерное расширение не может проводить глубокий анализ музыки и метаданных артиста на лету. Проверки должны осуществляться где-то в фоне, централизованно, а расширение будет просто использовать готовую базу ИИ-артистов. Поэтому я начал исследовать всех артистов на «Яндекс Музыке»: от самых новых до старых.

Первый этап проверки состоял в том, чтобы сверить релизы артистов на «Яндекс Музыке» с релизами в Deezer — единственной мне известной стриминговой платформой с маркировкой ИИ-музыки.

Пример маркировки в Deezer
Пример маркировки в Deezer

Я начал перебирать всех артистов одним за одним. На данный момент, проверено 5.7 млн. артистов. Из них, лишь у 19% есть хотя бы один релиз, поэтому в дальнейшем, я буду говорить только про этих исполнителей.

81% профилей артистов на «Яндекс Музыке» — пустышки
81% профилей артистов на «Яндекс Музыке» — пустышки

Сравнение с Deezer показало, что как минимум 7% артистов использовали ИИ при создании музыки.

ИИ всего лишь 7%
ИИ всего лишь 7%

Подписи на легенде означают следующее:

  • 100% не ИИ — артист был найден на Deezer и ни один из его релизов не был помечен как ИИ.
  • Нужна доп. проверка — артист найден на Deezer, существующие на Deezer релизы не помечены как ИИ, но на «Яндексе» есть релизы, которые отсутствуют на Deezer.
  • 100% ИИ — артист найден на Deezer и хотя бы один релиз помечен как ИИ.
  • Нет на Deezer — профиль артиста не найден на Deezer.

Кажется, что 7% — это не так много. В абсолютных значениях это всего лишь 76.9 тыс. исполнителей. Но есть несколько «но»:

  1. Эти 7% сейчас создают примерно треть всей новой музыки на «Яндексе».
Количество новых треков в месяц на «Яндекс Музыке» по категориям в 2026 году
Количество новых треков в месяц на «Яндекс Музыке» по категориям в 2026 году
  1. Не все авторы загружают своё творчество на Deezer. Я бегло проверил категорию «Нет на Deezer» и обнаружил там много артистов с сгенерированной музыкой. Аналогичная ситуация с категорией «Нужна доп. Проверка». Далее я буду называть эти 2 категории «серой зоной».
Пример ИИ-исполнителей, которых нет на Deezer
Пример ИИ-исполнителей, которых нет на Deezer

Применяем машинное обучение

Чтобы разобраться со вторым «но» и найти ИИ-артистов в серой зоне, я решил применить машинное обучение. Поскольку у меня нет возможности анализировать 400 тысяч композиций, которые загружаются в «Яндекс» ежемесячно, то я решил использовать доступные метаданные вместе с моделью XGBoost. Для выявления признаков, я проанализировал информацию об артистах, лейблах, релизах и треках и обнаружил закономерности.

Как оказалось, одним из признаков ИИ-артистов являются частые релизы. Некоторые из артистов генерируют столько контента, что диву даёшься. Например, ИИ-исполнитель ниже загружает в среднем 90+ релизов в день (5465 релизов за 60 дней). Феноменальная продуктивность.

Исполнительн Sommnia загружает по 90+ релизов в день
Исполнительн Sommnia загружает по 90+ релизов в день

Другим важным признаком является принадлежность к определённым лейблам или коллаборации с артистами из таких лейблов. Пример такого лейбла — Context Collapse с 278 ИИ-артистами.

Даже с аватарками не заморачиваются
Даже с аватарками не заморачиваются

Всего же в модели использовались 15 признаков. Для обучения использовались метаданные 572 тыс. артистов. Из них 59 тыс. были подтверждены как ИИ, остальные 398 тыс. — не ИИ. Оставшиеся 114 тыс. использовались для оценки модели.

Матрица ошибок (confusion matrix) модели получилась следующая:

  |                     | Предсказано как не ИИ | Предсказано как ИИ |
| :------------------ | :-------------------- | :----------------- |
| Действительно не ИИ | 96 740                | 2784               |
| Действительно ИИ    | 423                   | 14 370             |

Из всех, кого модель назвала ИИ, 83.77% действительно оказались ИИ. Из всех ИИ-артистов модель нашла 97.14%.

Остальные метрики модели:

  Precision: 0.8377
Recall: 0.9714
F1: 0.8996
MCC: 0.8867
AUC-ROC: 0.9971
AUC-PR: 0.9841
Log loss: 0.0659
Кривая калибровки
Кривая калибровки

Применив модель к артистам из «серой» категории, получилось, что ещё около 64 тысячи исполнителей с высокой вероятностью (≥ 0.85) можно отнести к ИИ. Они, в свою очередь, добавили ещё 6% – 11% ИИ-треков ежемесячно.

Количество новых треков в месяц на «Яндекс Музыке» по категориям в 2026 году с учётом данных от модели
Количество новых треков в месяц на «Яндекс Музыке» по категориям в 2026 году с учётом данных от модели

По моим скромным подсчётам, получается, что на «Яндекс Музыке» сейчас примерно 140 тысяч ИИ артистов. И ежемесячно они загружают около 40% новой музыки.

Как с этим жить?

Выше я писал, что «Яндекс» не планирует маркировать ИИ-музыку. Я решил это сделать за них и написал браузерное расширение для Chrome и Firefox, которое маркирует ИИ-артистов на основе моих данных.

Пример маркировки при помощи расширения
Пример маркировки при помощи расширения

Также, если музыка ИИ-артиста попадётся в «Моей Волне», то треку автоматически будет поставлен дизлайк и он пропускается.

Расширение бесплатное. Если вы, как и я, часто слушаете музыку с компьютера, пока работаете, то оно может быть для вас полезным. Код лежит на GitHub под лицензией MIT — буду рад, если кому-то интересно поучаствовать в разработке. Если же вам интересно ещё больше технических подробностей проекта, то добро пожаловать в Telegram-канал.

Заключение

Не знаю, изменится ли что-то от публикации этой статьи или от расширения. Я продолжу заниматься этим проектом. А вы теперь хотя бы осознаёте масштаб. Конспирологическая теория мёртвого интернета, возможно, не такая уж и теория и не конспирологическая.

А как вы относитесь к ИИ-музыке?