Игорь Градов

4 июля 2026 г. в 06:45 МСК5 мин

37% новых треков на Яндекс Музыке сгенерированы: нейросеть для создания музыки научились детектить без GPU

Нейросеть для создания музыки бесплатно генерирует треки, которые уже составляют больше трети новых релизов на Яндекс Музыке, и теперь есть способ отличить их от живых записей без дорогого оборудования.

Почему это важно

Независимый исследователь показал, что 37% новых релизов на Яндекс Музыке за первое полугодие 2026 года несут признаки генерации нейросетью, а среди треков с лайками доля доходит до 50%, и опубликовал алгоритм детекта с точностью около 100%, работающий на обычном ноутбуке.

Полтора месяца назад автор исследования опубликовал материал о том, что Яндекс Музыка «на треть состоит из нейрослопа». С тех пор он доработал метод обнаружения и выложил результаты с подробной аналитикой. В основе лежит научная работа специалистов стримингового сервиса Deezer «A Fourier Explanation of AI-music Artifacts», которая описывает характерные артефакты в частотном спектре сгенерированного аудио. Алгоритм адаптирован автором для простоты, не требует видеокарты и доступен в открытом репозитории.

Что понадобится?

Python с библиотеками для обработки аудио (NumPy, SciPy или аналоги для преобразования Фурье)
XGBoost для обучения классификатора
Датасет SONICS (Synthetic Or Not, Identifying Counterfeit Songs), 1 500 треков, половина сгенерированных, половина живых
Обычный ноутбук, GPU не нужен
Около 2 часов на первый запуск и эксперимент

Пошаговая инструкция

Подготовьте аудиофайл. Загрузите трек, который хотите проверить. Формат значения не имеет: WAV, MP3, FLAC подойдут, главное декодировать в массив амплитуд.
Вычислите частотный спектр через преобразование Фурье. Преобразование Фурье раскладывает сложный звуковой сигнал на простые волны (гармоники) с разными частотами и громкостями, как если бы вы разобрали оркестр на отдельные инструменты. Получите усреднённый спектр трека.

import numpy as np
from scipy.fft import fft

# audio_data — массив амплитуд трека
spectrum = np.abs(fft(audio_data))

Вычислите производную спектра. Производная показывает скорость изменения сигнала между соседними точками. Именно она делает артефакты нейросети видимыми: у сгенерированной музыки появляются резкие повторяющиеся пики на определённых частотах. Эти пики называют «шахматными артефактами» (checkerboard artifacts), они похожи на повторяющиеся паттерны в ранних ИИ-картинках, только спрятаны в звуке.

derivative = np.diff(spectrum)

Уменьшите число признаков методом PCA. PCA (метод главных компонент) сжимает набор данных, оставляя только те характеристики, которые несут больше всего информации. Это убирает шум и ускоряет классификацию.

from sklearn.decomposition import PCA

pca = PCA(n_components=50)
features = pca.fit_transform(derivative.reshape(1, -1))

Обучите классификатор XGBoost на датасете SONICS. XGBoost (градиентный бустинг) здесь работает как финальный судья: получает сжатые признаки спектра и выносит вердикт. Для обучения автор использовал 1 500 треков в соотношении 50/50.

from xgboost import XGBClassifier

model = XGBClassifier()
model.fit(train_features, train_labels)
prediction = model.predict(features)

Проверьте результат. Если классификатор вернул метку «ИИ», трек с высокой вероятностью сгенерирован. По данным автора, из всех треков, которые модель назвала сгенерированными, 100% действительно оказались таковыми (precision). Из всех реально сгенерированных треков модель нашла 98,7% (recall).

Как это применить

Автор исследования проверил релизы Яндекс Музыки за май 2026 года: почти 711 тысяч треков. Из них 260 тысяч (36,6%) классификатор пометил как сгенерированные. Для полного полугодия (3,8 млн треков с января по июнь 2026 года) доля составила 37%. А если оставить только треки с лайками, то есть те, которые реально слушают, доля нейромузыки выросла до 50%. Весь анализ проводился на обычном ноутбуке без GPU.

Частые ошибки

Смотреть только на «сырой» спектр. Без вычисления производной артефакты незаметны. Автор показал это на примере: усреднённые спектры живого трека и сгенерированного выглядят почти одинаково, разница проявляется только после дифференцирования.
Ожидать универсальности без дообучения. Датасет SONICS даёт отличные результаты, но нейросеть для создания музыки развивается быстро. Новые генераторы могут оставлять другие следы. Классификатор нужно периодически дообучать (обучать модель на свежих примерах под изменившуюся задачу) на актуальных треках.
Путать точность модели и гарантию. 98,7% recall означает, что примерно 1,3% сгенерированных треков проскользнут. На масштабе сотен тысяч релизов это тысячи пропущенных файлов.
Игнорировать треки без лайков. Автор сознательно отсёк их ради экономии времени, но именно в этой массе может скрываться основной объём автоматических заливок.

Что делать с этим прямо сейчас?

Авторам Дзена и контент-создателям. Если вы используете музыку в подкастах, видео или сторис, проверяйте фоновые треки перед публикацией. Сервисы вроде Яндекс Музыки пока не маркируют сгенерированный контент, а претензии правообладателей к ИИ-музыке уже обсуждаются. Репозиторий автора открыт, можно запустить проверку самостоятельно.

Маркетологам. Нейросеть для создания музыки бесплатно выдаёт трек за минуты, но стриминговые площадки начнут фильтровать такой контент. Если вы заказываете джинглы или фоновую музыку у подрядчиков, алгоритм позволяет проверить, не подсунули ли вам генерацию вместо авторской работы.

Стриминговым платформам и предпринимателям в РФ. Автор прямо указывает: «любой стриминговый сервис может реализовать подобный подход без серьёзных инфраструктурных затрат». Deezer уже встроил аналогичную систему маркировки. Для российских площадок, где доля нейромузыки достигает 37%, внедрение такого фильтра становится вопросом доверия аудитории.

Мнение редакции dzen.guru

Метод простой, воспроизводимый и, что редкость, честно задокументированный с открытым кодом. По моим наблюдениям, это первый публичный разбор масштаба нейромузыки именно на российской платформе с конкретными цифрами.

Честная оговорка: алгоритм ловит артефакты нынешнего поколения генераторов. Следующие версии Suno или аналогов могут научиться сглаживать спектр, и тогда метод потребует обновления. Это гонка щита и меча, а не окончательное решение. Но прямо сейчас он работает, и 50% нейромузыки среди залайканных треков Яндекс Музыки говорят о том, что внедрять фильтрацию нужно было ещё вчера.

Попробуйте AI Detector от dzen.guru

Проверяйте тексты и контент на следы генерации, чтобы защитить свои публикации от нейрослопа

Проверить контент

Главный вывод не в процентах, а в доступности: для детекта ИИ-музыки больше не нужен суперкомпьютер, нужен ноутбук, открытый датасет и полчаса на Python. Код лежит в открытом репозитории автора исследования, и любой стриминг или продюсер может запустить проверку сегодня.

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

LLM локально на GPU за копейки: четыре майнинговые карты дают 25 токенов в секунду

Локальный запуск LLM (большой языковой модели, то есть нейросети, генерирующей текст) на видеокартах из старой майнинг-фермы даёт стабильные 19-25 токенов в…

4 июля в 08:15 МСК6 мин

Передача энергии из космоса лазером: 152 Вт на 1 км и демонстраторы на орбите к 2026 году

Публикация по плану how-to. H1 не дублирую. Компании выстраивают орбитальные группировки, и лазерная передача энергии из космоса становится практическим…

4 июля в 07:45 МСК6 мин

Meta выпустила приложение для создания игр по текстовому промпту: код больше не нужен

Meta второго июля тихо выложила в магазины приложений Pocket, генератор мини-игр и интерактивных приложений, где единственный инструмент разработки это…

4 июля в 07:30 МСК4 мин