Музыкальный эксперимент в Suno каждой твари по паре и его результаты

Нейросети для генерации музыки растут как грибы после дождя, но Suno среди них солирует уже довольно уверенно. Каждый второй обыватель, заглянувший в этот сервис, начинает с банального — рок-баллада про любовь, рэп про понедельник, что-то электронное «под настроение». Меня же давно мучил вопрос куда более ехидный: а что если загнать в одну сессию буквально каждой твари по паре? То есть взять максимально разные жанры, эпохи и культурные коды, скрестить их попарно и посмотреть, где машина споткнётся, а где выдаст что-то по-настоящему живое. Идея простая, реализация — задача не из лёгких. А начать стоит с того, как вообще задумывался этот забег.

Все топовые нейросети в одном месте

Замысел и правила игры

Изначально хотелось чистоты эксперимента. Поэтому я сел и составил список из десяти пар-антагонистов, где каждая пара сталкивает между собой два направления, которые в обычной жизни редко здороваются. Опера и трэп, балалаечный фолк и берлинское техно, грегорианский хорал и регги, блюграсс и японский сити-поп — словом, гремучая смесь. Каждой паре полагался один и тот же текст-болванка, чтобы лирика не перетягивала одеяло, а различия рождались только за счёт жанра, тембра и аранжировки. Длина — две минуты, модель — v4, без кастомных стилей по чужим артистам (это же запрещено правилами площадки). К слову, без чёткого регламента такие забеги превращаются в кашу, где сам потом не разберёшь, что откуда выросло.

Текст-болванка я писал намеренно нейтральный. Четыре куплета, припев, бридж. Тема — дорога домой через ночной город, без конкретики места и времени. Ведь именно нейтральность позволяет жанру по-настоящему раскрыться. Если впихнуть в текст словечки вроде «эшафот» или «байер», нейросеть сама уползёт в готику или хип-хоп, и эксперимент потеряет смысл. Получился такой себе лирический полуфабрикат — добротный универсальный каркас.

Опера против трэпа

Первая же пара дала пищу для размышлений. Оперный вариант Suno вытянул на удивление прилично — сопрано с лёгким вибрато, струнные где надо, духовые подпирают на кульминации. Конечно, до Ла Скала тут как до Луны пешком, однако для машины, которая ещё пару лет назад едва склеивала два аккорда, прогресс впечатляющий. Голос в верхнем регистре местами плыл, на длинных нотах появлялся характерный металлический призвук — ложка дёгтя, без которой никак.

Нереальный визуал и кинематографичное видео в пару кликов 🎬

Нужен крутой концепт-арт, реалистичная анимация или профессиональный апскейл? Теперь у вас есть единый доступ к лучшим визуальным нейросетям планеты: Midjourney, Runway, Kling и Sora. Улучшайте качество готовых роликов до максимума с помощью встроенных ИИ-инструментов. Никаких сложных настроек, мощного ПК или зарубежных карт. Всё работает прямо в браузере или в Telegram-боте!

Откройте новые горизонты для творчества. Жмите на ссылку, регистрируйтесь и создавайте шедевры 👉 https://clck.ru/3RNCRL

А вот трэп вышел почти карикатурным. Бит на 140, расстроенные 808-е, вокал с автотюном, прижатым к ушам. Странно, но именно тут нейросеть сработала чище всего: жанр сам по себе тяготеет к шаблонам, и Suno в шаблонах чувствует себя как рыба в воде. Ну, а финальный вердикт по паре простой — опера зрелищнее, трэп аутентичнее. Это две стороны одной медали машинного творчества.

Балалайка и берлинский подвал

Самое неожиданное случилось здесь. Русский фолк с балалайкой, гармошкой и мужским хором я ожидал увидеть в худшем виде — обычно нейросети на этом ломаются. Получилось же на удивление колоритно. Тембр балалайки узнаваемый, гармошка не врёт, хор поёт где-то на грани «Золотого кольца» и деревенского застолья. Изюминка — короткий проигрыш, в котором машина вдруг выдала почти частушечный ритм, хотя я об этом не просил.

Техно из Бергхайна получилось холодным, плотным, с правильной гипнотической бочкой. Четыре на четыре, тёмный гул на басах, шипящий хай-хэт. Минус один — вокал. Машина так и не поняла, что в таком техно вокал должен либо отсутствовать, либо превращаться в обработанный сэмпл.

Она упрямо лепила полноценные куплеты, и от этого трек проседал. Впрочем, инструментальная часть вытянула общее впечатление.

Грегорианский хорал и регги

Тут случился самый странный казус всего забега. Хорал Suno спел на латыни. Я не просил, текст был на английском — но машина сама перевела его в нечто латиноподобное. Вернее, в фонетическую имитацию: слова звучат церковно, но половина из них вообще не существует. Зрелище удручающее с точки зрения филолога и довольно забавное с точки зрения слушателя. Реверберация собора, мужские голоса в унисон, никакого ритма — антураж выдержан.

Регги-версия удивила обратным. Вместо ожидаемого ямайского расслабона нейросеть выдала какой-то ска-роковый гибрид с духовой секцией и слишком энергичным барабанщиком. На третьем такте я поймал себя на мысли, что это больше похоже на британское регги конца семидесятых, чем на корни. Не плохо. Просто не то, что заказывали.

Блюграсс против сити-попа

Блюграсс — отдельная любовь. Банджо, мандолина, контрабас, скрипка, и всё это летит на скорости пригородного экспресса. Нейросеть тут показала, что на американских корневых жанрах её обучали довольно щепетильно. Партия банджо звучала так, будто записана в студии Нэшвилла. Голос — лёгкий тенор с характерным «носовым» оттенком. Ну и, конечно же, без хайвэя в тексте не обошлось, хотя я его туда не вписывал.

Японский сити-поп — другая планета. Если закрыть глаза и не вслушиваться в слова, легко поверить, что это утерянный трек Тацуро Ямаситы. Именно эта пара дала мне понять — машина усвоила не только звуки, но и продюсерские решения целой эпохи.

Электропиано Rhodes, слэповый бас, кристальный женский вокал поверх всего этого великолепия восьмидесятых. Suno уловила суть жанра почти до неприличия точно.

Зачем вообще нужны такие забеги?

Вопрос законный. Можно ли было получить тот же результат, прогнав по жанрам один трек? Вовсе нет. Парный формат показывает контрасты, которые в одиночных запусках не видны. Когда слушаешь только оперу — оцениваешь оперу. Когда сразу после неё включается трэп на тот же текст, в голове щёлкает совсем другой переключатель: ты начинаешь слышать не музыку, а саму нейросеть. Её привычки, её слабости, её неожиданные удачи.

Любопытно, что машина почти всегда лучше справляется с жанрами, у которых много обучающего материала и жёсткая шаблонная структура. Поп, рок, хип-хоп, EDM — здесь всё ровно. А вот узкие нишевые направления (например, дарк-фолк или нойз-эмбиент) даются с переменным успехом. Где-то всплывут странные артефакты в виде шипения, где-то ритмическая сетка поедет. Это связано с тем, что обучающая выборка по таким жанрам тоньше, и нейросети попросту не на что опереться.

Все топовые нейросети в одном месте

Подводные камни эксперимента

На что стоит обратить внимание тем, кто захочет повторить. Во-первых, генерация одного и того же промпта дважды даст разные результаты — иногда кардинально. Поэтому каждую пару я прогонял по три раза и оставлял лучший дубль. Во-вторых, текст-болванка должна быть жанрово нейтральной, иначе вся затея рассыпается. В-третьих, не стоит экономить на детализации промпта: чем точнее описаны инструменты, темп, настроение и эпоха, тем меньше машина уходит в сторону усреднённого попа.

Отдельно стоит упомянуть про авторские права. Suno генерирует музыку, и формально она ваша, но коммерческое использование зависит от тарифа. Бесплатный план — только для личных нужд. Платный — побогаче, но всё равно с оговорками. Не забудьте проверить лицензию перед тем, как тащить такой трек в рекламу или на стриминг. Кошелёк может стать легче, а проблем — больше.

Что в сухом остатке

Десять пар, двадцать треков, около часа чистого звучания. Что я вынес из этой истории? Главное — нейросеть для музыки уже перестала быть игрушкой и превратилась в инструмент. Не замену музыканту, нет. Скорее в эскизный планшет для тех, кто пишет музыку на заказ, для блогеров, подкастеров, монтажёров. Suno справляется с задачей «дай мне джингл за пять минут» лучше любого фрилансера на бирже. Дешевле тоже — серьёзное вложение тут не требуется.

Машина лучше всего поёт там, где её обучали на голосах, и хуже всего — там, где жанр требует «недопения», паузы, дыхания. Опера ей даётся, а минимализм — нет. Скрупулёзная работа со звуком в стиле Эрика Сати или раннего Брайана Ино пока ей не по зубам. Слишком много пустоты, слишком мало шаблона.

Совет напоследок и куда двигаться дальше

Если хочется попробовать что-то похожее — берите не привычные жанры, а максимально далёкие друг от друга. Ставьте тувинское горловое пение против бразильской босановы. Скрещивайте средневековый менестрельский напев с дабстепом. Вытаскивайте машину из её комфортной зоны попа и рока. Именно на стыках рождаются самые неожиданные находки, и именно там видно, на что нейросеть способна на самом деле, а где она просто ловко притворяется. Удачи в собственных музыкальных забегах — пусть каждая ваша пара тварей откроет вам что-то новое и порадует слух.