Проект Михаил Suno: песни и генерация голоса по именам

Ещё пару лет назад мысль о том, что нейросеть напишет песню с именем твоего друга в припеве, казалась чем-то из разряда забав для гиков. А сегодня поздравительный трек, спетый «как будто живым артистом», заказывают на день рождения наравне с тортом. Особенно бурно эту нишу подхватил рунет — и в эпицентре оказался феномен, который пользователи окрестили «Михаил Suno». Странное имя для алгоритма, согласитесь. Но именно за ним скрывается целый пласт народного творчества, мемов и вполне рабочих сценариев применения, и разобраться с этим стоит по порядку.

Все топовые нейросети в одном месте

Что вообще такое «Михаил Suno»

Начнём с главного недоразумения. Никакого официального продукта под названием «Михаил» у американского сервиса Suno нет — это пользовательская легенда, родившаяся в русскоязычных Telegram-чатах и TikTok. Suno AI — нейросеть для генерации музыки по текстовому промту, появившаяся в открытом доступе в конце 2023 года. А «Михаил» — это собирательный образ виртуального вокалиста, которого нейросеть будто бы «вызывает», когда ты просишь спеть песню для конкретного человека по имени. Тембр получается мужской, чуть хрипловатый, с лёгким эстрадным надрывом — и кто-то однажды в шутку назвал его Мишей. Прижилось. Теперь под тегом «спел Михаил» по сети расходятся тысячи треков — от трогательных поздравлений маме до сатирических куплетов про начальника отдела закупок.

Как работает генерация по имени

Механика на удивление простая. Ты заходишь в Suno (через сайт или бота-посредника, которых в рунете развелось десятками), вбиваешь промт — жанр, настроение, стиль вокала — и в текстовое поле вписываешь свою лирику. Имя адресата ставишь прямо в строки: «Светочка, родная, с днём рождения». Нейросеть превращает буквы в фонемы, а фонемы — в пение. Звучит это так, будто артист действительно знает, к кому обращается. Хотя на деле — никакой магии, лишь тонкая фонетическая склейка. Сложно ли получить приличный результат с первого раза? Чаще всего — нет, но повозиться придётся. Ведь редкие имена (Ефросинья, Радослав, Эльвира) алгоритм коверкает, путает ударения и порой выдаёт нечто вроде «Эль-вии-ра» с растяжкой не там, где надо.

С короткими и привычными именами всё гладко: Аня, Маша, Дима, Саша ложатся в ритм без сучка и задоринки. А вот двусложные с трудными сочетаниями согласных — уже лотерея. Тут выручает приём «фонетической подсказки»: пишешь имя так, как оно должно звучать, прямо в скобках или через дефис (Свет-ла-на).

Жанры, в которых «Михаил» особенно хорош

Шансон. Тут он буквально солирует — голос ложится на гитарные переборы так, словно за студийным микрофоном настоящий ресторанный артист. Ресторанная эстрада 90-х, дворовая лирика, блатная романтика — нейросеть будто всю жизнь в этом варилась. К слову, именно шансонные треки и сделали «Михаила» вирусным: поздравить тестя песней «в стиле Михаила Круга, но про Геннадия Петровича» — это уже почти жанр.

Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸

Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.

Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL

Поп-баллада. Романтичный медляк с роялем и струнными — второй конёк. Здесь голос звучит мягче, теплее, без хрипотцы. Подойдёт для свадьбы, годовщины, признания в любви. Получится трогательно, иногда даже с мурашками. Хотя и тут есть ложка дёгтя — припев нейросеть порой повторяет с одинаковой интонацией, и при долгом прослушивании это утомляет.

Рок и тяжёлые жанры. Сюрприз: «Михаил» вполне сносно справляется и с рычанием, и с распевными припевами в духе русского рока. Конечно, до Кипелова далеко, но для шуточного поздравления коллеге-металлисту — самое то. Особый интерес вызывает попытка нейросети спеть рэп: получается с переменным успехом, ритм она держит, а вот игра со словом и подачей пока хромает.

Тексты: писать самому или довериться машине

Вот тут начинается самое интересное. Suno умеет сочинять лирику автоматически — достаточно задать тему. Но если хочется именно «попадания в человека», текст лучше всё-таки писать руками. Ведь нейросеть не знает, что ваш брат пять лет копил на «Ниву», а тёща обожает свою дачу в Малаховке. Эти детали — изюминка любого поздравления, и без них песня превратится в безликую открытку.

С чего начинать сочинение? С короткого досье на адресата. Имя, возраст, профессия, хобби, забавная привычка, общая история. Дальше — выбор размера. Самый ходовой — четырёхстопный хорей, под него ложится львиная доля русской попсы. Рифмы можно подсмотреть у Yandex GPT или ChatGPT, благо они с этой задачей справляются за минуту. Готовый текст вставляешь в Suno в режиме Custom Lyrics — и нейросеть поёт ровно то, что ты написал, не добавляя отсебятины.

Подводные камни и где «Михаил» спотыкается

Нельзя не упомянуть про слабые места. Во-первых, длинные строки. Если в куплете больше десяти слогов, алгоритм начинает «зажёвывать» окончания или откровенно проглатывать слова. Во-вторых, ударения. Нейросеть обучена в основном на англоязычных корпусах, и русская акцентуация для неё — больной вопрос. ВОрота вместо ворОта, зАмок вместо замОк — такие казусы всплывают регулярно. В-третьих, фоновая «вата»: на бесплатном тарифе качество микса заметно проседает, бас гудит, верха режут слух.

Что с этим делать? Не стоит пытаться запихнуть в одну песню эпопею. Короткие, рубленые строки с чёткой ритмикой — лучший друг генератора. Ударения в спорных словах есть смысл проверять заранее и при необходимости менять слово на синонимичное. Ну и, конечно, генерировать стоит не один раз, а пять-семь — Suno на каждом проходе выдаёт новый вариант, и из пачки выбираешь лучший.

Сколько это стоит и стоит ли платить

Бесплатный лимит даёт около десяти треков в сутки, чего хватает на эксперименты. А вот для серьёзной работы — клипа, поздравления с заказом, коммерческого ролика — без подписки не обойтись. Платная версия открывает доступ к более длинным композициям (до восьми минут), приоритетной очереди и, что важнее, к коммерческой лицензии. Бьёт ли это по бюджету? Около десяти долларов в месяц на стартовом тарифе — не сказать, что кошелёк станет легче на ощутимую сумму. Для тех, кто делает поздравления на заказ, подписка окупается за пару клиентов.

Кстати, в рунете расцвёл целый рынок «песен под ключ»: человек отправляет данные именинника, исполнитель прогоняет промт через Suno, добавляет обложку, делает мастеринг в любом аудиоредакторе — и отдаёт готовый mp3 за полторы-три тысячи рублей. Бизнес-модель проста до неприличия, а спрос льётся рекой, особенно перед праздниками.

Этическая сторона: чужой голос и авторские права

А теперь — серая зона. Многие пытаются заставить «Михаила» спеть голосом Шуфутинского, Лепса или Михайлова. Получается похоже, иногда жутковато похоже. Но Suno официально блокирует промты с именами живых артистов, и обходить эту защиту — занятие сомнительное. Юридически клонирование чужого тембра без разрешения — прямое нарушение прав на голос как объект личных неимущественных прав. В России судебная практика по таким делам только формируется, однако прецеденты уже есть, и заканчиваются они для нарушителей не радужно.

С собственными песнями — другое дело. Текст ваш, музыка сгенерирована, голос — синтетический. По лицензии Suno на платном тарифе вы получаете права на коммерческое использование. То есть можно загружать на стриминги, монетизировать на YouTube, использовать в рекламе. Несколько российских артистов-любителей уже выложили альбомы, целиком собранные через нейросеть, и пара треков набрала по миллиону прослушиваний на VK Музыке.

Все топовые нейросети в одном месте

Альтернативы и что выбрать новичку

Suno — не единственный игрок. Есть Udio с более чистым звуком и упором на инструменталы, есть отечественный «Шедеврум» от Яндекса (он умеет в музыку, но скромно), есть Mubert для фоновых треков. Однако именно по части вокала с именами «Михаил» пока вне конкуренции — спасибо обширной русскоязычной аудитории, которая своими промтами буквально дообучила алгоритм понимать наш язык лучше, чем многие западные аналоги.

Новичку есть смысл начать с самого простого: короткий поздравительный куплет на двадцать секунд, понятный жанр (поп или шансон), привычное имя. Получив первый удачный результат, можно усложнять — добавлять биты, экспериментировать с дуэтами (Suno умеет генерировать женский и мужской вокал в одной песне), миксовать жанры. К тому же не стоит забывать про обложку: нейросеть Midjourney или Kandinsky нарисует её за минуту, и трек обретёт законченный вид.

Куда всё это движется

Развитие идёт стремительное. Буквально год назад голос звучал как робот с насморком, сейчас — почти неотличимо от живого исполнителя. Через пару лет, по прогнозам разработчиков, появится возможность загружать референс собственного голоса и петь «своим тембром» в любом жанре. Это и пугает, и восхищает одновременно. Профессиональные вокалисты переживают, обыватель — радуется новой игрушке. Обе стороны медали имеют право на существование.

Главное — не воспринимать «Михаила» как замену живой музыке. Это инструмент, как фотоаппарат для художника или калькулятор для бухгалтера. Сам по себе он ничего не творит — творит человек, который пишет осмысленный текст, чувствует адресата и не ленится переделать промт десять раз.

Сделайте поздравление с душой, добавьте личных деталей, не бойтесь экспериментировать с жанрами — и ваш трек запомнится надолго. Удачи в первых нейросетевых хитах, и пусть «Михаил» поёт для ваших близких так, будто знал их всю жизнь.