Секреты настройки: как в Suno сделать дуэт из двух голосов

Нейросети для генерации музыки буквально перевернули представление о домашней студии — то, что ещё пять лет назад требовало микрофона за тысячу долларов и звукорежиссёра с опытом, сейчас умещается в браузерную вкладку. Но стоит копнуть чуть глубже, и оказывается: сгенерировать сольный трек — задача школьного уровня, а вот заставить Suno спеть полноценный дуэт, где мужской и женский голоса перекликаются, отвечают друг другу и сходятся в припеве — уже совсем другая история. Алгоритм по умолчанию тяготеет к одному вокалисту, и переубедить его получается далеко не с первой попытки. А начать стоит с понимания того, как вообще движок воспринимает ваш текст и теги.

Как Suno «слышит» голоса?

Внутри сервиса нет отдельных кнопок «выбрать певца» и «выбрать певицу» — машина ориентируется исключительно на текстовое поле и теги стиля. Дело в том, что модель обучалась на огромном массиве песен с разметкой, и она научилась связывать определённые слова-метки с тембральными характеристиками. Когда вы пишете в стиле «male vocal, female vocal, duet», нейросеть подбирает два голосовых отпечатка и пытается их чередовать. Звучит просто? На практике — довольно капризно. Алгоритм может проигнорировать вторую партию, слепить голоса в унисон или вовсе выдать одного певца с лёгкой обработкой.

Метки — это не гарантия, а лишь сильный намёк системе.

Базовая разметка: с чего начинается дуэт

Главное оружие при создании дуэта — структурные теги внутри текста песни. Suno отлично понимает квадратные скобки, и именно через них передаётся вся «режиссура» трека. Перед каждым куплетом, припевом или строкой указывается, кто поёт. Выглядит это так: [Verse 1: Male] — затем строки мужской партии, далее [Verse 2: Female] — и женская часть. Для совместного пения работает связка [Chorus: Male & Female] или [Duet]. К слову, движок понимает и более экзотические пометки — [Male whisper], [Female harmony], [Both voices overlapping]. Каждая такая метка чуть-чуть смещает вероятность того, что модель действительно разведёт партии по тембрам.

А если хочется конкретики?

Можно ли указать тип голоса точнее? Да, и тут открывается простор для экспериментов. Вместо общего «male» допустимо прописывать [Verse: Deep male baritone] или [Verse: Soft female soprano]. Сопрано, альт, тенор, бас — все эти слова движок распознаёт. Кроме того, неплохо срабатывают эмоциональные пометки: [Verse: Female, melancholic] или [Bridge: Male, raspy and tired]. Чем точнее портрет певца — тем выше шанс, что Suno не подсунет вам безликий усреднённый голос. Но не стоит перебарщивать: если в одну скобку запихнуть пять прилагательных, алгоритм путается и выдаёт кашу.

Поле стилей: тонкая настройка тембра

Помимо разметки в тексте, есть ещё поле Style of Music (или Styles в новой версии интерфейса). Туда заносится не только жанр, но и характеристики вокала, действующие на весь трек. Связка вроде «indie folk, male and female duet, intimate, acoustic guitar, harmonies» работает заметно лучше, чем сухое «folk».

Слово harmonies — настоящий спасательный круг, ведь именно оно подталкивает нейросеть к двухголосию в припевах.

Тем более, что вместе с ним хорошо ложатся пометки call and response (перекличка) или back and forth vocals. Эти выражения пришли из англоязычной поп-музыки и описывают именно тот формат, когда герои песни словно разговаривают.

Структура песни: режиссура диалога

Punch! Дуэт — это не просто два голоса. Это история на двоих. Если вы пишете текст без оглядки на то, кто и кому отвечает, нейросеть получит просто чередование строф, а слушатель — ощущение склеенных кусков. Куда интереснее выстроить драматургию: первый куплет — реплика мужчины, второй — ответ женщины, бридж — их спор или согласие, финальный припев — слияние. Конкретный пример работающей схемы: [Verse 1: Male] герой рассказывает о расставании, [Verse 2: Female] героиня даёт свою версию, [Pre-Chorus: Male] нарастание эмоции, [Chorus: Both] кульминация в унисон, [Bridge: Female solo] перелом, [Final Chorus: Both with harmony] примирение. Такая раскладка читается движком как сценарий, и партии действительно расходятся.

Что насчёт совместного пения в припеве?

Самая частая проблема новичков — припев звучит сольно, хотя по задумке там должны быть оба. Решается это тройной защитой. Во-первых, тег [Chorus: Male & Female together] прямо в тексте. Во-вторых, дублирование строк — одну и ту же фразу можно записать дважды подряд, помечая разными скобками, и модель воспримет это как наслоение. В-третьих, в поле стилей обязательно слово harmonies или duet vocals. Если все три уровня сработают — а они срабатывают примерно в семи случаях из десяти — вы услышите настоящее двухголосие с третями и квинтами. Иногда Suno добавляет даже бэк-вокал, которого вы не просили. Приятный бонус.

Версии модели: где живёт настоящий дуэт

Важный нюанс, о котором забывают: разные версии Suno по-разному относятся к многоголосию. Старые ветки (v3 и ниже) почти не умели разводить голоса — выдавали одного певца с эффектом хора. Версия v3.5 научилась переключать тембры между куплетами. А вот v4 и более свежие сборки уже уверенно держат двух разных вокалистов на протяжении всей песни и даже соблюдают их характер в бридже. Поэтому при работе над дуэтом разумно сразу выбирать самую новую модель из доступных. На бесплатном тарифе она тоже есть, просто количество генераций в день ограничено десятью треками. Этого, впрочем, вполне хватает для отладки.

Подводные камни и типичные ошибки

Задача не из лёгких. Даже опытные пользователи натыкаются на одни и те же грабли. Первая беда — слишком длинный текст. Если запихнуть в окно сразу шесть куплетов и три припева, движок начнёт сокращать, пропускать партии и сливать голоса. Лучше держаться в пределах двух-трёх куплетов и одного-двух припевов на одну генерацию. Вторая ошибка — смешение языков в метках: русский текст с английскими тегами работает отлично, а вот метки на русском (типа [Куплет: Мужской]) Suno почти не понимает.

Тэги — только латиницей.

Третий подводный камень — конфликт стилей. Если в поле жанра указано «death metal», а в тексте просите [Female soft whisper], модель не поймёт, какой инструкции верить, и выдаст компромисс, который не понравится никому.

Как добиться стабильного результата?

Секрет в итеративности. Первая генерация почти никогда не идеальна — это нормально. Suno предлагает функцию Extend и Replace Section, и вот они-то и творят чудеса. Допустим, куплеты получились отличные, а припев спел только мужчина. Не нужно генерировать всё заново — достаточно через Replace Section перезаписать припев с уточнённой меткой [Chorus: Both voices, female lead, male harmony below]. Кошелёк не станет легче — функция входит в обычный лимит, — а результат подтянется до нужного уровня. К тому же есть Persona — возможность зафиксировать понравившийся голос из удачной генерации и переиспользовать его в новых треках. Сохранили мужской тембр из одной песни, женский — из другой, и собрали дуэт мечты.

Загрузка собственного текста и мелодии

Отдельно стоит упомянуть Custom Mode. Без него полноценный дуэт собрать практически невозможно, ведь только там открывается ручная разметка. В простом режиме нейросеть сама пишет текст и сама расставляет акценты — на ваши пожелания о двух голосах ей, мягко говоря, всё равно. А вот в кастомном режиме вы становитесь режиссёром: пишете текст со скобками, прописываете стиль, выбираете длительность. Если есть готовая мелодия или а капелла — её тоже можно загрузить через функцию Upload Audio (доступна на платных тарифах) и попросить движок «допеть» партию второго голоса поверх. Это тяжёлый, но эффективный способ получить максимально живой результат.

Финальная шлифовка и сведение

Получили устраивающий вариант? Не торопитесь публиковать. Suno даёт возможность скачать трек в формате WAV — и грех этим не воспользоваться. Дальше открываете любой бесплатный редактор (Audacity вполне справляется), чуть подравниваете громкости голосов, добавляете лёгкий реверб на женскую партию и компрессию на мужскую — и дуэт начинает звучать радийно. Многие считают, что нейросетевой трек невозможно довести до коммерческого качества, но на самом деле пять минут постобработки превращают сырую генерацию в добротный, почти студийный результат. Дело в том, что Suno мастерит микс с запасом по динамике — там есть что подкручивать.

Дуэт в Suno — это не магия и не везение, а вполне укладывающаяся в голове система из трёх слоёв: разметка в тексте, поле стилей и правильная модель. Освоив этот треугольник, вы перестанете зависеть от случайности и начнёте получать именно те песни, которые слышите внутри. Пусть первый ваш виртуальный дуэт запомнится надолго, а голоса сойдутся в припеве так, будто пели вместе годами. Удачи в экспериментах — и пусть нейросеть удивляет вас в хорошем смысле.