В сети представлено множество восторженных отзывов о том, как искусственный интеллект буквально отбирает хлеб у профессиональных композиторов, однако на практике получение внятного трека часто превращается в пытку. Обыватель, впервые открывший интерфейс генерации, обычно вбивает пару слов и получает наляпистую звуковую кашу, которая лишь отдалённо напоминает музыку. Буквально десятилетие назад создание собственной песни без студии казалось фантастикой, но сейчас нейросети творят чудеса прямо в браузере. Однако спектр возможностей программы не ограничивается случайными совпадениями, поэтому перед генерацией желательно разобраться в механике составления запросов.
С чего начинается создание трека? С определения базового настроения. Довольно часто пользователи игнорируют этот этап, надеясь на всесилие алгоритмов. А ведь именно грамотно подобранные теги задают фундамент всей композиции. Начинать нужно с жанра, который станет тем самым спасательным кругом в океане хаоса. К первой группе тегов относится стиль, например, синти-поп, дэт-метал или классический джаз. Далее следует указать темп композиции, добавив слова вроде «медленный», «ритмичный» или «быстрый». Отдельно стоит упомянуть атмосферу, которая придаст треку изюминку. Последним в списке идет вокал, где можно прописать желаемый пол исполнителя и манеру пения. Дело в том, что без этих уточнений нейросеть будет блуждать в потёмках, подбирая случайные, порой весьма нелепые сочетания.
Настройка вокала
Выбор голоса. Задача не из лёгких. Многие считают, что достаточно написать «красивый женский голос», но на самом деле система требует гораздо большей конкретики. К слову, абстрактные эпитеты машина понимает из рук вон плохо. Стоит отметить, что добавление технических терминов значительно улучшает результат. Один из самых популярных видов запроса включает тембр (например, баритон или сопрано). Следующий важный критерий — эмоциональная окраска, где уместно использовать слова «агрессивный», «шепчущий» или «меланхоличный». Компактное решение заключается в добавлении ссылок на эпоху, например, «вокал в стиле восьмидесятых». Ну и, конечно же, не стоит забывать про эффекты обработки, такие как эхо или реверберация. Это надёжно. Потому что проверено. Временем.
И всё же львиная доля успеха зависит от инструментала. Солирует в треке гитара или синтезатор — решать именно вам. Естественно, стоит избегать взаимоисключающих понятий, чтобы не сбить алгоритм с толку. Инструментальная база, усиленная мощными басами, дополненная живыми ударными, сдобренная лёгким электронным фоном, звучит всегда выигрышно. Впрочем, иногда перегруженность бьёт по бюджету токенов и нервам слушателя. Не стоит перебарщивать с экзотическими инструментами, если они не вписываются в исконно выбранный стиль. Ведь нейросеть, пытаясь угодить, впихнёт невпихуемое, и вместо добротной песни выйдет какофония.
Работа с текстом: Метатеги
Структурирование лирики. Обычные стихи сплошным текстом алгоритм просто пропоёт на одном дыхании, не делая пауз и акцентов. Безусловно, это не тот результат, о котором грезят авторы. Чтобы разложить по полочкам структуру будущей песни, необходимо использовать специальные метатеги в квадратных скобках. Во-первых, начало всегда помечается тегом вступления, который задает музыкальный тон до появления голоса. Во-вторых, куплеты нужно выделять соответствующей меткой, чтобы голос звучал размеренно и повествовательно. Далее следует припев, где обычно требуется максимальная экспрессия и громкость. Отдельно стоит упомянуть бридж — переходную часть, которая меняет ритм и приковывает внимание слушателя перед финалом. Ну и, наконец, концовка должна плавно затихать, для чего применяется тег аутро. Разумеется, натыкаешься на эти правила не сразу, но они радикально меняют восприятие трека.
Примеры рабочих запросов
Поиск идеальной формулы. Зрелище удручающее, когда пользователи раз за разом сжигают лимиты на неудачные генерации. А начать стоит с проверенных конструкций, которые стабильно выдают добротный результат. Первый пример — бодрый синти-поп с женским вокалом. Текст запроса может звучать так: ритмичный электронный бит, глубокий бас, воздушный женский вокал, ностальгическая атмосфера восьмидесятых, темп сто двадцать ударов в минуту. Это удобно. Ведь песня сразу обретает нужный колоритный антураж.
Второй вариант тяготеет к более тяжёлой музыке. Мрачный индустриальный метал с агрессивной подачей потребует иных формулировок. Стоит прописать в строке стиля: тяжёлые гитарные риффы, искажённый мужской вокал, медленный давящий темп, мрачная атмосфера, двойная бас-бочка. К тому же, здесь отлично сработают метатеги гитарного соло перед последним припевом. Третий пример касается создания спокойной фоновой музыки (инструментала). В этом случае промпт составляется из следующих элементов: мягкое фортепиано, лёгкая струнная секция, кинематографическая атмосфера, отсутствие вокала, спокойное развитие.
Тем более, что система позволяет комбинировать жанры, создавая нечто самобытное. С одной стороны, смешение джаза и хип-хопа звучит рискованно, с другой — результат может превзойти все ожидания. Ложка дёгтя кроется лишь в том, что искусственный интеллект иногда слишком буквально воспринимает слова, поэтому метафоры лучше оставить для стихов, а в окне стиля использовать сухие технические термины. Нельзя не упомянуть, что длина промпта тоже имеет значение. Слишком короткий запрос оставляет машине слишком много свободы, а перегруженный — заставляет её игнорировать половину слов. Оптимально укладываться в пятнадцать-двадцать ёмких характеристик.
Сложно ли исправлять ошибки генерации? Да, но процесс этот довольно увлекательный. Функция продолжения трека творит чудеса, когда первая половина удалась, а финал оказался скомканным. Скрупулезный подход к обрезке неудачного куска и генерации нового продолжения спасёт даже самую безнадёжную композицию. Главное — вовремя заметить фальшь и не пытаться исправить всё одним кликом. Постулаты качественного промптинга сводятся к терпению и готовности экспериментировать с синонимами. Если слово «грустный» не дает нужной тоски, его вполне можно заменить на «меланхоличный» или «депрессивный». Всплывут новые грани звучания, о которых раньше не приходилось и думать.
Создание музыкального шедевра — процесс не сложный, но кропотливый, требующий внимания к нюансам. Внимательное отношение к тегам, стилям и структуре текста обязательно принесёт свои плоды. Изучайте чужие удачные запросы, анализируйте их структуру и адаптируйте под свои нужды. Удачи в музыкальных экспериментах, пусть каждый созданный трек звучит профессионально и запомнится надолго!