Чем удивляет Suno последняя версия: обзор главных обновлений

Ещё пару лет назад мысль о том, что нейросеть может за минуту собрать готовый трек с вокалом, гитарными запилами и приличным сведением, казалась чем-то из разряда фантастики. Музыканты посмеивались, продюсеры пожимали плечами, а слушатели крутили пальцем у виска. Но индустрия меняется стремительно, и сервис Suno уже давно перестал быть забавной игрушкой для энтузиастов. Свежая версия — это, по сути, заявка на то, чтобы потеснить привычные DAW в нише быстрых черновиков и демо. А начать стоит с того, что именно изменилось под капотом и почему об этом сейчас говорят буквально все, кто хоть как-то связан со звуком.

Все топовые нейросети в одном месте

Что нового под капотом

Главное обновление касается самой модели генерации. Разработчики переписали значительную часть архитектуры, отвечающей за работу с тембрами, и результат бросается в глаза с первых секунд прослушивания. Раньше вокал звучал плосковато, словно сквозь старый радиоприёмник. Сейчас — объёмно, с воздухом, с дыханием. Появились внятные сибилянты, реалистичные согласные, узнаваемая подача. К слову, общий битрейт итогового файла тоже подрос, и это сразу слышно на хороших мониторах.

Отдельно нужно отметить работу с инструментами. Гитары перестали гудеть однообразной кашей, а ударные обрели чёткую атаку и внятный низ. Бас наконец-то перестал плавать по миксу, как медуза.

Довольно ощутимый шаг вперёд сделала и стереокартина — инструменты разнесены по панораме грамотно, без классической для нейросетей «моно-стены» посередине. Звучит дороже. Намного дороже.

Длительность трека

Сложно ли теперь собрать полноценный сингл? Вовсе нет. Лимит на длину одной генерации заметно вырос, а функция расширения композиции (extend) работает гораздо стабильнее, чем раньше. Можно спокойно нанизывать куплеты, припевы и бриджи, не боясь, что на стыках вылезут щелчки или резкие смены тональности. Модель удерживает в памяти заданный вайб, тембр голоса исполнителя и общую гармонию на протяжении нескольких минут. А ведь именно это всегда было ахиллесовой пятой подобных сервисов.

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

Раньше склейка двух кусков превращалась в отдельный квест с бубном. Сейчас — пара кликов, и трек растёт до четырёх, пяти, а при желании и до восьми минут. Полноценная прог-роковая эпопея? Без проблем. Эмбиент-полотно на медитацию? Тоже посильно. Удивительно, но даже на длинных дистанциях вокалист «не устаёт» и не начинает плыть.

Как обстоят дела с вокалом

С вокалом дело обстоит интереснее всего. Новая модель научилась передавать эмоцию — настоящую, а не дежурную. Шёпот звучит как шёпот, крик — как крик, а не как пережатый клиппингом писк. Появились реалистичные придыхания, лёгкая хрипотца, фирменные «ломкости» голоса на переходах между регистрами.

Многие считают, что синтетический вокал всегда звучит стерильно, но на самом деле свежие генерации Suno порой обманывают даже подготовленное ухо.

Бэк-вокал — отдельная радость. Хоры, переклички, многоголосные гармонии в духе Queen или The Beach Boys теперь собираются без танцев с бубном. Достаточно прописать в промпте характер подпевок, и модель сама расставит их по аккордам. Кстати, подтянулась и работа с языками. Русский, испанский, японский, французский — произношение стало куда чище, хотя ложка дёгтя всё же есть. На редких языках по-прежнему случаются забавные акценты, и с этим, видимо, придётся пожить ещё какое-то время.

Жанровая палитра

Палитра стилей расширилась внушительно. Если прошлые версии уверенно тянули поп, рок и условный лоу-фай, то теперь к ним добавились куда более капризные направления. Дрим-поп с его воздушными гитарами и реверберационными хвостами. Сложный джаз со свинговой подачей и живой импровизацией медных. Дэт-метал с бластбитами и характерным гроулом — да, это тоже теперь по силам. Особый интерес вызывает работа с этникой: индийские раги, арабские макамы, балканские ритмические рисунки звучат уже не как карикатура, а как осмысленное цитирование.

Электроника — отдельная вселенная. Техно, хаус, драм-н-бэйс, дабстеп — каждое направление получает корректную ритм-секцию, узнаваемые саунд-дизайнерские приёмы и характерные для жанра басовые линии. Ну и, конечно же, гибриды. Фолк-метал с балалайкой, бразильский фанк под симфонический оркестр, корейский трэп с традиционными духовыми — пространство для экспериментов огромное.

Стоит ли экономить?

Бесплатный тариф никуда не делся, и для первых проб его вполне достаточно. Но если задуматься о регулярной работе, бесплатных кредитов хватает на пару дней лёгкого баловства, не больше. Платная подписка кошелёк не разорит, хотя и совсем уж копеечной её не назовёшь. Зато открывается коммерческая лицензия, приоритетная очередь генерации и расширенные лимиты — для тех, кто пилит контент на регулярной основе, это становится серьёзным подспорьем.

Нет смысла гнаться за топовым тарифом сразу. Логичнее начать со среднего, попробовать рабочий ритм, понять свои реальные аппетиты — и уже потом докручивать. Тем более, что переключаться между планами можно в пару кликов.

Загрузка собственного материала

А вот это, пожалуй, самое интригующее обновление. Появилась полноценная возможность загружать свои аудио-фрагменты и использовать их как затравку. Напел мелодию в диктофон? Закинул в Suno — и получил аранжировку. Записал партию акустики? Модель достроит вокруг неё ритм-секцию, бас, подпевки.

Это меняет правила игры. По сути, нейросеть превращается из генератора случайностей в полноценного соавтора, который слушает тебя, а не выдаёт усреднённый продукт по ключевым словам.

Качество исходника, разумеется, влияет на результат. Запись на встроенный микрофон ноутбука с гулом холодильника на фоне даст соответствующий итог. А вот аккуратно записанный фрагмент в тихой комнате творит чудеса. Это же правило касается и стемов — чем чище материал на входе, тем интереснее то, что выходит на финале.

Промпт-инжиниринг

Работа с текстовым описанием стиля стала тоньше и капризнее одновременно. Модель научилась понимать сложные комбинации тегов, отсылки к конкретным эпохам и поджанрам, описания настроения через метафоры. Можно написать «звучание подвального клуба Берлина девяностых, дымно, грязно, с ламповым теплом», и результат будет узнаваемо тяготеть именно туда. Раньше такие нюансы модель пропускала мимо ушей.

Но есть и минусы. Слишком длинные описания иногда сбивают модель с толку, и она начинает смешивать всё подряд. Лучше отказаться от попыток упихнуть в промпт двадцать жанров сразу. Куда продуктивнее работает формула: основной жанр, два-три уточняющих тега, описание вокала, общее настроение. Коротко, ёмко, по делу.

Подводные камни

Без ложки дёгтя не обошлось. Модель по-прежнему иногда чудит с текстами на русском — может проглотить окончание, поставить ударение не туда или превратить осмысленную строку в фонетическую кашу. Случается это нечасто, но регенерировать кусок порой приходится. Также бывают артефакты на резких динамических переходах — лёгкое металлическое звяканье, которое слышно только в наушниках на хорошей громкости.

Все топовые нейросети в одном месте

Авторские права — отдельная история, в которой пока больше тумана, чем ясности. Коммерческое использование разрешено по платной подписке, но юридическая практика в этой сфере только формируется. Тем более, что разные стриминги относятся к ИИ-музыке по-разному. Кто-то спокойно принимает, кто-то ужесточает правила, кто-то требует обязательной маркировки. Перед тем как заливать треки на площадки, нелишним будет свериться с актуальными правилами конкретного сервиса.

Кому это всё пригодится

Музыканту-любителю — однозначно. Возможность за полчаса собрать черновик аранжировки, который раньше отнимал неделю, дорогого стоит. Контент-мейкеру — тоже да. Фоновая музыка под ролики, джинглы, заставки, подкаст-интро — всё это теперь делается на коленке без отчислений библиотекам стоковой музыки. Даже профессиональные продюсеры начали присматриваться к Suno как к инструменту для быстрого прототипирования идей. Услышал интересный ход в сгенерированном треке — взял на карандаш, переиграл вживую, довёл до ума в студии.

А вот заменит ли это живых музыкантов? На мой взгляд — нет, и в обозримом будущем не заменит. Suno — мощный соавтор и быстрый исполнитель. Но не художник.

Что дальше

Темп, с которым команда выкатывает обновления, впечатляет. Каждые несколько месяцев — заметный качественный скачок. Если так пойдёт и дальше, через пару лет грань между сгенерированным и записанным в студии материалом станет неразличимой даже для профессионалов. Уже сейчас многие треки, попадающие в плейлисты, имеют ИИ-происхождение — просто об этом не принято говорить вслух.

Свежая версия Suno — отличный повод попробовать себя в роли продюсера, даже если за плечами нет музыкального образования и полки с виниловыми пластинками. Достаточно идеи, нескольких удачно подобранных слов и щепотки терпения на регенерации. Удачи в музыкальных экспериментах, и пусть первый же сгенерированный трек удивит даже самого требовательного слушателя — вас самих.