Обзор обновлений: чем удивит пользователей Suno версия 5.5

Ещё пару лет назад сама идея генерации музыки через текстовый промт казалась чем-то из области научной фантастики, а сегодня нейросетевые композиторы штампуют треки быстрее, чем иной продюсер успевает допить утренний кофе. Львиная доля внимания в этой нише досталась сервису Suno, который с завидной регулярностью наращивает функционал и перетряхивает собственный движок. И вот на горизонте — версия 5.5, о которой сообщество заговорило ещё до официального анонса. Но чтобы понять, стоит ли ожидания свеч, нужно разобраться в деталях.

Все топовые нейросети в одном месте

Что изменилось в звуковом движке?

Сердце любого музыкального генератора — его модель синтеза. В предыдущей, пятой версии Suno довольно заметно подтянула качество вокала: голоса перестали звучать как роботы из телефонного автоответчика девяностых, появилась естественная вибрация на длинных нотах, а дыхание между фразами стало почти неотличимо от живого исполнения. Версия 5.5 пошла дальше. Движок научился точнее воспроизводить тембральные нюансы — от хрипотцы блюзового вокалиста до звонкого фальцета в поп-балладе. К слову, разработчики отдельно поработали над проблемой «каши» в миксе: инструменты теперь занимают каждый свою частотную нишу, и даже на бюджетных наушниках за восемьсот рублей разница с прошлой версией бросается в глаза. Вернее, в уши. Ведь именно мутный, слипшийся звук был главной претензией аудиофилов к ранним итерациям сервиса.

Отдельно стоит упомянуть работу с низкими частотами. Бас в электронных жанрах раньше тяготел к однообразному гудению, а в версии 5.5 суббас и мид-бас разведены грамотнее — трек на 808-х наконец-то «качает», а не просто бубнит.

Это связано с тем, что модель обучали на расширенном датасете, куда вошли мастерированные референсы из каталогов профессиональных лейблов. Процесс не быстрый и не дешёвый, но результат того стоит.

Промты стали умнее?

Да. И довольно ощутимо. Раньше, чтобы получить от Suno что-то вменяемое, приходилось изощряться с формулировками, подбирать слова методом проб и ошибок, а потом ещё перегенерировать раз десять. Версия 5.5 куда лучше понимает контекст запроса. Написал «грустная акустическая баллада в духе раннего Elliott Smith с приглушённым вокалом и шумом плёнки» — и на выходе получаешь именно это, а не бодрый кантри-рок с синтезаторными подкладками. Нужно отметить, что система теперь распознаёт не только жанровые теги, но и эмоциональные маркеры: «тревожный», «ностальгический», «торжественный» — всё это влияет на выбор тональности, темпа и аранжировки.

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

А вот что действительно приковывает внимание — поддержка мультиязычных промтов стала стабильнее. Русскоязычные запросы в четвёртой версии обрабатывались через пень-колоду, в пятой ситуация улучшилась, а в 5.5 сервис наконец-то перестал путать кириллицу с набором случайных символов. Впрочем, для максимально точного результата опытные пользователи всё ещё рекомендуют дублировать промт на английском. Привычка.

Структура трека и форма композиции

Одна из самых болезненных тем для всех, кто пробовал генерировать музыку нейросетями, — это форма. Куплет, припев, бридж, аутро — казалось бы, элементарная архитектура, но ранние версии Suno справлялись с ней через раз. То припев начинался на третьей секунде, то трек обрывался на полуслове, то бридж звучал как совершенно другая песня, случайно склеенная с первой. В версии 5.5 появился добротный инструмент управления структурой. Пользователь может задать последовательность секций прямо в промте, используя теги вроде [Verse], [Chorus], [Bridge], [Outro], и модель послушно следует этой карте. Не идеально — иногда переходы между секциями звучат чуть механически — но прогресс колоссальный.

Тем более, что добавилась возможность указывать примерную длительность каждой секции. Хочешь растянуть инструментальное вступление на тридцать секунд? Пожалуйста. Нужен короткий четырёхтактовый бридж перед финальным припевом? Тоже не проблема. Раньше о таком контроле обыватель мог только грезить.

Что насчёт инструментальной генерации?

Вот тут — настоящий кладезь нововведений. Suno 5.5 научилась генерировать чистые инструментальные треки без вокала с куда более высоким качеством, чем раньше. В прошлых версиях, если убрать голос, оставалась довольно бедная подложка: пара аккордов на гитаре, незамысловатая барабанная петля и синтезаторный пэд где-то на заднем плане. Сейчас инструментальные композиции звучат плотнее и интереснее. Появились узнаваемые гитарные техники — палм-мьют, хаммер-он, слайды. Фортепианные партии перестали напоминать MIDI-файлы из 2005 года. А электронные текстуры обзавелись модуляциями и автоматизацией фильтров, что придаёт им живость.

Особый интерес вызывает новый режим «Stem Control». Это экспериментальная функция, позволяющая после генерации разделить трек на отдельные дорожки — вокал, ударные, бас, мелодические инструменты — и скачать их по отдельности. Для музыкантов и продюсеров, которые используют Suno как стартовую точку для дальнейшей работы в DAW, такая штука — настоящий спасательный круг.

Ведь раньше приходилось прогонять готовый микс через сторонние сервисы разделения (вроде LALAL.AI), теряя в качестве на каждом этапе.

Стоит ли переходить с бесплатного тарифа?

Вопрос щепетильный. Бесплатный план в Suno по-прежнему даёт около пятидесяти генераций в день, и для баловства этого хватает с головой. Но версия 5.5 доступна в полном объёме только на платных тарифах — Pro и Premier. На бесплатном аккаунте модель 5.5 работает в урезанном режиме: ниже битрейт на выходе, нет доступа к «Stem Control», а длительность трека ограничена двумя минутами вместо четырёх. Бьёт ли подписка по бюджету? Pro-план стоит около десяти долларов в месяц, Premier — порядка тридцати. Для профессионала, который зарабатывает на контенте, это не сильно ударит по кошельку. А вот для любителя, генерирующего треки ради забавы, нет смысла переплачивать — бесплатного лимита вполне достаточно, чтобы оценить общее направление развития.

Однако есть нюанс. На платных тарифах появилась коммерческая лицензия на сгенерированные треки. Это значит, что музыку из Suno теперь можно легально использовать в YouTube-роликах, подкастах и даже рекламных проектах без страха получить страйк. Раньше с этим дело обстояло мутно: формулировки в пользовательском соглашении допускали двоякое толкование, и многие авторы контента предпочитали перестраховаться. Сейчас всё прописано чётко. К тому же, в Premier-плане сохраняется история всех генераций за последние двенадцать месяцев, что довольно удобно для тех, кто работает с большими объёмами.

Интерфейс и мелочи, которые радуют

Визуально Suno 5.5 изменилась не так сильно — и это, пожалуй, правильное решение. Интерфейс и без того был минималистичным, а перегружать его лишними кнопками не стоит. Но кое-что всё-таки добавили. Во-первых, появился встроенный редактор текста песни с подсветкой структурных тегов. Во-вторых, рядом с каждой генерацией теперь отображается «карта настроения» — небольшая визуализация, показывающая эмоциональную динамику трека по секундам. Ну и, наконец, кнопка «Remix» переехала на более заметное место и обзавелась дополнительными параметрами: можно указать, какую именно часть трека хочется перегенерировать, не трогая остальное.

Мелочь? Возможно. Но из таких мелочей складывается общее впечатление. Да и самим разработчикам, судя по всему, важно показать, что они слышат сообщество. Многие из этих доработок — прямой ответ на запросы с форума и Discord-канала проекта.

Все топовые нейросети в одном месте

Подводные камни версии 5.5

Не стоит идеализировать. Ложка дёгтя в этом обновлении тоже присутствует. Первое, что бросается в глаза опытному пользователю, — возросшее время генерации. Если раньше трек появлялся за пятнадцать-двадцать секунд, то теперь ожидание растягивается до сорока-пятидесяти, а в часы пиковой нагрузки — и до полутора минут. Дело в том, что новая модель значительно тяжелее предыдущей, и серверные мощности пока не поспевают за аппетитами алгоритма.

Второй неоднозначный момент — «цензура». Suno 5.5 стала строже фильтровать промты с упоминанием конкретных исполнителей. Написать «в стиле Radiohead» ещё можно, а вот «спой как Том Йорк» — уже нет. Система вежливо откажет и предложит переформулировать запрос. Многие считают это перестраховкой, но на самом деле за этим стоят вполне конкретные юридические риски, связанные с правами на голос и образ артиста. Тем более, что судебные прецеденты в этой области множатся с каждым месяцем.

Кому пригодится обновление?

Контент-мейкерам — безусловно. Быстро сгенерировать фоновую музыку для ролика, подобрать атмосферный трек для сторис или подкаста — всё это Suno 5.5 делает на голову лучше предшественницы. Начинающим музыкантам сервис пригодится как инструмент для поиска идей: задал настроение, получил скетч, а дальше уже дорабатываешь руками в Ableton или Logic. Для профессиональных продюсеров Suno пока не замена полноценному рабочему процессу, но как генератор референсов и демо-версий — вполне себе рабочий вариант. А вот для обывателя, который просто хочет послушать «свою» песню, написанную по собственным словам, — это и вовсе маленькое чудо, не требующее ни музыкального образования, ни дорогого оборудования.

Suno продолжает двигаться в сторону всё более скрупулёзного контроля над результатом, и версия 5.5 — внушительный шаг в этом направлении.

Не идеальный, с оговорками и шероховатостями, но вполне осязаемый. Так что тем, кто давно присматривался к нейромузыке, но откладывал знакомство «до лучших времён», самое время окунуться в процесс — лучших времён, похоже, ждать уже не придётся.