Чья нейросеть Suno: кто разработчик этого популярного искусственного интеллекта

Ещё пару лет назад мысль о том, что компьютер сможет за минуту сочинить полноценный трек с вокалом, припевом и осмысленным текстом, казалась чем-то из области фантастики. А сегодня этим занимаются миллионы людей — школьники, маркетологи, блогеры, домохозяйки. Имя Suno гремит в музыкальных пабликах, его обсуждают на конференциях, на нём делают рекламные джинглы и даже целые альбомы. Но кто же стоит за этим феноменом, чьи руки и головы собрали такой инструмент? А начать стоит с самих людей, которые когда-то сидели в небольшом офисе в Кембридже и мечтали научить машину петь.

«Suno AI». Именно так называется американский стартап-разработчик, базирующийся в штате Массачусетс, в городе Кембридж. Компания довольно молодая — её основали в 2022 году, и за пару лет она успела стать чуть ли не главным ньюсмейкером в области генеративной музыки. Офис находится буквально в нескольких шагах от Гарварда и MIT, что, разумеется, не случайность. Ведь именно эта местность исторически тяготеет к технологическим экспериментам, а доступ к талантам там — настоящий кладезь для любого ИИ-проекта.

Кто стоит у руля?

Костяк команды собрал Майки Шульман — выпускник Гарварда с докторской степенью по физике, человек, который до Suno успел поработать в финтехе и неплохо разобраться в машинном обучении на сложных данных. Рядом с ним встали Джорджи Кумар, Мартин Камачо и Кеннан Лежен — все они вышли из компании Kensho Technologies, занимавшейся аналитикой и распознаванием речи для финансового сектора. Вот такой неочевидный бэкграунд. Команда инженеров и исследователей, которые годами копались в звуковых данных и распознавании речи, в какой-то момент задались вопросом: а почему бы не научить нейросеть не просто слышать, но и творить?

Идея, к слову, родилась не на пустом месте. Изначально ребята работали над инструментами для транскрибации и аудиоаналитики — ничего «попсового», сугубо рабочие задачи. Но в процессе они натыкались на одну и ту же мысль: модели уже умеют разбирать звук на молекулы, так почему бы не пойти в обратную сторону? Собрать звук с нуля.

Так тихий бизнес-проект превратился в музыкальную лабораторию, а лаборатория — в полноценный продукт, которым пользуется весь мир.

Первый релиз и взрывной рост

Публичная бета Suno появилась в конце 2023 года, а уже к весне 2024-го о сервисе говорили все, кому хоть как-то интересны нейросети. Партнёрство с Microsoft Copilot стало тем самым спасательным кругом, который вывел стартап в массы — кнопка генерации песен прямо внутри помощника от Microsoft принесла Suno миллионы новых пользователей буквально за несколько недель. Интересно, что компания при этом долго оставалась камерной — небольшой штат, минимум публичности, никаких громких пресс-конференций. Зато результат — внушительный.

Финансирование льётся рекой. В мае 2024 года Suno закрыла раунд на 125 миллионов долларов, среди инвесторов засветились Lightspeed Venture Partners, Nat Friedman, Daniel Gross и Matrix Partners — бомонд венчурного мира. Оценка компании после раунда перевалила за 500 миллионов. И это, по слухам, далеко не предел — следующие раунды уже обсуждаются.

А что под капотом?

Разработчики не очень-то любят раскрывать кухню, и это объяснимо — конкурентов хватает. Но кое-что известно. Suno использует собственную архитектуру, объединяющую несколько моделей: одна отвечает за генерацию текста песни, другая — за вокал, третья — за инструментальную подложку. Система работает на принципах диффузионных и трансформерных моделей, обученных на огромных массивах аудиоданных. Какие именно данные использовались для обучения — отдельный вопрос, причём довольно болезненный. Об этом чуть ниже.

Версия V1 умела немного и звучала сыровато. V2 уже выдавала вполне сносные треки. А V3, выпущенная весной 2024 года, стала прорывом — четырёхминутные композиции, чистый вокал, реалистичные инструменты. Летом того же года появилась V3.5, осенью — V4 с улучшенной детализацией звука. К 2025 году в обиходе уже модели уровня V4.5 и выше — каждая итерация добавляет нюансы, которые ещё недавно казались недостижимыми.

Судебные баталии и ложка дёгтя

Без скандалов, конечно, не обошлось. Летом 2024 года крупнейшие лейблы — Universal Music Group, Sony Music и Warner Records — подали против Suno иск, обвиняя стартап в использовании защищённых авторским правом записей для обучения моделей. Сумма претензий — астрономическая, до 150 тысяч долларов за каждую песню. Suno, к слову, не стала отнекиваться полностью: в ответе на иск компания признала, что обучение шло на широком корпусе музыки из открытого интернета, но настаивает на принципе fair use — добросовестного использования. Дело тянется до сих пор, и чем оно закончится — большой вопрос. Это та самая обратная сторона медали стремительного успеха.

Многие считают, что суды поставят крест на проекте, но на самом деле подобные истории уже были — и с Napster, и с YouTube, и с Spotify. Музыкальная индустрия каждый раз сначала воюет, потом договаривается. Suno, скорее всего, ждёт тот же путь — лицензионные соглашения, отчисления, легализация.

Чем Suno отличается от конкурентов?

Конкурентов хватает. Udio, основанная бывшими сотрудниками Google DeepMind, дышит в спину. Stable Audio от Stability AI занимает свою нишу. Google MusicLM и Meta MusicGen тоже не дремлют. Но Suno держится на плаву за счёт удобства. Простой интерфейс, минимум настроек, мгновенный результат — обыватель не хочет копаться в сэмплах и нотных раскладках, ему нужна песня здесь и сейчас. И сервис эту задачу решает.

Чем берёт продукт ещё? Качеством вокала. Если ранние нейросети выдавали что-то похожее на пение через подушку, то у Suno голос звучит чисто, с интонациями, эмоциями, дыханием. Поются куплеты, припевы, бриджи. Стилистический разброс — от фолка и блюза до тяжёлого металла и хип-хопа. Безусловно, идеала пока нет — иногда «всплывут» странные артефакты, иногда вокал «плывёт» на длинных нотах. Но сравнивать с тем, что было два года назад, просто бессмысленно.

Где базируется компания и сколько в ней человек?

Штаб-квартира — Кембридж, Массачусетс. Команда, по разным оценкам, насчитывает от 30 до 60 человек. Цифра скромная, особенно на фоне гигантов вроде OpenAI. Но именно компактность позволяет Suno двигаться быстро — никаких бюрократических согласований, никаких многоступенчатых ревью. Решили — сделали — выкатили. Так работают только небольшие команды, где каждый отвечает за конкретный кусок продукта.

Кстати, о продукте. Помимо веб-версии существует мобильное приложение для iOS, выпущенное в 2024 году. Android-версия подоспела позже. Подписочная модель — есть бесплатный лимит (несколько генераций в день), есть платные планы Pro и Premier — последний открывает коммерческое использование треков, что бьёт по бюджету не сильнее, чем стандартный стриминговый сервис.

Стоит ли доверять Suno?

Вопрос непростой. С точки зрения качества — однозначно стоит, продукт зрелый и работает стабильно. С точки зрения юридической чистоты — пока туман. Если планируется коммерческое использование, не стоит забывать про судебные процессы и потенциальные риски. Тем более, что условия лицензирования меняются. Лучше всё-таки внимательно читать пользовательское соглашение перед тем, как загружать сгенерированный трек на стриминги.

Шульман в интервью не раз говорил, что цель Suno — не заменить музыкантов, а дать инструмент любому человеку, у которого в голове крутится мелодия, но нет ни инструмента, ни голоса, ни студии. Демократизация творчества.

Звучит красиво, хотя и спорно — профессионалы воспринимают такие заявления неоднозначно. Одни видят угрозу профессии, другие — новый творческий инструмент, третьи — просто модную игрушку.

Что дальше?

Прогнозы — дело неблагодарное, но кое-что уже видно невооружённым глазом. Suno активно работает над функцией редактирования отдельных партий, голосовым клонированием (с согласия владельца голоса, разумеется) и интеграциями с DAW — профессиональными студиями вроде Ableton и Logic Pro. Всё идёт к тому, что нейросеть превратится из «игрушки для песенок» в полноценный инструмент саунд-продюсера. А там и до полноценных альбомов, написанных в коллаборации человека и ИИ, рукой подать.

Музыкальный мир меняется на глазах, и Suno в этих переменах играет одну из главных ролей. Стартап из Кембриджа, выросший из идеи нескольких физиков и инженеров, за два года превратился в имя нарицательное. Если хочется попробовать собственными руками — заходите, генерируйте, экспериментируйте, не бойтесь ошибаться. Возможно, именно ваш трек, рождённый в недрах нейросети от Майки Шульмана и его команды, завтра соберёт миллионы прослушиваний. Удачи в музыкальных опытах — и пусть каждая сгенерированная песня запомнится надолго.