Что известно о команде Suno team: разработчики популярной нейросети

Музыка, написанная машиной за пару минут, ещё лет пять назад казалась забавным экспериментом — игрушкой для гиков, не более того. А сегодня треки, сгенерированные нейросетью Suno, льются рекой по соцсетям, попадают в плейлисты на стриминговых платформах и даже становятся фоном для рекламных роликов крупных брендов. За всем этим шумом стоит небольшая, но крайне любопытная команда из Кембриджа, штат Массачусетс. И познакомиться с ней поближе стоит хотя бы потому, что эти люди всерьёз меняют индустрию, к которой ещё недавно подступиться было почти невозможно.

Все топовые нейросети в одном месте

Кто стоит у истоков?

Основателей всего четверо, и каждый из них пришёл в проект не с улицы. Майки Шульман, Георг Кучко, Мартин Камачо и Кинан Фрейберг — именно эта четвёрка запустила Suno в 2022 году. Любопытно, что познакомились они не в музыкальной студии и не на хакатоне для меломанов. Местом встречи стал Kensho Technologies — компания, занимающаяся машинным обучением для финансового сектора. Казалось бы, где Уолл-стрит, а где поп-музыка. Но именно опыт работы с большими данными и аудиосигналами в этой фирме и подтолкнул ребят к мысли, что аудио — следующая большая территория для генеративных моделей.

Майки Шульман, генеральный директор

Майки — лицо компании и её главный голос на конференциях. По образованию он физик, защитил докторскую в Гарварде, причём занимался темами, далёкими от музыки. А вот хобби его выдаёт — Шульман давно увлекается игрой на классической гитаре и пением в любительских хорах. Эту деталь он сам не раз упоминал в интервью, объясняя, почему ему так хотелось дать возможность писать музыку людям без музыкального образования. До Suno он руководил направлением машинного обучения в Kensho, где курировал разработку речевых моделей.

И, судя по всему, именно там у него сложилась картина: если уж нейросеть может разобрать речь аналитика на финансовом совещании, то почему бы ей не научиться сочинять припев?

Георг Кучко: тихий технарь

В тени публичного Шульмана работает Георг Кучко — человек, который, по словам коллег, и собрал первые рабочие прототипы. Австрийские корни, физико-математический бэкграунд, увлечение электронной музыкой ещё со студенческих лет. Кучко редко даёт интервью, и это уже о многом говорит. Он из тех инженеров, кто предпочитает писать код, а не доклады. К слову, именно его считают автором архитектурных решений, благодаря которым Suno научилась генерировать не просто мелодию, а связку «голос плюс инструментал» одновременно. До этого подобные системы шли по пути разделения: сначала музыка, потом отдельно вокал. Кучко с командой пошли иначе.

Все топовые нейросети в одной подписке! 🚀

Устали оплачивать десятки сервисов отдельно и постоянно включать VPN? Появилась платформа, которая объединяет более 90 передовых ИИ в одном окне. Пишите тексты с новейшими версиями GPT и Claude, создавайте шедевры в Midjourney и генерируйте видео в Sora и Kling. Тексты, изображения, видео и музыка — всё работает на любых устройствах без «танцев с бубном».

Попробуйте бесплатно прямо сейчас! Переходите по ссылке и получите бонусные токены для старта 👉 https://clck.ru/3RNCRL

Мартин Камачо и Кинан Фрейберг

Мартин занимается инфраструктурой и масштабированием. Задача не из лёгких. Ведь когда сервисом одновременно пользуются миллионы людей, а каждый запрос — это генерация полноценного двухминутного трека, нагрузка на серверы получается внушительная. Камачо разруливает эти процессы, выстраивая систему так, чтобы пользователь получал готовую песню за тридцать-сорок секунд, а не ждал по десять минут, как было на ранних этапах. Кинан Фрейберг отвечает за исследовательскую часть. Его сфера — обучение моделей на огромных аудиомассивах и поиск способов сделать звук чище, а вокал — естественнее. Именно благодаря его работе третья и четвёртая версии модели заметно ушли вперёд по качеству звучания.

Размер команды и её философия

Сколько всего человек работает в Suno? На начало 2024 года — около пятидесяти. К концу того же года штат разросся примерно до сотни сотрудников, и продолжает расти. Цифра скромная, особенно если сравнить с гигантами вроде OpenAI или Google DeepMind. Но в этом и есть фишка. Команда сознательно держит компактный формат, чтобы не утонуть в бюрократии. Шульман не раз говорил, что предпочитает нанимать «универсалов» — людей, которые могут и код написать, и с продуктовой стороны идею оценить, и в музыке хоть немного разбираются. Подход спорный, конечно. Однако пока он работает.

Где офис и как живёт компания

Штаб-квартира расположилась в Кембридже — городке-спутнике Бостона, где буквально на каждом углу натыкаешься на стартапы и лаборатории MIT. Место выбрано не случайно. Здесь же, по соседству, базируются десятки других AI-компаний, что упрощает охоту за талантами. Офис Suno нельзя назвать дворцом из стекла и бетона — обычное лофт-пространство с открытой планировкой, диванами, кофемашиной и, как водится, парой музыкальных инструментов в углу. Сотрудники регулярно устраивают внутренние «джемы», где тестируют свежие версии модели на собственных голосах. Звучит это, по слухам, весьма колоритно.

С чего всё начиналось?

А начиналось всё с маленького демо под названием Bark — модели для генерации речи, которую команда выложила в открытый доступ ещё до запуска основного продукта. Bark умел озвучивать тексты разными голосами, добавлять смех, вздохи, паузы. Простенько, но любопытно. Этот эксперимент стал своеобразным разогревом перед главным релизом. В декабре 2023 года Suno представила свою первую публичную версию, и за пару месяцев сервис набрал миллионы пользователей. К весне 2024 года к проекту присоединился Microsoft — компания интегрировала Suno в Copilot, после чего о стартапе заговорили все, от музыкальных блогеров до юристов крупных лейблов.

Инвестиции и оценка стоимости

Деньги в проект пришли быстро. В мае 2024 года Suno закрыла раунд финансирования на сто двадцать пять миллионов долларов, а общая оценка компании перевалила за полмиллиарда. Среди инвесторов — Lightspeed Venture Partners, Nat Friedman, Daniel Gross и ряд других известных фондов. Сумма, конечно, бьёт по воображению. Особенно если вспомнить, что за пару лет до этого основатели сидели в финтех-офисе и обсуждали идею за чашкой кофе.

К тому же часть денег пошла не на маркетинг, а на закупку вычислительных мощностей — а это серьёзное вложение, без которого обучение свежих версий модели попросту невозможно.

А что с критикой?

Без ложки дёгтя не обошлось. Летом 2024 года Suno вместе с конкурентом Udio оказалась в центре громкого иска от RIAA — Американской ассоциации звукозаписывающих компаний. Лейблы обвинили стартап в обучении модели на защищённых авторским правом записях без разрешения правообладателей. Команда Suno, в свою очередь, ответила в духе «мы используем общедоступные данные, как и любая другая AI-компания, а это укладывается в концепцию добросовестного использования». Чем закончится разбирательство — пока неясно, процесс тянется до сих пор. Но позиция разработчиков довольно твёрдая, и отступать они явно не собираются. Это же касается и публичных дискуссий: Шульман открыто говорит, что музыкальная индустрия рано или поздно адаптируется, как когда-то адаптировалась к появлению синтезаторов и сэмплеров.

Все топовые нейросети в одном месте

Чем команда отличается от конкурентов?

Главная изюминка — ставка на простоту для конечного пользователя. Многие AI-сервисы для музыки требуют от человека хотя бы базового понимания теории: ввести жанр, темп, ладотональность, выбрать инструменты. У Suno иначе. Достаточно вписать одну фразу — например, «грустная баллада про осень в стиле инди-рок» — и через полминуты получить готовый трек с вокалом и текстом. Просто? До неприличия. Конечно, профессиональные музыканты крутят носом, и понять их можно. Однако массовому пользователю этот подход зашёл моментально. Ведь именно он открывает дверь в творчество тем, кто всю жизнь грезил о собственной песне, но не знал, с какой стороны подойти к гитаре.

Планы на будущее

Куда двигается команда дальше? Судя по интервью Шульмана и утечкам в профильных изданиях, в планах — расширение функционала редактирования. Чтобы пользователь мог не просто получить трек, а доработать его: заменить куплет, поменять настроение припева, добавить второй голос. Также ведётся работа над более длинными форматами — пока модель уверенно делает композиции до четырёх минут, но команда хочет дотянуться до полноценных альбомных треков по семь-восемь минут. Параллельно идёт исследование в сторону генерации звукового дизайна для кино и игр. Направление перспективное, рынок огромный, конкуренция пока умеренная.

Стоит ли следить за этой командой?

Безусловно. Suno — один из тех редких случаев, когда небольшая группа энтузиастов с физико-математическим бэкграундом сумела вломиться в индустрию, где десятилетиями правили крупные лейблы и звукозаписывающие гиганты. Их история ещё пишется, и пишется на наших глазах. Кто-то называет ребят разрушителями, кто-то — освободителями творчества. Истина, как водится, где-то посередине.

Но одно ясно точно: если хочется понимать, куда движется музыкальный мир в ближайшие пять-десять лет, имена Шульмана, Кучко, Камачо и Фрейберга стоит запомнить.

А ещё лучше — самому попробовать сгенерировать пару треков и почувствовать, на что способна их разработка. Удачи в музыкальных экспериментах, и пусть свежий хит родится именно у вас.