Ещё пару лет назад мысль о том, что любой человек без музыкального образования сможет за минуту получить полноценный трек с вокалом, припевом и аранжировкой, казалась чем-то из области фантастики. Композиторы посмеивались, продюсеры скептически качали головами, а энтузиасты экспериментировали с грубыми инструментальными генераторами, которые выдавали что-то отдалённо похожее на музыку. И вот на сцену вышел небольшой стартап из Кембриджа, штат Массачусетс, после чего индустрия, что называется, дрогнула. А имя ему — Suno inc.
Что такое Suno и откуда она взялась
История компании началась довольно тихо. Команда инженеров и музыкантов собралась в 2022 году, и поначалу о них слышали разве что узкие специалисты в области машинного обучения. Офис — небольшое помещение в Кембридже, штат Массачусетс, рядом с гарвардскими кампусами. Никаких громких пресс-релизов, никаких миллиардных раундов на старте. Просто несколько человек, увлечённых одной идеей: научить нейросеть писать музыку так, чтобы её было не стыдно слушать. Звучит наивно? Возможно. Но именно из таких наивных задумок порой и вырастают грандиозные истории.
Кто стоял у истоков?
Основателей четверо, и каждый из них — фигура любопытная. Микки Шульман, нынешний CEO, до Suno работал в Kensho Technologies, где руководил исследованиями в области машинного обучения. Финансовая аналитика, обработка данных, голосовые модели — этим он занимался годами. Георг Кучко, Мартин Камачо и Кеннан Фрейберг — оставшаяся троица, тоже выходцы из Kensho. Они познакомились на работе, спелись (в прямом смысле — почти все они увлекались музыкой) и решили, что хватит обрабатывать чужие финансовые отчёты. Пора заняться чем-то по-настоящему живым.
К слову, Шульман — физик по образованию, а музыка для него многие годы оставалась хобби. Вот эта связка строгого научного бэкграунда с искренней любовью к звуку и стала тем самым фундаментом, на котором поднялась компания.
Стартовая площадка
Главный офис находится в Кембридже — там, где исторически концентрируются мозги Восточного побережья США. Соседство с MIT и Гарвардом — не случайность, а скорее закономерность. Молодой компании нужны были кадры, причём не абы какие, а с серьёзной подготовкой в области нейросетей и звуковых технологий. Команда росла стремительно, и уже к 2024 году в штате насчитывалось несколько десятков человек, включая исследователей, инженеров, продуктовых дизайнеров. Маленький, но сплочённый коллектив. Без раздутых отделов и бюрократии.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Чем занимается Suno на самом деле?
Нейросеть, которую разрабатывают в компании, умеет генерировать музыкальные композиции по текстовому запросу. Пишешь промт вроде «грустная инди-баллада про осенний вечер с женским вокалом» — и через минуту получаешь готовый трек длительностью пару минут. С куплетами, припевом, реалистичным голосом и аранжировкой. Звучит как магия? На самом деле — кропотливая работа на стыке нескольких технологий. Вся суть в том, что под капотом крутятся сразу несколько моделей: одна отвечает за генерацию мелодии, другая — за синтез вокала, третья — за сведение и стилистику. Эта связка, отточенная годами экспериментов, и творит чудеса.
Как им удалось обойти конкурентов?
Конкуренция на рынке музыкальных ИИ-сервисов сейчас довольно жёсткая. Google со своим MusicLM, Meta с AudioCraft, Stability AI с собственными разработками — все они ринулись в этот сегмент. Но именно Suno первой сделала продукт, удобный для обычного пользователя. Без сложных настроек, без необходимости разбираться в семплах и MIDI. Открываешь сайт, вводишь идею — получаешь песню. Этот простой подход и сыграл решающую роль. Обыватель проголосовал ногами: к концу 2024 года сервисом ежемесячно пользовались миллионы людей.
Качество вокала у Suno — то, чем компания по-настоящему может гордиться. Голоса звучат живо, с дыханием, интонациями, иногда — с лёгкой хрипотцой. Многие слушатели в первые секунды просто не верят, что это синтез.
Инвестиции и поддержка
Серьёзное вложение в проект сделали такие имена, как Lightspeed Venture Partners, Founder Collective, Matrix Partners. В мае 2024 года компания закрыла раунд на сумму 125 миллионов долларов, после чего её оценка перевалила за полмиллиарда. Внушительная цифра для стартапа, которому на тот момент не было и двух лет. Среди частных инвесторов — фигуры из мира музыки и технологий, включая бывших топ-менеджеров крупных лейблов. Что любопытно, поначалу музыкальная индустрия отнеслась к проекту с явным недоверием. А кое-кто — и с откровенной неприязнью.
А как же авторские права?
Вопрос не из лёгких. Именно вокруг него развернулась главная драма последних лет. Летом 2024 года Ассоциация звукозаписывающей индустрии Америки (RIAA) подала иск против Suno, обвинив компанию в обучении нейросети на защищённых авторским правом записях. Universal, Sony, Warner — все три мейджора объединились в этом разбирательстве. Suno, в свою очередь, не отрицала факт использования открытых данных, апеллируя к доктрине добросовестного использования (fair use).
Спор далеко не завершён, и его исход может определить судьбу всей индустрии генеративной музыки. Многие считают, что компания обречена на поражение, но на самом деле всё гораздо сложнее.
Прецедент с Google Books в своё время показал: суды способны на неожиданные решения, когда речь идёт о технологическом прогрессе.
Технологическая начинка
Отдельно стоит упомянуть архитектуру моделей. Команда не раскрывает всех деталей, но известно, что используется гибридный подход. Трансформеры для генерации музыкальных паттернов, диффузионные модели для синтеза аудио, специальные модули для работы с вокалом и текстом песен. Большое внимание уделяется обучению на разнообразных стилях — от классики до хип-хопа. И всё-таки самое сложное — это даже не сам синтез, а согласованность. Чтобы куплет логично переходил в припев, чтобы вокал не «плыл», чтобы инструменты звучали в одной тональности. Здесь у инженеров Suno явно есть свои секреты, наработанные тысячами часов экспериментов.
Партнёрство с Microsoft
В декабре 2023 года произошло событие, которое подняло проект на новый уровень. Microsoft встроила технологию Suno в Copilot — своего ИИ-ассистента. Любой пользователь Windows получил возможность генерировать треки прямо из чата с помощником. Ход красивый и взаимовыгодный: Microsoft получил функцию-фишку для своего продукта, а Suno — выход на сотни миллионов пользователей. После этой интеграции узнаваемость бренда выросла в разы. К слову, именно тогда о компании заговорили в широких кругах, далёких от технологий.
Музыканты против или за?
Реакция профессионального сообщества разделилась. Одни видят в нейросетях угрозу — дескать, теперь любой школьник заменит композитора. Другие наоборот — встроили генератор в свой рабочий процесс, используя его как источник идей, эскизов, заготовок. Истина, как водится, где-то посередине. Профессиональный продюсер вряд ли будет выпускать сгенерированный трек как свой, но в качестве референса или черновика — почему бы и нет. Это удобно. Ведь идея, рождённая случайно нейросетью, иногда подсказывает направление, до которого живой автор не додумался бы. А вот любителям и инди-исполнителям сервис открыл двери, которые раньше были наглухо закрыты дороговизной студийной работы.
Будущее компании
Куда движется Suno дальше? Команда говорит о расширении возможностей: более длинные треки, тонкая настройка стиля, редактирование отдельных фрагментов, поддержка большего числа языков для вокала. Русский, кстати, уже работает довольно неплохо, хотя до английского ему пока далеко. Появляются и инструменты для профессионалов — экспорт стемов, интеграция с DAW, работа с собственными референсами. Всё это постепенно превращает сервис из игрушки для развлечения в полноценный творческий инструмент. Конечно, юридические баталии будут продолжаться. Но даже если суды примут жёсткие решения, технология уже выпущена в мир, и обратно её не загонишь.
Стоит ли пользоваться сервисом?
Вопрос, который чаще всего задают новички. Ответ — однозначно да, хотя бы ради любопытства. Бесплатный тариф позволяет генерировать определённое количество треков в день, чего вполне хватит для знакомства. Платная подписка не сильно ударит по кошельку, особенно если сравнивать со стоимостью студийного времени. Не стоит ждать от сервиса шедевров уровня Эминема или Лорд — нейросеть всё ещё ошибается, иногда выдаёт странные интонации, путает ударения в словах. Но для домашних экспериментов, для роликов на YouTube, для подкастов и просто для развлечения — отличный вариант. Главное — подходить с правильными ожиданиями.
Маленький стартап, большая революция
Удивительно, но всего четыре человека, начавшие проект в 2022 году, смогли пошатнуть индустрию, которая десятилетиями казалась незыблемой. Звукозаписывающие гиганты, привыкшие диктовать правила, теперь вынуждены спорить с командой из Кембриджа в судах и одновременно — присматриваться к этой технологии для собственных нужд.
История поучительная. Она показывает, что даже в насыщенной отрасли остаётся место для смелых идей и небольших команд, готовых рискнуть.
Микки Шульман и его коллеги доказали: иногда хватает четырёх человек, ноутбуков и хорошей идеи, чтобы изменить то, как миллионы людей слушают и создают музыку. Удачи в собственных творческих поисках — а Suno пусть остаётся инструментом, который помогает превратить любую мелодию в голове в реальный трек, который не стыдно отправить друзьям.

