Кто создал Midjourney: команда разработчиков и философия проекта

Нейросети, генерирующие изображения по текстовому описанию, буквально за пару лет перевернули привычное понимание творчества — и любительского, и профессионального. Ещё в 2020-м подобные инструменты казались баловством для узкого круга энтузиастов, а сейчас миллионы людей ежедневно скармливают промты разным сервисам, получая на выходе картинки, от которых порой перехватывает дыхание. Среди всего этого изобилия одна платформа приковывает внимание особенно сильно. Midjourney. Название на слуху у каждого, кто хоть раз интересовался AI-артом, но вот о команде, стоящей за проектом, и о философии, которой эти люди руководствуются, обыватель знает на удивление мало. А начать стоит именно с истоков — с человека, без которого никакого «путешествия к середине» попросту не случилось бы.

Все топовые нейросети в одном месте

Дэвид Хольц — визионер у руля

Лицо Midjourney — Дэвид Хольц, основатель и бессменный руководитель компании. До того как грезить о генеративных нейросетях, Хольц успел внести довольно весомую лепту в индустрию аппаратных интерфейсов. В 2013 году он основал Leap Motion — стартап, разрабатывавший компактный контроллер для отслеживания движений рук в трёхмерном пространстве. Устройство размером чуть больше флешки считывало жесты с точностью до сотой доли миллиметра, и технологический бомонд воспринял идею с восторгом. Впрочем, коммерческий успех оказался скромнее ожиданий — массовый потребитель к такому интерфейсу готов ещё не был. Но опыт работы на стыке «железа», машинного зрения и пользовательского взаимодействия сформировал у Хольца особый взгляд на технологии. Ведь именно он позже не раз повторял в интервью, что его интересует не сама нейросеть как таковая, а то, как человек с ней взаимодействует и что при этом чувствует.

Хольц — фигура неоднозначная. С одной стороны, он тяготеет к академическому подходу: изучал математику и физику в Университете Северной Каролины, затем занимался исследованиями в институте Макса Планка в Мюнхене и сотрудничал с NASA. С другой — ему совершенно чужда сухая корпоративная риторика. В публичных выступлениях Хольц рассуждает скорее как философ, чем как CEO технологической компании. Он открыто говорит, что Midjourney — это не продукт и даже не инструмент в привычном понимании, а скорее среда, в которой воображение человека усиливается мощью алгоритма. Звучит красиво? Безусловно. Но за словами стоит вполне конкретная стратегия, которую компания последовательно реализует с 2021 года.

Как всё начиналось?

Независимая исследовательская лаборатория Midjourney была основана в Сан-Франциско в 2021 году. Стоит отметить одну деталь, которая бросается в глаза сразу: компания сознательно отказалась от статуса классического стартапа с раундами венчурного финансирования. Никаких громких сделок с Sequoia или Andreessen Horowitz. Никакого выхода на IPO в обозримой перспективе. Хольц с самого начала настаивал на самофинансировании, и эта позиция заслуживает истинного уважения — особенно на фоне конкурентов вроде OpenAI (с многомиллиардными вливаниями от Microsoft) или Stability AI (с их агрессивным привлечением капитала). Дело в том, что отсутствие внешних инвесторов даёт свободу, которую деньгами не купить: свободу экспериментировать, ошибаться и двигаться в ту сторону, которая кажется правильной, а не в ту, которая нравится совету директоров.

Все лучшие нейросети мира теперь в твоём кармане! ⚡

Тексты, топовое видео, картинки и аудио. Самые мощные версии GPT, Claude, Midjourney, Sora, Kling и еще 90+ ИИ-моделей собраны в одном месте. Работает невероятно быстро: через удобный сайт или прямо в Telegram. Больше никаких блокировок, VPN, иностранных карт и переплат.

Жми на ссылку ниже и забирай свои бесплатные генерации для тест-драйва платформы 👉 https://clck.ru/3RNCRL

Первая бета-версия Midjourney появилась в июле 2022 года. И сразу — нестандартный ход. Вместо привычного веб-интерфейса или мобильного приложения платформу «поселили» в Discord. Многие восприняли это как причуду. Но расчёт оказался точным. Discord уже объединял десятки миллионов креативных пользователей — геймеров, художников, музыкантов. А главное, чат-формат превращал процесс генерации картинок в коллективное действо: ты видишь, что создают другие, подсматриваешь промты, вдохновляешься чужими находками. По сути, Хольц выстроил не просто генератор картинок, а социальную экосистему вокруг творческого процесса. И это работает. Даже сейчас, когда у Midjourney появился полноценный веб-сайт с альфа-версией собственного интерфейса, ядро сообщества по-прежнему живёт в Discord-сервере, насчитывающем свыше 19 миллионов участников.

Команда без лишнего шума

Точное число сотрудников Midjourney до сих пор остаётся загадкой. Компания не публикует списки команды, не ведёт корпоративный блог с фотографиями офиса и не устраивает пышных презентаций. По разным оценкам, в штате работает от 40 до 70 человек — цифра, мягко говоря, скромная для продукта с такой пользовательской базой. Для сравнения: в Stability AI на пике было более 150 сотрудников, а OpenAI перевалила за тысячу. Но именно компактность позволяет Midjourney оставаться гибкой и не обрастать бюрократическим жирком, который неизбежно замедляет крупные структуры.

Кто же эти люди? Львиная доля команды — инженеры-исследователи в области машинного обучения и компьютерного зрения. К тому же стоит упомянуть специалистов по инфраструктуре: когда миллионы запросов в сутки нагружают GPU-кластеры, от стабильности серверов зависит всё. Отдельно солирует небольшая группа дизайнеров и арт-директоров, задача которых — калибровать эстетику модели. Да-да, именно калибровать. Ведь нейросеть сама по себе не имеет вкуса. Её нужно «натаскать» на определённые стилистические предпочтения, и за фирменную «красивость» Midjourney — ту самую изысканную картинку с первого промта — отвечают вполне конкретные люди с художественным образованием. К слову, имена большинства из них публике неизвестны, и компания такой закрытостью явно дорожит.

Что насчёт философии?

Подход Midjourney к генеративному ИИ разительно отличается от того, что предлагают конкуренты. И разница эта не в технических нюансах, а в самой картине мира. Хольц неоднократно подчёркивал, что его команда воспринимает нейросеть не как замену художнику, а как расширение человеческого воображения. Звучит как маркетинговый лозунг? Возможно. Но на практике этот постулат влияет на вполне осязаемые решения. Например, Midjourney сознательно упрощает интерфейс до минимума. Никаких десятков ползунков, слоёв и масок — во всяком случае, до недавнего времени. Идея в том, чтобы человек думал не о параметрах модели, а о смысле того, что хочет создать.

«Мы не строим инструмент для художников. Мы строим инструмент для воображения. Каждый человек — художник, просто не каждый об этом знает.» — Дэвид Хольц, интервью The Verge, 2022

Ещё один важный нюанс — отношение к «красоте по умолчанию». Если DALL·E от OpenAI тяготеет к фотореалистичности, а Stable Diffusion стремится дать пользователю максимум контроля (иногда в ущерб эстетике), то Midjourney с первых версий делала ставку на визуальную привлекательность. Даже простой промт из трёх-четырёх слов выдаёт картинку с грамотной композицией, приятной цветовой палитрой и общим ощущением «законченности». Это не случайность, а результат скрупулёзной работы над предпочтениями модели. Хольц как-то обмолвился, что команда провела тысячи часов, вручную размечая изображения по эстетическим критериям. Добротный ручной труд, от которого многие в индустрии уже отвыкли.

Версии и эволюция модели

Хронология развития Midjourney сама по себе — кладезь наблюдений о том, как менялась индустрия. Первая версия, увидевшая свет летом 2022-го, выдавала изображения, мягко говоря, далёкие от совершенства: размытые лица, искажённые руки, странная анатомия. Но даже тогда в картинках проглядывало нечто, чего не хватало конкурентам, — атмосфера. Ощущение настроения, эмоциональный заряд, который цеплял вопреки техническим огрехам. Вторая версия (апрель 2022-го) подтянула детализацию, третья (июль 2022-го) заметно улучшила работу с текстурами и освещением.

Настоящий перелом случился с выходом четвёртой версии в ноябре 2022-го. Качество подскочило настолько, что в соцсетях начались бурные дискуссии: «Конец иллюстрации?», «Художники больше не нужны?» — заголовки такого рода льились рекой. А в марте 2023-го подоспела пятая версия, где руки наконец-то перестали выглядеть как набор сосисок, а фотореалистичные портреты стало довольно сложно отличить от настоящих фотографий. Шестая версия, появившаяся в конце 2023-го, добавила поддержку текста на изображениях (ещё недавно это был камень преткновения для всех генеративных моделей). Ну и, конечно же, каждая новая итерация приносила улучшения в «понимании» промтов: модель стала точнее интерпретировать сложные описания, учитывать контекст и пространственные отношения между объектами.

Бизнес-модель без инвесторов — реально ли это?

Вопрос денег. Без него картина была бы неполной. Midjourney монетизируется через подписку: от 10 до 120 долларов в месяц в зависимости от объёма генераций и доступных функций. Бесплатного тарифа, который существовал на ранних этапах, больше нет — его убрали после того, как лавина новых пользователей обрушила серверы весной 2023-го. По неофициальным оценкам (компания финансовую отчётность не публикует), годовая выручка Midjourney к концу 2023 года достигала порядка 200 миллионов долларов. И это при штате в несколько десятков человек! Показатель впечатляющий, особенно с учётом того, что львиная доля расходов приходится на аренду вычислительных мощностей — те самые GPU-кластеры, без которых ни одна генерация не состоится.

Скептики, впрочем, задаются вопросом: а не бьёт ли такая независимость по темпам развития? Ведь конкуренты с миллиардными бюджетами могут позволить себе масштабнейшие эксперименты. На самом деле, пока ответ скорее «нет». Midjourney из версии в версию наращивает качество, а компактная команда позволяет принимать решения за часы, а не за месяцы. Хольц сравнивал свою компанию с джазовым ансамблем: каждый музыкант на счету, все импровизируют, но держат общий ритм. Красивая метафора, и, судя по результатам, вполне рабочая.

Авторские права и этические подводные камни

Ложка дёгтя. Без неё рассказ о Midjourney был бы неполным и нечестным. Проект неоднократно попадал в эпицентр скандалов, связанных с авторскими правами. Дело в том, что модель обучалась на миллиардах изображений, собранных из интернета, и далеко не все авторы этих работ давали на это согласие. В январе 2023 года группа художников подала коллективный иск против Midjourney, Stability AI и DeviantArt, обвинив их в нарушении копирайта. Судебный процесс тянется до сих пор, и однозначного юридического прецедента пока нет.

Хольц занимает в этом вопросе позицию, которую можно назвать осторожно-прагматичной. Он признаёт, что индустрии нужны новые правовые рамки, но при этом настаивает на том, что обучение модели на открытых изображениях принципиально не отличается от того, как человек-художник учится, разглядывая чужие работы. Аргумент неоднозначный. И многие с ним спорят. Впрочем, компания предприняла ряд шагов: появилась возможность запретить использование своих работ для обучения (через специальную форму), а в правилах платформы ужесточились ограничения на генерацию изображений реальных людей без их согласия. Достаточно ли этого? Время покажет.

Сообщество как движущая сила

Нельзя не упомянуть феномен комьюнити. В отличие от конкурентов, где пользователь по большей части работает в одиночку — открыл вкладку, ввёл промт, скачал результат — Midjourney изначально выстраивалась вокруг совместного творчества. Discord-сервер проекта — это не просто чат поддержки. Это грандиозный муравейник, где в реальном времени тысячи людей генерируют изображения, обсуждают промты, делятся находками. Ты заходишь в канал и буквально натыкаешься на десятки свежих картинок каждую секунду. Это завораживает.

Все топовые нейросети в одном месте

К тому же сообщество само по себе стало мощнейшим маркетинговым инструментом. Midjourney практически не тратит деньги на рекламу — за неё работает сарафанное радио. Человек видит впечатляющее изображение в Twitter, узнаёт, что оно сгенерировано в Midjourney, и тут же оформляет подписку. Да и сами «миджорнейщики» (так себя называют постоянные пользователи) относятся к платформе с каким-то почти фанатским пылом, делясь результатами в соцсетях, ведя YouTube-каналы с туториалами и устраивая промт-баттлы. Хольц это понимает и всячески подогревает: регулярные «office hours» — сессии вопросов и ответов прямо в Discord, где он лично общается с пользователями, — стали фирменной изюминкой проекта.

Куда движется Midjourney?

Компания не раскрывает дорожную карту целиком, но отдельные штрихи всё же всплывают. Хольц упоминал работу над 3D-генерацией и видео — направлениями, которые пока остаются вотчиной конкурентов (Sora от OpenAI, Runway Gen-3). Кроме того, в 2024 году команда начала тестировать собственный веб-интерфейс, постепенно отвязывая продукт от Discord. Это довольно логичный шаг: при всей гениальности первоначальной идеи с чатом, для профессиональной работы нужны инструменты посерьёзнее — слои, маски, inpainting, вариативная генерация с тонкой настройкой.

Отдельно стоит упомянуть аппаратное направление. Учитывая бэкграунд Хольца в Leap Motion, нет ничего удивительного в слухах о том, что Midjourney экспериментирует с собственными устройствами. Представьте себе гарнитуру, в которой генеративный ИИ рисует окружение в реальном времени, реагируя на жесты и голосовые команды. Фантастика? Ещё пару лет назад и текстовая генерация казалась фантастикой. А сейчас это рутина.

Midjourney — это больше, чем нейросеть для красивых картинок. Это результат специфического мировоззрения, в котором технология подчинена эстетике, компактная команда ценнее армии разработчиков, а сообщество важнее рекламных бюджетов. Подход щепетильный, местами спорный, но живой — и именно этим он подкупает. Тем, кто только открывает для себя мир генеративного ИИ, стоит присмотреться к этому проекту внимательнее: история Midjourney ещё далека от финала и наверняка подарит немало сюрпризов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *