Ещё каких-то пять-шесть лет назад генерация изображений с помощью нейросетей казалась чем-то из области научной фантастики — да и сами разработчики признавали, что до по-настоящему впечатляющих результатов ещё далеко. Художники спокойно занимались своим ремеслом, дизайнеры верстали макеты руками, а словосочетание «искусственный интеллект» у обывателя вызывало ассоциации скорее с голосовыми помощниками, чем с картинами, достойными галереи. Но вот в 2022 году мир буквально взорвался: в лентах соцсетей одна за другой стали появляться изображения невероятной красоты и детализации, сгенерированные по коротким текстовым описаниям. За львиной долей этих работ стояло имя Midjourney — компании, история которой заслуживает отдельного скрупулёзного разговора.
Кто стоит за Midjourney?
Имя Дэвида Хольца (David Holz) в технологическом бомонде мелькало задолго до появления Midjourney. Этот американский инженер и предприниматель родом из Флориды успел поработать в NASA, где занимался исследованиями в области взаимодействия человека с технологиями. К слову, именно там у него зародился интерес к тому, как машины могут дополнять, а не подменять собой творческий процесс. Позже Хольц основал компанию Leap Motion — стартап, который специализировался на технологиях отслеживания движений рук без контроллеров. Устройство Leap Motion в своё время наделало немало шума: маленький добротный сенсор, подключаемый к компьютеру, позволял управлять интерфейсом буквально жестами в воздухе. Впрочем, массового коммерческого успеха продукт так и не снискал — рынок оказался не готов. Но именно этот опыт, по признанию самого Хольца, сформировал его подход к созданию Midjourney.
Дело в том, что Хольц всегда тяготел к стыку технологий и человеческого воображения. Не к сухим алгоритмам ради алгоритмов, а к инструментам, которые расширяют возможности мозга. Ведь Leap Motion по сути пыталась стереть границу между физическим жестом и цифровой командой. С Midjourney замысел оказался ещё амбициознее — стереть границу между словом и визуальным образом. И если в случае с Leap Motion рынок не подхватил идею, то здесь звёзды сошлись.
Как всё начиналось
Небольшая команда. Именно так — без десятков тысяч сотрудников, без грандиозных офисов в Кремниевой долине — Midjourney Inc стартовала как независимая исследовательская лаборатория. Хольц основал компанию в Сан-Франциско приблизительно в 2021 году, хотя точная дата регистрации в публичных источниках варьируется. Костяк команды на первых порах насчитывал около одиннадцати человек — цифра, мягко говоря, скромная для проекта с такими амбициями. Но Хольц сознательно выбрал путь компактной структуры, где каждый участник — на вес золота. Многие из ранних сотрудников имели опыт работы с генеративными моделями, компьютерным зрением и обработкой естественного языка. А вот внешних инвесторов Midjourney привлекала крайне щепетильно — компания с самого начала стремилась к самоокупаемости и независимости, что для технологического стартапа ход довольно нетипичный.
Все лучшие нейросети мира теперь в твоём кармане! ⚡
Тексты, топовое видео, картинки и аудио. Самые мощные версии GPT, Claude, Midjourney, Sora, Kling и еще 90+ ИИ-моделей собраны в одном месте. Работает невероятно быстро: через удобный сайт или прямо в Telegram. Больше никаких блокировок, VPN, иностранных карт и переплат.
Жми на ссылку ниже и забирай свои бесплатные генерации для тест-драйва платформы 👉 https://clck.ru/3RNCRL
Стоит отметить один любопытный нюанс. В отличие от конкурентов вроде OpenAI с их DALL·E или Stability AI с открытым Stable Diffusion, Midjourney с первых дней сделала ставку на нестандартный интерфейс взаимодействия. Вместо привычного веб-приложения или десктопной программы пользователю предлагалось работать через Discord — мессенджер, изначально созданный для геймеров. Решение казалось странным. Даже абсурдным. Но Хольц объяснял его просто: Discord уже обладал готовой инфраструктурой для сообществ, позволял мгновенно обмениваться результатами и — что особенно важно — создавал эффект коллективного творчества, когда пользователь видит, что генерируют другие. Этот социальный элемент творил чудеса с вовлечённостью.
Первые версии и реакция публики
Открытое бета-тестирование Midjourney стартовало в июле 2022 года, и эффект оказался взрывным. Тысячи людей хлынули в Discord-сервер проекта, каналы заполнились потоком генераций — от фантастических пейзажей до портретов несуществующих людей в стиле Ренессанса. Первая версия модели (V1) по сегодняшним меркам выглядит, конечно, наивно — размытые формы, нечёткие лица, довольно хаотичная композиция. Но для лета 2022-го это было откровение. Уже к осени того же года вышла вторая, а затем и третья версия, каждая из которых демонстрировала ощутимый скачок в качестве. В представлении многих нейросеть Midjourney стала синонимом словосочетания «ИИ-арт», хотя конкуренты не дремали.
Кстати, настоящий фурор произвёл случай с картиной «Театр оперы в космосе» (Théâtre D’opéra Spatial), созданной при помощи Midjourney и победившей на конкурсе изобразительного искусства на ярмарке штата Колорадо в августе 2022 года. Автор — Джейсон Аллен — открыто заявил, что использовал нейросеть, и разразился скандал. Художники возмутились, критики заговорили о смерти искусства, а Midjourney получила бесплатную рекламу невиданного масштаба. Неоднозначная ситуация, но именно она вывела разговор о генеративном ИИ из узких технических кругов в мейнстрим.
Чем Midjourney отличается от конкурентов?
Вся суть в эстетике. Если DALL·E от OpenAI тяготеет к реалистичной, почти фотографической точности, а Stable Diffusion даёт максимум гибкости за счёт открытого кода, то Midjourney с самого начала нащупала собственный узнаваемый стиль. Изображения, созданные этой нейросетью, отличаются характерной «живописностью» — мягкие тени, насыщенная цветовая палитра, кинематографическая атмосфера. Многие пользователи отмечали, что результат Midjourney чаще всего не нуждается в доработке: картинка сразу выходит «красивой». И это не случайность, а осознанный выбор команды. Хольц неоднократно подчёркивал в интервью, что его цель — не техническое совершенство ради совершенства, а создание инструмента, который помогает людям думать визуально.
К тому же подход к развитию продукта у компании довольно необычный. Midjourney не гналась за публикацией научных статей и не стремилась выкладывать свои модели в открытый доступ. Наоборот — код и архитектура модели остаются закрытыми. Это бьёт по идеалам открытой науки, но позволяет компании сохранять конкурентное преимущество. Да и с точки зрения бизнеса ход оправдал себя: к началу 2023 года, по разным оценкам, у Midjourney насчитывалось свыше пятнадцати миллионов зарегистрированных пользователей, а годовая выручка при штате менее сорока человек (по утверждению самого Хольца) превышала сто миллионов долларов. Цифры внушительные, тем более для стартапа без единого раунда венчурного финансирования.
Философия Дэвида Хольца
Хольц — фигура колоритная. В интервью он ведёт себя не как типичный CEO из Кремниевой долины с его отполированными формулировками, а скорее как задумчивый исследователь, которому интереснее рассуждать о природе воображения, чем о метриках роста. Одна из его часто цитируемых мыслей звучит примерно так: «Мы строим не генератор картинок, а двигатель воображения». И это не маркетинговая пустышка — за словами стоит вполне конкретная идеология. Хольц рассматривает Midjourney как продолжение человеческого разума, инструмент для исследования того, что скрыто в подсознании и что сложно выразить словами до конца.
Впрочем, романтика романтикой, а подводные камни никуда не деваются. Вопросы авторского права, проблемы с генерацией изображений реальных людей без их согласия, потенциальное использование для дезинформации — всё это всплывает регулярно. Хольц признаёт эти сложности, но предпочитает действовать итерационно: сначала выпустить продукт, потом корректировать. Подход спорный. Однако нельзя не признать, что команда Midjourney реагирует на критику довольно оперативно — фильтры контента постоянно обновляются, а правила использования ужесточаются с каждой новой версией.
Эволюция модели: от V1 до V6 и дальше
За неполных два года Midjourney проделала путь, на который у многих компаний ушли бы десятилетия. Первая версия, как уже говорилось, выдавала скорее абстрактные наброски, чем полноценные иллюстрации. Вторая улучшила детализацию, но лица по-прежнему оставались слабым местом — руки с шестью пальцами стали своего рода мемом в сообществе. Третья версия сделала серьёзный рывок в стилистическом разнообразии. Но настоящий перелом произошёл с выходом V4 в конце 2022 года — здесь качество вышло на тот уровень, когда отличить генерацию от работы профессионального художника-концептера стало по-настоящему сложно.
Пятая версия, появившаяся весной 2023-го, довела до ума фотореалистичные генерации. Именно после неё в сети начали массово появляться «вирусные» фейки — знаменитая фотография Папы Римского в белом пуховике тоже была создана с помощью Midjourney V5. А вот V6, вышедшая в конце 2023 года, добавила возможность генерировать текст внутри изображений и существенно улучшила понимание сложных промптов. Каждый новый релиз — это не просто количественный прирост в разрешении или скорости, а качественный сдвиг в «интеллекте» модели, в её способности интерпретировать абстрактные запросы человека.
Бизнес-модель без инвесторов: как это работает?
Самоокупаемость. Слово, которое в мире стартапов звучит почти как ересь. Тем более когда речь идёт об ИИ-компании, где расходы на вычислительные мощности исчисляются миллионами долларов ежемесячно. Но Хольц сознательно отказался от венчурного капитала. Дело в том, что привлечение инвесторов неизбежно влечёт за собой давление: гонку за метриками, требование быстрого масштабирования, необходимость подстраиваться под ожидания совета директоров. Хольцу же хотелось сохранить свободу творческого маневра — и модель подписки оказалась спасательным кругом.
Базовая подписка стоит около десяти долларов в месяц, стандартная — тридцать, а профессиональная — шестьдесят. Есть и мега-план за сто двадцать долларов, рассчитанный на тяжёлых пользователей. С учётом многомиллионной аудитории даже при среднем чеке в двадцать–двадцать пять долларов ежемесячная выручка получается колоссальной. И это при минимальных расходах на маркетинг — львиная доля роста шла органически, через сарафанное радио и вирусное распространение сгенерированных изображений. Ну и, конечно же, скандалы вроде истории с конкурсом в Колорадо только подливали масла в огонь интереса.
Команда и культура внутри компании
О внутренней кухне Midjourney известно немного — Хольц не любит раскрывать детали. Но кое-что всё же просачивается наружу. Команда работает преимущественно удалённо, что для компании из Сан-Франциско стало нормой после пандемии. Среди инженеров и исследователей, внёсших лепту в развитие проекта, стоит отметить нескольких специалистов с опытом в крупных технологических корпорациях и академических институтах. Впрочем, Хольц намеренно избегает «звёздных» хайрингов и медийности отдельных сотрудников. Вся слава — у продукта. И у сообщества вокруг него.
А сообщество у Midjourney действительно одно из самых активных в мире генеративного ИИ. Discord-сервер проекта к 2024 году превысил отметку в двадцать миллионов участников, что делает его одним из крупнейших серверов на платформе вообще. Пользователи делятся промптами, обсуждают стили, устраивают челленджи и фактически выполняют часть работы по тестированию модели бесплатно. Это гениально с точки зрения бизнеса. Ведь каждый новый пользователь — это одновременно и тестировщик, и маркетолог, и генератор контента для соцсетей.
Что ждёт Midjourney дальше?
Хольц в одном из интервью 2024 года обмолвился, что компания работает над генерацией видео, трёхмерных объектов и даже интерактивных сцен в реальном времени. Планы грандиозные. Конкуренты — OpenAI с проектом Sora, Google с Veo — тоже не стоят на месте, и гонка в сфере генеративного мультимедиа обещает стать одной из самых жарких технологических битв десятилетия. Но у Midjourney есть козырь: верное сообщество и репутация инструмента для тех, кто ценит эстетику превыше чисто технической мощи.
Нельзя не упомянуть и про выход за рамки Discord. В 2024 году компания наконец анонсировала полноценный веб-интерфейс, который постепенно открывается для всех подписчиков. Шаг давно назревший — далеко не всем удобно работать через мессенджер, особенно когда дело касается коммерческих задач. К тому же веб-версия открывает дорогу к более сложным инструментам редактирования: вариациям, in-painting, работе с отдельными фрагментами изображения. Всё это делает Midjourney серьёзным конкурентом не только другим ИИ-генераторам, но и традиционным графическим редакторам.
История Midjourney — это, пожалуй, один из самых ярких примеров того, как небольшая команда с ясным видением может изменить целую индустрию. Да и не только индустрию — само представление людей о том, что значит «создавать». Дэвид Хольц построил компанию, которая стоит на ногах без заёмных миллиардов, растёт за счёт продукта, а не хайпа, и при этом продолжает удивлять с каждым новым релизом. Тем, кто ещё не пробовал Midjourney, определённо стоит выделить вечер, зарегистрироваться и набрать свой первый промпт — результат почти наверняка превзойдёт ожидания и, возможно, откроет совершенно новый способ общения с собственным воображением.

