История создания и развития Midjourney: интересные факты из Википедии

Нейросети, генерирующие картинки по текстовому описанию, буквально за пару лет превратились из диковинной лабораторной забавы в повседневный рабочий инструмент дизайнеров, маркетологов и просто любопытных обывателей. Ещё в 2020-м году мало кто грезил о том, что достаточно набрать пару слов — и через минуту на экране появится изображение, которое вполне сойдёт за работу живого иллюстратора. Многие считают, что первой ласточкой стал DALL·E от OpenAI, но на самом деле настоящий фурор в массовом сознании произвёл совсем другой проект — Midjourney. История этого сервиса довольно необычна, и разобраться в ней стоит хотя бы потому, что за каждым громким технологическим прорывом всегда стоит конкретный человек с конкретной идеей.

Все топовые нейросети в одном месте

Кто стоит за Midjourney?

Дэвид Хольц. Имя это в широких кругах зазвучало именно благодаря нейросети, хотя к моменту запуска Midjourney за плечами у основателя уже был внушительный опыт. Карьера Хольца тяготеет к стыку науки и предпринимательства: в своё время он занимался исследованиями в области вычислительной математики и машинного обучения, а затем основал компанию Leap Motion — стартап, разрабатывавший контроллер для отслеживания движения рук. К слову, Leap Motion привлёк десятки миллионов долларов инвестиций и наделал немало шума в индустрии жестового управления. Но Хольцу, судя по всему, этого было мало. Ведь именно он решил бросить силы на создание независимой исследовательской лаборатории, которая впоследствии и породила Midjourney. Нужно отметить, что лаборатория базируется в Сан-Франциско, а её штат по открытым источникам долгое время не превышал двух десятков человек — цифра, мягко говоря, скромная для проекта такого масштаба.

Первые шаги и бета-тест

Открытая бета-версия Midjourney стартовала 12 июля 2022 года. Дата эта важна, потому что именно с неё начался тот самый лавинообразный рост аудитории, о котором потом писали все технологические издания. Но до публичного запуска прошёл довольно долгий путь внутренних тестирований. Хольц и его небольшая команда сначала обкатывали модель в закрытом режиме, приглашая ограниченное число участников. И вот тут всплывает любопытный нюанс: в отличие от большинства конкурентов, Midjourney с самого начала выбрала площадкой для взаимодействия с пользователями мессенджер Discord. Решение это многим показалось странным — ведь Discord традиционно ассоциировался с геймерским сообществом, а не с профессиональным дизайном. Однако ход оказался на редкость удачным. Дело в том, что Discord позволял моментально создать огромное комьюнити, где люди делились результатами, обсуждали промпты и фактически бесплатно тестировали продукт, генерируя обратную связь в колоссальных объёмах.

Впрочем, сам процесс генерации в первой версии вызывал смешанные чувства. Изображения получались довольно размытыми, с характерными артефактами, а лица людей выглядели — не побоюсь этого слова — жутковато. И всё же даже на этом раннем этапе в картинках от Midjourney ощущалась та самая изюминка: особая живописность, тяга к «художественному» стилю, а не к фотореалистичной точности. Этот почерк сохранился и усилился в последующих версиях, став, по сути, визитной карточкой сервиса.

Все топовые нейросети в одной подписке! 🚀

Устали оплачивать десятки сервисов отдельно и постоянно включать VPN? Появилась платформа, которая объединяет более 90 передовых ИИ в одном окне. Пишите тексты с новейшими версиями GPT и Claude, создавайте шедевры в Midjourney и генерируйте видео в Sora и Kling. Тексты, изображения, видео и музыка — всё работает на любых устройствах без «танцев с бубном».

Попробуйте бесплатно прямо сейчас! Переходите по ссылке и получите бонусные токены для старта 👉 https://clck.ru/3RNCRL

Как менялись версии модели?

Эволюция стремительная. Первая версия модели появилась в феврале 2022 года, а уже в апреле того же года вышла вторая — с заметно улучшенной детализацией. Третья версия увидела свет в июле, как раз к запуску открытой беты. Но настоящий перелом в восприятии произошёл с выходом четвёртой версии в ноябре 2022 года. Качество изображений подскочило настолько, что в профессиональном сообществе начались бурные дискуссии: стоит ли вообще нанимать иллюстраторов, если нейросеть выдаёт подобное за считаные секунды? Разумеется, вопрос этот неоднозначный, и однозначного ответа на него нет до сих пор.

Пятая версия, выпущенная в марте 2023 года, ещё сильнее приковала внимание. Именно с V5 Midjourney научилась генерировать реалистичные человеческие руки — проблема, над которой бились все нейросети и которая стала своеобразным мемом в сообществе. К тому же существенно улучшилась работа с текстурами и освещением, а стилистический диапазон расширился настолько, что отличить сгенерированное изображение от фотографии стало довольно сложно даже для опытного глаза. Ну и, конечно же, каждая новая версия подстёгивала рост подписчиков: к середине 2023 года Discord-сервер Midjourney стал одним из крупнейших в мире — свыше 16 миллионов участников.

Бизнес-модель и монетизация

Здесь скрывается ещё одна занимательная деталь. Midjourney — частная компания. Она не привлекала венчурного финансирования в привычном понимании этого слова. Хольц неоднократно подчёркивал в интервью, что проект вышел на самоокупаемость и даже прибыльность исключительно за счёт подписок. Модель монетизации довольно проста: бесплатный пробный период (который со временем стал всё более ограниченным), а далее — платная подписка с несколькими тарифами, начиная примерно от десяти долларов в месяц. Серьёзное вложение? Нет, кошелёк от такой суммы не станет легче. Но при миллионах пользователей даже скромная абонентская плата формирует внушительный денежный поток.

Стоит задуматься вот о чём: компания с командой менее чем в полсотни сотрудников генерирует выручку, сопоставимую с куда более раздутыми стартапами. А ведь ни одного раунда инвестиций от крупных фондов не было. В эпоху, когда технологические компании буквально горят деньгами инвесторов, Midjourney демонстрирует почти старомодную бизнес-дисциплину. Это вызывает уважение. Тем более что отсутствие внешних акционеров позволяет Хольцу принимать решения, не оглядываясь на совет директоров, — роскошь, которой лишены многие конкуренты.

Скандалы и подводные камни

Без ложки дёгтя не обошлось. Пожалуй, самый громкий инцидент связан с именем Джейсона Аллена, который в сентябре 2022 года выиграл конкурс цифрового искусства на ярмарке штата Колорадо с картиной, сгенерированной в Midjourney. Скандал вышел грандиозный. Художники обвиняли Аллена в мошенничестве, а саму нейросеть — в «краже» стилей реальных авторов. Дискуссия о том, можно ли считать результат работы нейросети искусством, разгорелась с новой силой. И затихать пока не собирается.

Кстати, вопрос авторского права на сгенерированные изображения по-прежнему остаётся юридически неразрешённым. В США Бюро авторского права вынесло ряд решений, отказывая в регистрации авторских прав на изображения, созданные при помощи ИИ, — аргументируя тем, что у произведения должен быть человеческий автор. А вот в других юрисдикциях ситуация размытая. Сам Midjourney в условиях использования оставляет за платными подписчиками право на коммерческое использование сгенерированных картинок, но всё-таки рекомендует консультироваться с юристами. Совет довольно осторожный, но при этом честный.

Обучение модели: на чём и как?

Тема щепетильная. Midjourney, как и большинство генеративных моделей, обучалась на огромном массиве изображений, собранных из интернета. Конкретный состав обучающей выборки компания не раскрывает, что регулярно вызывает критику со стороны художников и фотографов. Многие из них утверждают, что их работы были использованы без разрешения. И претензии эти далеко не беспочвенны — в январе 2023 года группа художников подала коллективный иск против Midjourney (а заодно против Stability AI и DeviantArt), обвиняя компании в нарушении авторских прав.

Само собой, Хольц парировал обвинения, заявляя, что тренировка на публично доступных изображениях — общепринятая практика в индустрии. Но общественное мнение в этом вопросе разделилось. С одной стороны, без колоссальных датасетов обучить качественную модель попросту невозможно. С другой — художники, чьи работы послужили «топливом» для нейросети, вполне справедливо хотят признания и компенсации. Обе стороны медали здесь видны отчётливо, и компромисса пока не наблюдается.

Чем Midjourney отличается от конкурентов?

На рынке генеративных изображений к 2025 году довольно тесно. DALL·E от OpenAI, Stable Diffusion от Stability AI, Adobe Firefly, а ещё десятки менее известных моделей — все они борются за внимание пользователей. Midjourney на этом фоне выделяется прежде всего своим «художественным» подходом к генерации. Если Stable Diffusion тяготеет к гибкости и открытости (код модели открыт), а DALL·E делает ставку на интеграцию с экосистемой ChatGPT, то Midjourney упорно целится в эстетику. Картинки, порождённые этой нейросетью, обладают характерной «живописной» стилизацией — это бросается в глаза даже неподготовленному зрителю.

Ещё одно отличие — закрытость. Midjourney не публикует исходный код модели, не раскрывает архитектуру и параметры обучения. Для научного сообщества это ложка дёгтя, ведь невозможно ни воспроизвести результаты, ни провести независимый аудит. Но с коммерческой точки зрения стратегия работает. К тому же Discord-интерфейс, хотя и вызывает нарекания у части аудитории, создаёт ощущение клуба, комьюнити «для своих» — антураж, который отличает Midjourney от более «корпоративных» конкурентов. А с 2024 года компания начала развивать собственный веб-интерфейс, что сделало сервис доступнее для тех, кого отпугивала необходимость осваивать Discord.

Интересные факты, которые стоит знать

Вот что действительно приковывает внимание: Дэвид Хольц в одном из ранних интервью признался, что вдохновлялся не столько техническими достижениями в области deep learning, сколько идеями о расширении человеческого воображения. Он описывал Midjourney не как инструмент для замены художников, а как «двигатель воображения» — нечто вроде нового типа мышления, где человек задаёт направление, а машина предлагает визуальные варианты. Философия довольно романтичная для создателя технологического продукта.

Отдельно стоит упомянуть скорость роста. По данным из открытых источников, Midjourney вышла на выручку более ста миллионов долларов в год уже к концу 2023 года. При этом — повторюсь — без единого доллара внешних инвестиций. Число такое звучит почти невероятно для компании, которая занимает один этаж офисного здания в Сан-Франциско. А ещё бросается в глаза тот факт, что Midjourney ни разу не устраивала масштабных рекламных кампаний. Львиная доля роста пришлась на сарафанное радио и вирусные публикации в социальных сетях — люди просто делились результатами генерации, и это работало лучше любого маркетингового бюджета.

Все топовые нейросети в одном месте

Нельзя не упомянуть и влияние на поп-культуру. В 2022–2023 годах изображения, созданные в Midjourney, стали появляться на обложках журналов, в рекламных кампаниях и даже на выставках современного искусства. Один из самых обсуждаемых примеров — фейковые фотографии Папы Римского в пуховике Balenciaga, которые разлетелись по соцсетям в марте 2023 года. Автор использовал именно Midjourney. Картинки выглядели настолько правдоподобно, что многие приняли их за настоящие фотоснимки. Зрелище одновременно впечатляющее и тревожное — ведь технология, способная так убедительно фальсифицировать реальность, неизбежно порождает вопросы об этике и дезинформации.

Что ждёт Midjourney в будущем?

Прогнозы — дело неблагодарное. Но некоторые направления просматриваются довольно отчётливо. Во-первых, компания активно работает над генерацией видео, и это логичный следующий шаг: статичные картинки — лишь начало. Во-вторых, развивается веб-платформа, которая со временем может полностью заменить Discord-интерфейс. Ну и, наконец, Хольц неоднократно намекал на интерес к 3D-моделированию и интерактивным средам — по сути, речь идёт о создании целых виртуальных миров по текстовому описанию.

Конкуренция при этом только нарастает. Google со своей моделью Imagen, Meta с разработками в области генеративного ИИ, да и Stability AI не стоит на месте. Удержать позиции в такой гонке — задача не из лёгких. Но преимущество Midjourney в том, что у неё уже сформировалось лояльное сообщество, готовое платить за подписку и вовлечённое в развитие продукта. А это, пожалуй, кладезь, который сложно переоценить в эпоху, когда технологии меняются быстрее, чем пользователи успевают к ним привыкнуть.

Сервис продолжает удивлять, а возможности его — расширяться с каждым обновлением. Тем, кто ещё не пробовал генерировать изображения в Midjourney, стоит хотя бы раз окунуться в этот процесс: он затягивает и творит чудеса с восприятием того, на что способны современные технологии. Удачи в экспериментах — результат наверняка запомнится надолго.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *