How to Midjourney: инструкция по созданию первых артов

Ещё пару лет назад нейросети, генерирующие изображения по текстовому запросу, казались чем-то из разряда научной фантастики — развлечением для узкого круга энтузиастов, ковырявшихся в командных строках и весивших на своих видеокартах гигабайты моделей. Сейчас же любой обыватель, вооружённый лишь клавиатурой и долей любопытства, способен за минуту получить арт, от которого у иного иллюстратора дрогнет бровь. Midjourney — один из самых обсуждаемых инструментов в этой нише, и львиная доля новичков начинает знакомство с ИИ-артом именно с него. Но чтобы первый опыт не превратился в разочарование, стоит разобраться в нюансах до того, как пальцы коснутся клавиш.

Что такое Midjourney и с чем его едят?

Midjourney — нейросеть, превращающая текстовое описание (так называемый prompt) в готовое изображение. Звучит просто. На деле же за этой лаконичной формулировкой скрывается довольно сложная махинация: модель анализирует каждое слово запроса, сопоставляет его с миллиардами обработанных изображений и на выходе генерирует нечто, чего раньше не существовало. Разработкой занимается небольшая независимая лаборатория из Сан-Франциско во главе с Дэвидом Хольцем — бывшим сотрудником NASA и сооснователем Leap Motion. К слову, команда насчитывает всего около полутора десятков человек, что для проекта такого масштаба выглядит впечатляюще. И всё-таки самое важное для новичка — не история создания, а практическая сторона: как зарегистрироваться, куда вводить запрос и что делать, когда картинка получилась совсем не той, какой грезилась.

Регистрация и первый вход

Долгое время доступ к Midjourney открывался исключительно через Discord — мессенджер, изначально созданный для геймеров. Многих это отпугивало. Ведь если человек ни разу не сталкивался с Discord, интерфейс с каналами, ботами и вложенными чатами казался настоящим лабиринтом. Однако в 2024 году появился веб-интерфейс на сайте midjourney.com, и работать стало ощутимо проще. Сейчас достаточно зайти на официальный сайт, авторизоваться через аккаунт Google или Discord — и перед глазами откроется лаконичная панель с полем для ввода промта. Впрочем, вариант через Discord никуда не делся, да и некоторые продвинутые функции по-прежнему удобнее запускать именно оттуда.

Нужно ли за это платить? Да. Бесплатный пробный период Midjourney то появлялся, то исчезал — разработчики несколько раз меняли политику. На момент написания статьи минимальная подписка стоит около 10 долларов в месяц (тариф Basic), а за 30 долларов открывается Standard с расширенным лимитом генераций. Не сильно ударит по кошельку, если учесть, что за эти деньги можно получить сотни изображений в месяц. А вот тариф Pro за 60 долларов пригодится тем, кто генерирует арты в промышленных объёмах или нуждается в режиме stealth — скрытой генерации, невидимой для других пользователей.

Как составить первый промт?

Задача не из лёгких. Точнее, написать промт — легко, а вот написать хороший промт — это уже отдельное искусство. Вся суть в том, что Midjourney воспринимает слова не так, как воспринимает их человек. Нейросеть тяготеет к ассоциациям: она не «понимает» текст в привычном смысле, а выстраивает визуальные связи между понятиями. Поэтому промт вроде «красивый пейзаж» выдаст нечто усреднённое и невнятное, а вот «misty mountain valley at sunrise, golden light filtering through pine trees, cinematic composition, 8k» уже заставит нейросеть выдать куда более осмысленный результат.

Начать стоит с простой структуры. Во-первых, сам объект — что именно должно быть на картинке. Во-вторых, окружение и атмосфера — где это находится, какой свет, какое настроение. Ну и, наконец, стилистические указания — в каком стиле нужен арт: фотореализм, акварель, аниме, ретрофутуризм, масляная живопись. Midjourney довольно чутко реагирует на упоминание конкретных художников и фотографов (Грег Рутковски, Альфонс Муха, Энни Лейбовиц), но тут есть этический нюанс — не всем авторам нравится, что их стиль эксплуатирует нейросеть. Это неоднозначный вопрос, и однозначного ответа пока ни у кого нет.

Параметры генерации: тонкая настройка

Одним лишь текстом дело не ограничивается. К промту можно прицепить параметры, которые кардинально меняют результат. Один из самых используемых — —ar (aspect ratio), отвечающий за соотношение сторон. По умолчанию Midjourney генерирует квадратное изображение 1:1, но для пейзажа разумнее задать —ar 16:9, а для портрета — —ar 2:3. Кстати, многие новички игнорируют этот параметр и потом удивляются, почему их эпичная панорама выглядит зажатой в квадрат.

Следующий важный параметр — —stylize (или коротко —s). Значение по умолчанию — 100, диапазон — от 0 до 1000. Чем выше число, тем больше «художественной вольности» берёт на себя нейросеть: цвета сочнее, композиция драматичнее, деталей больше. При низких значениях Midjourney строже следует тексту промта. Нужно отметить, что золотая середина у каждого своя — тут без экспериментов не обойтись. Отдельно стоит упомянуть параметр —chaos (от 0 до 100), управляющий разнообразием четырёх вариантов в сетке. Высокий хаос — четыре совершенно разных интерпретации. Низкий — четыре похожих варианта с минимальными отличиями. Да и параметр —weird (до 3000) заслуживает внимания: он добавляет в генерацию элемент сюрреализма, иногда порождая настоящий кладезь неожиданных визуальных решений.

Стоит ли писать промты на русском?

Короткий ответ — можно, но не стоит. Midjourney обучалась преимущественно на англоязычных описаниях, и русскоязычные промты нейросеть обрабатывает через внутренний перевод, теряя по дороге нюансы. Разница бросается в глаза: один и тот же запрос на русском и на английском даёт ощутимо различающиеся результаты, причём в пользу английского. Тем более что для составления промта не нужен изысканный литературный язык — хватит школьного уровня и пары заглядываний в онлайн-переводчик. А если совсем туго с английским, можно воспользоваться ChatGPT или DeepL для перевода идеи в грамотный промт. Многие так и делают. Без стыда.

Что делать после генерации?

Четыре картинки появились на экране. Что дальше? Под каждой сеткой располагаются кнопки, и разобраться в них довольно просто. Кнопки U1–U4 (upscale) увеличивают выбранное изображение, повышая его разрешение. В ранних версиях апскейл заметно менял детали, но в актуальной версии (v6 и новее) процесс стал куда аккуратнее. Кнопки V1–V4 (variation) создают новые вариации на основе выбранной картинки — нейросеть берёт понравившийся результат за основу и генерирует четыре его «родственника». Это удобно. Ведь иногда композиция идеальная, а вот цвет или выражение лица хочется подправить.

Кроме того, появилась функция Vary (Region) — по сути, инпейнтинг. Можно выделить фрагмент изображения кистью и попросить Midjourney перегенерировать только эту область. Скажем, всё на картинке устраивает, но на заднем плане торчит нелепая башня — выделяешь её, пишешь новое описание фона, и нейросеть аккуратно заменяет фрагмент. Функция не безупречная, подводные камни всплывут при работе с мелкими деталями, но для грубой коррекции она творит чудеса.

Промт-инжиниринг: от новичка к практику

Со временем приходит понимание, что промт — не просто набор слов, а скорее рецепт. И как в кулинарии, порядок ингредиентов имеет значение. Midjourney придаёт больший вес словам, стоящим в начале промта. Поэтому главный объект лучше ставить первым, а стилистику и технические указания — ближе к концу. Некоторые опытные пользователи идут дальше и используют так называемые мультипромты — конструкции с двойным двоеточием (::), позволяющие задавать «вес» каждому понятию отдельно. Например, «forest::2 castle::1 fog::3» заставит нейросеть акцентировать внимание на тумане, чуть меньше — на лесе, и совсем немного — на замке.

Ещё один мощный приём — негативные промты через параметр —no. Если нейросеть упорно добавляет в портрет очки или лишние пальцы (классическая беда ранних версий), можно дописать —no glasses, extra fingers. Работает не всегда идеально, однако в большинстве случаев заметно уменьшает количество нежелательных элементов. К тому же в шестой версии проблема с пальцами практически решена — модель стала куда скрупулёзнее в анатомии.

Какие ошибки допускают новички?

Самая распространённая — перегруженность промта. Новичок, вдохновлённый возможностями, пытается запихнуть в один запрос всё сразу: и пейзаж, и персонажа, и архитектуру, и магию, и закат, и котёнка на переднем плане. Результат — каша. Нейросеть не знает, на чём сфокусироваться, и выдаёт размытый компромисс. Не стоит перегружать промт более чем тремя–четырьмя смысловыми блоками. Лучше сделать несколько отдельных генераций и потом скомбинировать идеи.

Вторая частая ошибка — ожидание фотографической точности с первого раза. Midjourney — не фотошоп и не 3D-редактор. Она интерпретирует, а не исполняет буквально. Если в промте написано «синий дом с тремя окнами на втором этаже», нейросеть может выдать четыре окна. Или пять. И цвет будет скорее лазурным, чем синим. Такова природа инструмента, и принять это нужно на старте, чтобы потом не тратить нервы. А вот что действительно помогает — референсные изображения. Можно загрузить картинку по ссылке прямо в промт, и Midjourney возьмёт её за визуальную основу, смешав с текстовым описанием. Довольно мощная техника, которую многие обходят стороной совершенно напрасно.

Версии моделей: v5, v6 и Niji

Midjourney регулярно обновляет модели, и разница между версиями колоссальная. Если первые итерации выдавали нечто похожее на сон после острой пищи — красиво, но дико, — то начиная с пятой версии генерации стали поразительно детализированными. Шестая версия (v6) принесла революцию в работе с текстом внутри изображений: раньше любая попытка вписать надпись в арт заканчивалась нечитаемой абракадаброй, а теперь нейросеть довольно сносно рисует буквы латиницей (с кириллицей пока всё сложнее, но прогресс есть).

Отдельная история — модель Niji, созданная совместно с компанией Spellbrush и заточенная под аниме-стилистику. Для любителей японской анимации это настоящий спасательный круг: стандартная модель Midjourney тяготеет к западной эстетике, а Niji выдаёт колоритные арты в духе студий Ghibli или Ufotable. Переключиться на неё можно параметром —niji 6 в конце промта. И результат, надо сказать, приковывает внимание даже тех, кто к аниме абсолютно равнодушен.

Юридический нюанс: кому принадлежат арты?

Щепетильный вопрос, от которого не стоит отмахиваться. По условиям пользовательского соглашения Midjourney (актуальная версия на июль 2025 года) подписчики платных тарифов получают право на коммерческое использование сгенерированных изображений. Однако если годовой доход компании превышает миллион долларов — нужен тариф не ниже Pro. Пользователи бесплатного пробного периода (когда он доступен) коммерческих прав не получают вовсе. К тому же нельзя не упомянуть правовую неопределённость в целом: Бюро авторского права США неоднократно отказывало в регистрации копирайта на ИИ-арт, считая, что произведение должно иметь человеческого автора. В России подобной практики пока толком нет, но тенденция задаёт вектор. Так что использовать Midjourney-арты для обложки книги или логотипа можно, но держать в голове юридическую ложку дёгтя — необходимо.

Как развить навык?

Практика. Ничего оригинальнее человечество пока не придумало. Первые десять–двадцать генераций будут разочаровывать — это нормально. Потом рука набьётся, и формулировки начнут «ложиться» точнее. Очень помогает изучение чужих промтов — на сайте Midjourney есть лента с работами других пользователей, и под каждым артом виден полный текст запроса. Это настоящий кладезь вдохновения и готовых решений. А ещё существует площадка prompthero.com и сообщества в Reddit, где тысячи людей делятся находками и разбирают ошибки.

Буквально пять–шесть лет назад подобный инструмент казался немыслимым, а сейчас с его помощью создают концепт-арт для фильмов, иллюстрации к книгам, референсы для 3D-моделей и даже принты для одежды. Midjourney — не замена художнику, но мощный добротный помощник, способный сократить путь от идеи до визуала с нескольких часов до нескольких секунд. Ну, а изюминку в каждый арт по-прежнему вносит человек — его фантазия, вкус и умение сформулировать мысль так, чтобы нейросеть поняла. Удачи в первых генерациях — пусть каждый новый промт приближает к тому самому идеальному арту, который захочется поставить на рабочий стол и показать всем знакомым.