Подробный гайд по Midjourney: все настройки, параметры и секреты генерации

Нейросети для генерации изображений за последние пару лет из диковинной игрушки для гиков превратились в полноценный рабочий инструмент — ими пользуются дизайнеры, маркетологи, блогеры и даже архитекторы. Но среди всего разнообразия сервисов львиная доля внимания по-прежнему достаётся Midjourney. И не зря: качество картинки, скорость работы и глубина настроек у этого инструмента впечатляют даже скептиков. Однако новичкам сервис нередко кажется тёмным лесом — слишком много параметров, непонятных флагов и скрытых нюансов, о которых не расскажут в коротком ролике на YouTube. А потому стоит разобраться во всём скрупулёзно, с самого начала и до мельчайших деталей.

Все топовые нейросети в одном месте

С чего начинается работа в Midjourney?

Первое знакомство. Раньше, буквально ещё в 2023-м, попасть в Midjourney можно было только через Discord — мессенджер, изначально созданный для геймеров. Сейчас же у сервиса появился собственный веб-интерфейс на сайте midjourney.com, и работать стало ощутимо проще. Впрочем, Discord-бот никуда не делся, и многие «старожилы» по привычке генерируют именно там. Для старта нужна подписка — бесплатного тарифа на момент написания этих строк нет, а самый бюджетный план стоит около десяти долларов в месяц. Не то чтобы сильно бьёт по кошельку, но и вслепую отдавать деньги нет смысла. Тем более, что разобраться в интерфейсе стоит до покупки, чтобы не тратить оплаченные минуты GPU на бессмысленные эксперименты.

Вся суть работы с Midjourney сводится к одному — к промту. Промт (prompt) — это текстовое описание того, что нейросеть должна нарисовать. Казалось бы, просто: написал «красивый закат над морем» и жди шедевра. Но на практике дело обстоит сложнее. Ведь нейросеть воспринимает слова не как человек, а скорее как причудливый калькулятор смыслов. Порядок слов, их вес, наличие или отсутствие уточнений — всё это влияет на финальную картинку. И довольно часто результат удивляет. Иногда приятно, а иногда — не очень.

Промт: анатомия запроса

Хороший промт строится по простой, но неочевидной логике. На первое место лучше ставить главный объект — то, что должно солировать в кадре. Далее идут детали окружения, стиль, освещение и настроение. К слову, порядок имеет значение: Midjourney придаёт больший «вес» словам, стоящим ближе к началу. Это значит, что фраза «a lonely lighthouse on a cliff, dramatic sunset, oil painting style» и «oil painting style, dramatic sunset, a lonely lighthouse on a cliff» дадут разный результат. В первом случае маяк окажется в центре внимания, во втором — нейросеть может сделать акцент на стиле масляной живописи, а маяк задвинуть на задний план.

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

Отдельно стоит упомянуть так называемые «отрицательные промты» — то, чего на картинке быть не должно. Записываются они через параметр —no. Допустим, нужен портрет без очков — тогда в конце промта добавляется —no glasses. Работает ли это идеально? Вовсе нет. Нейросеть — не послушный исполнитель, а скорее своенравный художник, который «слышит» пожелания, но интерпретирует их по-своему. Да и полностью исключить элемент из генерации удаётся не всегда, особенно если он логически связан с остальным описанием.

Версии модели и параметр —v

Midjourney за время своего существования пережила несколько поколений. Каждая новая версия модели заметно отличалась от предыдущей — и не всегда в ту сторону, которую ожидали пользователи. Переключение между версиями осуществляется параметром —v с указанием номера. На момент лета 2025 года актуальной считается шестая версия (v6.1), хотя многие до сих пор тяготеют к пятой — мол, она «понятнее» и «послушнее». Это связано с тем, что v6 значительно лучше понимает естественный язык, но при этом реагирует на промты более непредсказуемо.

В чём же конкретная разница? Пятая версия прекрасно справлялась с абстрактными концептами и стилизациями, а вот с фотореализмом у неё дела обстояли средне. Шестая модель, напротив, творит чудеса в реалистичных портретах и пейзажах, но более требовательна к формулировкам. Кстати, появился и специальный режим —style raw, который убирает «фирменную» эстетику Midjourney — ту самую характерную «красивость», которая многим кажется чрезмерной. Режим raw делает картинку грубее, зато честнее по отношению к тексту запроса.

Что скрывается за параметром —ar?

Соотношение сторон. Вещь, казалось бы, тривиальная, но именно она порой определяет, будет ли изображение выглядеть профессионально или по-любительски. По умолчанию Midjourney генерирует квадратные картинки 1:1. Для Instagram-постов это годится, а вот для обложки статьи, баннера или обоев на рабочий стол — нет. Параметр —ar позволяет задать нужную пропорцию. Для горизонтального формата часто используют 16:9 или 3:2, для вертикального — 9:16 или 2:3. Можно экспериментировать и с нестандартными значениями вроде 21:9 (ультраширокий кинематографический формат), но результат при слишком экстремальных пропорциях бывает непредсказуемым — нейросеть начинает «растягивать» композицию, и картинка теряет гармонию.

Стилизация и параметр —stylize

Добротный инструмент для тех, кто хочет управлять степенью «художественности» результата. Значение задаётся числом от 0 до 1000, и разброс тут внушительный. При нуле нейросеть максимально точно следует тексту промта, почти не привнося собственного «вкуса». При тысяче — наоборот, пускается в свободное плавание, порой выдавая нечто грандиозное, а порой — совершенно далёкое от задуманного. Стоит задуматься: а какой именно результат нужен? Если делается концепт для клиента, лучше держать значение в районе 100–250 — так картинка останется управляемой. А вот для личного вдохновения и поиска неожиданных решений можно смело ставить 600 и выше.

Нужно отметить, что —stylize (или сокращённо —s) работает немного по-разному в зависимости от версии модели. В v5, например, высокие значения часто приводили к «мыльным» перенасыщенным картинкам. В v6 алгоритм ведёт себя аккуратнее. Но подводные камни всё равно есть: при —s 1000 нейросеть может проигнорировать часть промта в угоду собственному «видению». Это не баг, а особенность — и к ней стоит привыкнуть.

Хаос, разнообразие и параметр —chaos

Ещё один неоднозначный параметр, о котором новички часто забывают. —chaos (или —c) регулирует степень разброса между четырьмя вариантами, которые Midjourney выдаёт за одну генерацию. При значении 0 все четыре картинки будут довольно похожи друг на друга — как четыре дубля одной и той же сцены. А вот при значении 100 результаты разлетятся настолько, будто их рисовали четыре разных художника. Зачем это нужно? Дело в том, что иногда лучший результат рождается именно из хаоса. Когда точно знаешь, чего хочешь, ставь chaos на минимум. Когда ищешь идею — на максимум.

Как работает параметр —quality?

Многие считают, что —quality (—q) влияет на разрешение картинки. На самом деле это не так. Этот параметр определяет, сколько вычислительного времени GPU тратится на генерацию одного изображения. Значение по умолчанию — 1. При —q 0.25 нейросеть работает в четыре раза быстрее, но и «думает» поверхностнее: детали теряются, текстуры упрощаются. При —q 2 (если версия модели это поддерживает) картинка прорабатывается тщательнее, но расход минут GPU удваивается. Стоит ли переплачивать? Довольно часто — нет. Разница между —q 1 и —q 2 заметна далеко не на каждом промте. А вот —q 0.5 — отличный компромиссный вариант для черновых генераций, когда нужно быстро перебрать десяток идей.

Повтор результата: параметр —seed

Каждая генерация в Midjourney получает случайное число-зерно (seed). Именно оно определяет «стартовую точку» для нейросети. Два одинаковых промта с одинаковым seed-значением теоретически должны дать одинаковый результат. Теоретически — потому что на практике совпадение бывает не стопроцентным, особенно при смене версий модели. Но всё-таки —seed — незаменимый инструмент для итеративной работы. К примеру, получилась хорошая композиция, но хочется изменить цветовую гамму. Фиксируешь seed, меняешь только описание цветов — и получаешь вариацию той же самой сцены. Это экономит и время, и нервы.

Узнать seed уже сгенерированной картинки можно через реакцию-эмодзи ✉️ в Discord (бот пришлёт значение в личные сообщения) или через интерфейс на сайте. Нюанс в том, что seed привязан к конкретной версии модели. Если перейти с v5 на v6, старый seed выдаст совершенно другую картинку. Это стоит учитывать при работе над долгосрочными проектами.

Режим Remix и вариации

Изюминка Midjourney, которая выделяет сервис на фоне конкурентов. Режим Remix позволяет взять уже готовый результат и переписать промт, сохранив общую структуру и композицию изображения. Включается он через настройки (/settings в Discord или тумблер на сайте). Допустим, сгенерирован портрет девушки в летнем платье на фоне Парижа. С включённым Remix можно нажать кнопку вариации и изменить промт на «зимнее пальто, заснеженный Лондон» — и нейросеть постарается сохранить позу и общую компоновку, но сменит антураж. Довольно мощный инструмент для итеративной доработки.

Впрочем, ложка дёгтя тоже присутствует. Remix не всегда корректно «понимает» масштаб изменений. Если промт переписан слишком радикально, результат может оказаться далёким от ожиданий. Лучше менять по одному-два элемента за раз. Это кропотливо, но надёжно.

Загрузка референсных изображений

Текст — не единственный способ общения с Midjourney. Сервис умеет принимать на вход изображения и использовать их как ориентир для генерации. Достаточно вставить прямую ссылку на картинку в начале промта (перед текстовым описанием), и нейросеть «впитает» её стиль, палитру и настроение. Можно загрузить сразу несколько референсов — тогда Midjourney попробует смешать их между собой. Два-три изображения обычно дают интересный результат, а вот пять и больше — уже каша.

К слову, есть специальный параметр —iw (image weight), который определяет, насколько сильно референс влияет на итоговую картинку. Значение по умолчанию — 1. При —iw 0.5 текстовый промт доминирует, а при —iw 2 нейросеть почти копирует загруженное изображение. Этот параметр — настоящий спасательный круг для дизайнеров, которым нужно сохранить фирменный стиль бренда, но при этом получить свежий визуал.

Апскейл и детализация

После генерации Midjourney выдаёт четыре превью в сетке. Каждое можно «апскейлить» — увеличить до полного разрешения. В шестой версии базовое разрешение одного изображения составляет примерно 1024×1024 пикселей (при квадратном формате). Не так уж и много для печати, верно? Но тут на помощь приходит встроенный апскейлер. Кнопки U1–U4 в Discord увеличивают выбранный вариант, а дополнительные опции вроде Upscale (Subtle) и Upscale (Creative) позволяют довести разрешение до 2048×2048 и выше. Subtle — деликатный вариант, который почти не меняет исходник. Creative — более агрессивный, он дорисовывает детали, которых изначально не было. Иногда творит чудеса, а иногда добавляет лишнее.

Для тех, кому и этого мало, существуют сторонние апскейлеры — Topaz Gigapixel, Real-ESRGAN и другие. Но это уже отдельная история, выходящая за рамки самого Midjourney.

Стоит ли использовать мультипромты?

Безусловно. Мультипромты — это способ разбить описание на смысловые блоки с помощью двойных двоеточий ::. Каждому блоку можно присвоить свой «вес». Например, промт «space:: ship» и «spaceship» дадут совершенно разные результаты. В первом случае нейросеть воспримет «space» и «ship» как два отдельных понятия — космос и корабль. Во втором — как единое слово «космический корабль». Мультипромты позволяют тонко настраивать акценты: «vibrant forest::2 dark castle::1» — здесь лес получит вдвое больше «внимания», чем замок.

Но не стоит перебарщивать с количеством блоков. Три-четыре — оптимум. При семи и более нейросеть начинает «путаться», и результат скорее разочарует. Кроме того, мультипромты плохо сочетаются с очень длинными текстовыми описаниями. Если промт уже занимает три строки, разделение на блоки только усложнит генерацию.

Скрытые приёмы и секреты опытных пользователей

Настоящий кладезь знаний — сообщества в Discord и Reddit, где пользователи делятся находками. Один из самых полезных приёмов — «весовые якоря». Идея в том, чтобы добавлять в промт слова, определяющие не объект, а ощущение: «cinematic lighting», «moody atmosphere», «8K render», «shot on Hasselblad». Технически нейросеть не знает, что такое Hasselblad, но она «видела» тысячи фотографий с таким тегом в обучающей выборке — и воспроизводит характерную глубину резкости и цветопередачу.

Ещё один секрет — негативное пространство. Если хочется получить минималистичную композицию с обилием воздуха вокруг объекта, стоит добавить фразы вроде «lots of negative space» или «minimalist composition». Без этого Midjourney по привычке заполняет весь кадр деталями. А вот просьба «simple background» срабатывает далеко не всегда — нейросеть любит украшать задний план.

Отдельно стоит упомянуть параметр —tile. Он заставляет нейросеть создавать бесшовный паттерн, который можно повторять как текстуру. Для дизайнеров обоев, упаковки и тканей — вещь незаменимая. Не идеально, конечно: швы иногда всё же заметны при внимательном рассмотрении. Но как отправная точка для дальнейшей ручной доработки — более чем достаточно.

Как не тратить лимит впустую?

Задача не из лёгких. Ведь соблазн «ещё разок перегенерировать» преследует каждого пользователя. Несколько щепетильных моментов: во-первых, стоит пользоваться быстрой генерацией (fast mode) только для финальных вариантов, а для экспериментов переключаться на релакс-режим (relax mode) — он доступен на тарифах Standard и выше и не расходует GPU-минуты. Во-вторых, нет смысла гнаться за идеальным результатом с первого раза. Опытные пользователи обычно генерируют черновик с —q 0.5, находят удачную композицию, фиксируют seed — и уже потом доводят до ума в полном качестве.

К тому же стоит завести привычку сохранять удачные промты. Со временем накапливается библиотека «рабочих формул», которые можно адаптировать под новые задачи. Кто-то ведёт заметки в Notion, кто-то — в простом текстовом файле. Главное — не полагаться на память, потому что через неделю точная формулировка промта, давшего потрясающий результат, благополучно забудется.

Типичные ошибки новичков

Слишком длинные промты — одна из главных проблем. Многие пытаются описать каждую мелочь: «девушка с каштановыми волосами до плеч, в зелёном платье с V-образным вырезом, стоит на мосту через реку, на заднем плане готический собор, закат, розовые облака, птицы в небе, отражение в воде». Желание понятное, но результат часто удручающий. Нейросеть теряется в обилии деталей и начинает жертвовать качеством ради попытки «уместить всё». Гораздо эффективнее выбрать три-четыре самых важных элемента и сформулировать их чётко.

Следующая распространённая ошибка — игнорирование параметров. Новички пишут текст, жмут Enter и надеются на лучшее. А ведь даже простое добавление —ar 16:9 и —s 200 способно преобразить результат до неузнаваемости. Ну и, конечно же, классика — использование русского языка в промтах. Midjourney обучена преимущественно на англоязычных описаниях. Русский она понимает, но значительно хуже. Так что перевод промта на английский — не каприз, а необходимость.

Настройки через /settings и /prefer

В Discord-интерфейсе команда /settings открывает панель, где можно одним кликом переключить версию модели, режим стилизации, Remix и другие глобальные параметры. Это удобно — не нужно каждый раз вписывать —v 6 или —style raw вручную. А вот о команде /prefer suffix знают далеко не все. Она позволяет задать «суффикс по умолчанию» — набор параметров, которые будут автоматически добавляться к каждому промту. Допустим, вы всегда работаете в формате 16:9 с стилизацией 250. Один раз прописали /prefer suffix —ar 16:9 —s 250 — и больше об этом можно не думать.

Тем более что есть ещё /prefer option set — инструмент для создания собственных «шорткатов». Можно придумать короткое имя (например, «myStyle») и привязать к нему длинную строку параметров и даже фрагменты промта. Потом достаточно написать —myStyle в конце промта — и вся сохранённая строка подставится автоматически. Для тех, кто генерирует десятки картинок в день, это настоящий спасительный инструмент.

Все топовые нейросети в одном месте

Midjourney и авторское право

Тема щекотливая. На момент 2025 года правовой статус изображений, созданных нейросетями, до конца не определён ни в одной юрисдикции мира. В США Бюро авторского права уже вынесло несколько решений, суть которых сводится к одному: чистый AI-арт без существенного человеческого вклада авторским правом не защищается. Но что считать «существенным вкладом» — вопрос открытый. Компоновка промта, выбор параметров, постобработка — всё это теоретически может квалифицироваться как творческий вклад. Однако судебная практика пока скудная.

Что касается коммерческого использования, условия подписки Midjourney разрешают его на всех платных тарифах. Но стоит внимательно прочитать Terms of Service, особенно пункт о корпоративном использовании (для компаний с годовым доходом свыше миллиона долларов действуют отдельные правила). Ну, а если в промте упоминается реальный бренд или знаменитость, ответственность за последствия ложится целиком на пользователя. Midjourney в этом плане руки умывает.

Что ждёт Midjourney дальше?

Разработчики не стоят на месте. Уже анонсированы возможности генерации видео (альфа-тестирование стартовало в конце 2024-го), 3D-моделей и даже интерактивных сцен. Конкуренция со стороны DALL·E, Stable Diffusion, Firefly и Flux подстёгивает команду Дэвида Хольца к постоянным обновлениям. Буквально пару лет назад нейросети рисовали людей с шестью пальцами и кривым текстом на вывесках — сейчас же результат порой не отличить от профессиональной фотосессии. Темп развития — головокружительный.

Освоение Midjourney — это не спринт, а марафон. С каждой новой генерацией приходит понимание того, как «думает» нейросеть, какие слова на неё действуют сильнее, а какие она благополучно игнорирует. Не стоит бояться экспериментов — именно из них рождаются самые впечатляющие работы. А добротное знание параметров превращает случайный результат в осознанный инструмент. Удачи в генерациях — пусть каждый новый промт приближает к идеальной картинке.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *