Нейросети для генерации изображений за последние пару лет из диковинной игрушки превратились в полноценный рабочий инструмент — дизайнеры, маркетологи и просто творческие люди со всего мира ежедневно скармливают им миллионы текстовых запросов. Midjourney среди подобных сервисов занимает особое место, ведь именно эта нейросеть прославилась невероятной «художественностью» результатов. Однако львиная доля новичков, впервые столкнувшихся с интерфейсом через Discord, натыкается на одну и ту же стену: картинка в голове выглядит потрясающе, а на выходе получается нечто далёкое от задуманного. Дело в том, что между идеей и результатом стоит промт — та самая текстовая инструкция, от формулировки которой зависит буквально всё. А начать стоит с понимания того, как эти промты вообще устроены и почему одни работают блестяще, а другие — удручающе.
Что такое промт и почему формулировка решает всё?
Промт для Midjourney — это не просто описание картинки. Это скорее сжатое техническое задание, переданное художнику, который понимает английский язык довольно буквально и при этом обладает собственным «вкусом». Нейросеть не додумывает за пользователя — она интерпретирует каждое слово, взвешивает его значимость и на основании всей совокупности терминов выстраивает изображение. Именно поэтому фраза «beautiful landscape» выдаст нечто усреднённое и скучноватое, а вот «misty fjord at dawn, volumetric lighting, cinematic composition, shot on Hasselblad» — совсем другой антураж. Разница колоссальная. Ведь во втором случае нейросети передали конкретику: время суток, тип освещения, стиль композиции и даже «камеру», через оптику которой она должна смотреть на сцену.
Стоит отметить один важный нюанс: порядок слов в промте тоже имеет значение. Midjourney присваивает больший вес словам, расположенным ближе к началу строки. Поэтому самые критичные элементы — основной объект, стиль, настроение — размещать нужно в первой трети промта. А технические параметры вроде соотношения сторон и степени стилизации уходят в конец, после двойного тире. Этот принцип довольно прост, но новички о нём забывают с завидной регулярностью.
Стили: от фотореализма до акварельной сказки
Настоящий кладезь возможностей. Именно выбор стиля превращает генерацию из лотереи в осознанный творческий процесс. Один из самых востребованных подходов — фотореалистичный стиль. Чтобы Midjourney выдала картинку, неотличимую от фотографии, в промт добавляют указания на тип камеры (Canon EOS R5, Sony A7IV, Leica M11), объектив (85mm f/1.4, 35mm wide angle) и характер съёмки (shallow depth of field, bokeh background, golden hour lighting). Результат бывает настолько убедительным, что отличить его от реального снимка способен далеко не каждый профессионал.
Все лучшие нейросети мира теперь в твоём кармане! ⚡
Тексты, топовое видео, картинки и аудио. Самые мощные версии GPT, Claude, Midjourney, Sora, Kling и еще 90+ ИИ-моделей собраны в одном месте. Работает невероятно быстро: через удобный сайт или прямо в Telegram. Больше никаких блокировок, VPN, иностранных карт и переплат.
Жми на ссылку ниже и забирай свои бесплатные генерации для тест-драйва платформы 👉 https://clck.ru/3RNCRL
Далее следует кинематографический стиль — пожалуй, самый эффектный. Здесь солируют такие термины, как cinematic still, anamorphic lens flare, film grain, directed by [имя режиссёра]. К слову, ссылка на конкретного режиссёра творит чудеса: промт с упоминанием Ридли Скотта даст мрачный эпический кадр, а имя Уэса Андерсона — симметричную пастельную композицию с характерной «кукольностью». И всё это без единой строчки кода, только правильно подобранные слова.
Отдельно стоит упомянуть иллюстративные стили. Акварель (watercolor painting, soft washes, wet-on-wet technique) даёт воздушные размытые работы. Масляная живопись (oil painting, impasto brushstrokes, alla prima) — густые фактурные мазки. А цифровая иллюстрация в духе концепт-арта (digital concept art, matte painting, trending on ArtStation) идеально подходит для фантастических ландшафтов и персонажей. Нужно отметить, что упоминание конкретных художников (Грег Рутковски, Альфонс Муха, Хаяо Миядзаки) тоже существенно сдвигает визуальный результат в сторону их узнаваемой манеры. Впрочем, с именами стоит быть аккуратнее — Midjourney периодически ограничивает подобные ссылки по этическим соображениям.
Какие параметры стоит знать наизусть?
Тонкая настройка. Без неё даже идеально сформулированный промт может дать непредсказуемый результат. Первый и, пожалуй, самый часто используемый параметр — —ar (aspect ratio), задающий соотношение сторон изображения. Стандартное значение — 1:1, квадрат. Но для горизонтальных пейзажей лучше подходит 16:9 или даже 21:9, а для портретов и сторис — 9:16 или 2:3. Это базовая вещь, но именно она определяет, будет ли картинка выглядеть как обои на рабочий стол или как кадр из вертикального видеоролика.
Следующий важный критерий — —stylize (или сокращённо —s). Этот параметр управляет степенью «художественной вольности» нейросети. Значение варьируется от 0 до 1000. При низких числах (скажем, 50–100) Midjourney строго следует тексту промта и практически не отсебятничает. При высоких (750–1000) — добавляет собственную эстетику, порой превращая скромный запрос в нечто грандиозное, но далёкое от исходной задумки. Золотая середина для большинства задач лежит в районе 250–400. Тем более, что по умолчанию стоит значение 100, и многие даже не догадываются его менять.
Ну и, конечно же, нельзя не упомянуть параметр —chaos (от 0 до 100). Он определяет, насколько разнообразными будут четыре варианта в сетке результатов. При значении 0 все четыре картинки похожи друг на друга, словно вариации на одну тему. При 80–100 нейросеть выдаёт совершенно разные интерпретации, и среди них нет-нет да и всплывёт что-то неожиданно удачное. Довольно полезный инструмент на этапе поиска идеи, когда точного видения ещё нет.
Негативные промты и весовые коэффициенты
Сказать нейросети, что нужно нарисовать, — полдела. Не менее важно объяснить, чего на картинке быть не должно. Для этого в Midjourney существует параметр —no, после которого перечисляются нежелательные элементы. Например, —no text, watermark, blurry, extra fingers помогает избавиться от самых распространённых артефактов. Работает ли это идеально? Нет, но заметно повышает процент годных результатов. А если вспомнить, сколько нервов уходит на борьбу с «лишними» пальцами на руках персонажей, ценность этой короткой приписки становится очевидной.
Весовые коэффициенты — ещё один мощный рычаг управления. Синтаксис прост: после нужного слова ставится двойное двоеточие и число. Например, forest::2 castle::1 означает, что лесу нейросеть уделит вдвое больше внимания, чем замку. Замок не исчезнет, но отступит на второй план. Можно задавать даже отрицательные значения (fog::-0.5), хотя на практике параметр —no справляется с этой задачей проще. Вся суть в том, что весовые коэффициенты позволяют тонко балансировать элементы внутри одного промта, не разрывая его на части.
Как описать освещение и атмосферу?
Свет — это 70 процентов настроения любой картинки. Без преувеличения. Профессиональные фотографы и кинооператоры годами учатся работать со светом, и в мире нейрогенерации этот принцип никуда не делся. Промт без указания на характер освещения — всё равно что портрет, снятый со встроенной вспышкой: технически он существует, но душа в нём не ночевала.
Один из самых выигрышных вариантов — golden hour lighting, тот самый «режимный» час перед закатом, когда всё вокруг залито тёплым медовым светом. Кстати, для противоположного эффекта — холодного мистического антуража — отлично работает blue hour или moonlit scene. Драматизм добавляет chiaroscuro lighting (контрастный свет в духе Караваджо), а мягкую обволакивающую атмосферу создаёт diffused overcast light. Но есть и более неочевидные приёмы: rim lighting (контровой свет, обводящий силуэт объекта) и volumetric rays (лучи, пробивающиеся сквозь туман или пыль). Последний буквально приковывает внимание — картинка с объёмными лучами всегда выглядит на порядок сложнее и «дороже».
К тому же не стоит забывать про цветовую палитру. Указание muted earth tones даст приглушённую тёплую гамму, neon cyberpunk palette — кислотные неоновые оттенки, а monochrome with a single red accent — стильный чёрно-белый кадр с единственным красным акцентом. Такие уточнения занимают пару слов, но на результат влияют радикально.
Секреты, о которых редко пишут
Версия модели. Казалось бы, мелочь. Но разница между результатами Midjourney v5 и v6 иногда настолько разительна, что один и тот же промт выдаёт совершенно непохожие картинки. Каждая новая версия лучше понимает длинные описательные промты, точнее передаёт текст на изображении (надписи, вывески) и аккуратнее прорабатывает анатомию. Стоит всегда проверять, какая версия модели установлена в настройках, — переключение между ними занимает пару секунд через команду /settings.
Ещё один добротный приём — мультипромтинг. Суть в том, что описание разбивается на смысловые блоки через двойное двоеточие. Например, japanese garden:: ancient stone lantern:: morning mist:: watercolor style. Нейросеть воспринимает каждый блок как отдельную «инструкцию» и пытается совместить их в одном кадре. Это совсем не то же самое, что написать все слова подряд через запятую — при мультипромтинге каждый элемент получает собственный «голос», и итоговая композиция выходит более сбалансированной.
Да и с промт-инжинирингом через ссылки на изображения дело обстоит интереснее, чем кажется на первый взгляд. Midjourney позволяет вставлять URL картинки прямо перед текстовым описанием. Нейросеть анализирует загруженное изображение и использует его как визуальную «затравку» — перенимает цветовую гамму, композицию, общее настроение. Параметр —iw (image weight) при этом регулирует, насколько сильно оригинал повлияет на результат: при значении 0.5 он лишь слегка направляет генерацию, а при 2.0 — практически диктует визуальный стиль.
Распространённые ошибки новичков
Перегрузка промта. Это, пожалуй, самая частая проблема. Новичок, окрылённый возможностями, пытается запихнуть в один запрос двадцать разных идей: и замок на горе, и дракона, и водопад, и портал в другое измерение, и закат, и северное сияние одновременно. В итоге нейросеть «теряется» — ни один элемент не прорабатывается как следует, а общая картинка выглядит хаотичной кашей. Золотое правило — не более трёх-четырёх основных объектов на один промт. Лучше меньше. Ведь минимализм в описании часто даёт более выразительный результат, чем скрупулёзное перечисление деталей.
Вторая типичная ошибка — игнорирование стилевых указаний. Многие пишут только «что» изобразить, но забывают уточнить «как». Без стилевого якоря (имя художника, название техники, указание на тип камеры) Midjourney выбирает стиль «по умолчанию» — и результат выходит довольно пресным, усреднённым. Это связано с тем, что нейросеть обучена на миллиардах изображений, и без конкретного направления она тяготеет к некой «средней температуре по больнице».
Третья ловушка — буквальный перевод с русского. Многие формулируют запрос, мысленно переводя фразу слово в слово. Но английский в контексте промтов работает иначе: короткие ёмкие существительные и прилагательные дают лучший результат, чем развёрнутые грамматически правильные предложения. Вместо «A beautiful woman who is standing in a field of flowers during the sunset» куда эффективнее написать «woman standing in flower field, sunset, golden light, ethereal mood». Нейросеть — не собеседник. Она парсит токены.
Готовые промты для разных задач
Для портретной фотографии с журнальным лоском отлично работает конструкция вроде «portrait of [описание персонажа], studio lighting, Profoto softbox, shot on Canon EOS R5 with 85mm f/1.2, shallow depth of field, Vogue magazine editorial, 8k —ar 2:3 —s 300». Результат — чистый добротный портрет с красивым размытием фона и профессиональной световой схемой. Изюминка здесь — упоминание конкретной марки осветительного оборудования (Profoto), которое дополнительно «калибрует» характер света.
Для архитектурной визуализации в духе современного минимализма подойдёт что-то вроде «minimalist concrete house on a cliff overlooking the ocean, floor-to-ceiling glass walls, interior visible, warm ambient lighting, late afternoon sun, architectural photography by Iwan Baan —ar 16:9 —s 200». А для фантастических пейзажей с налётом эпичности — «vast alien landscape with floating crystal formations, bioluminescent flora, two moons in the sky, atmospheric haze, matte painting style, Greg Rutkowski —ar 21:9 —chaos 30». В каждом из этих случаев промт содержит чёткий объект, стилевой маркер, указание на освещение и технические параметры. Ни слова лишнего.
Стоит ли гнаться за идеальным промтом с первого раза?
Нет. И это, пожалуй, самый честный совет, который можно дать. Даже опытные пользователи Midjourney редко получают идеальный результат с первой попытки. Весь процесс — это итерация: сгенерировал, оценил, подкрутил пару слов, запустил снова. Инструменты Vary (Strong) и Vary (Subtle) позволяют создавать вариации понравившегося изображения без полного перезапуска, а Upscale доводит выбранный вариант до максимального разрешения. Иногда достаточно убрать одно слово или заменить «dramatic» на «subtle» — и картинка преображается до неузнаваемости.
К тому же стоит завести собственную библиотеку удачных промтов. Это необязательно должна быть сложная база — хватит обычного текстового файла или заметки в телефоне. Каждый раз, когда нейросеть выдаёт что-то действительно впечатляющее, нужно сохранять полный текст запроса вместе с параметрами. Со временем из таких заготовок складывается личный «словарь стилей», который экономит десятки минут при каждой новой генерации.
Midjourney — инструмент, который щедро вознаграждает тех, кто готов экспериментировать и вникать в нюансы. Каждый новый промт — это маленький диалог с нейросетью, и чем точнее формулировка, тем ближе результат к задуманному образу. Не стоит бояться странных сочетаний, неожиданных стилевых миксов и «нелогичных» описаний — иногда именно из такого хаоса рождаются самые запоминающиеся изображения. Удачи в генерациях — и пусть каждый промт приближает к картинке мечты.

