Как создать идеальный portrait в Midjourney

Портрет в цифровом искусстве всегда стоял особняком. Ведь лицо — та самая территория, где любая фальшь бросается в глаза мгновенно, будь то неестественный изгиб губ, странный блик в зрачке или шестой палец на руке, прижатой к щеке. Нейросети за последние пару лет совершили грандиозный рывок, и Midjourney среди них солирует как самый «живописный» инструмент, тяготеющий к эстетике больше, чем к сухой фотореалистичности. Тысячи пользователей ежедневно генерируют портреты — и львиная доля результатов выглядит, мягко говоря, неоднозначно. То пластиковая кожа, то пустой взгляд без намёка на характер, то странный ореол вокруг волос, словно человек стоит перед плохо натянутым хромакеем. Но чтобы получить по-настоящему впечатляющий результат, нужно разобраться в нескольких нюансах, от которых зависит буквально всё — от текстуры кожи до эмоции в глазах.

Все топовые нейросети в одном месте

Почему Midjourney так хорошо «чувствует» лицо?

Дело в том, что модель обучалась на колоссальном массиве художественных работ, фотографий и иллюстраций. И портретная живопись там занимает внушительную долю. Отсюда — врождённая способность движка передавать светотень на скулах, глубину взгляда, фактуру кожи с порами и мелкими морщинками. Но есть ложка дёгтя. Нейросеть всё-таки «думает» паттернами, а не анатомией, поэтому без скрупулёзного промта рискуешь получить красивое, но абсолютно безликое лицо. Такое кукольное совершенство, которое ни одному живому человеку не принадлежит. А ведь именно несовершенства делают портрет живым — асимметрия бровей, едва заметный шрам, россыпь веснушек на переносице.

Версии Midjourney менялись стремительно. Ещё в V4 портреты выглядели довольно «замыленными», с характерным цифровым блеском, словно кожу натёрли маслом. К слову, пятая версия стала настоящим прорывом — детализация подскочила, глаза наконец-то обрели осмысленность, а руки (вечная ахиллесова пята нейросетей) стали хотя бы отдалённо напоминать человеческие. Шестая версия добавила ещё больше контроля. Но главное, что стоит понять: движок сам по себе не нарисует шедевр. Он — инструмент. Добротный мощный инструмент, который без толкового оператора выдаёт лишь усреднённую красивость.

Структура промта: с чего начать?

Каркас. Вот с чего начинается любой качественный портрет в Midjourney. И каркас этот — промт, составленный не наобум, а по определённой логике. Первым делом стоит задать тип изображения: portrait photo, headshot, close-up portrait или bust shot — в зависимости от того, нужен крупный план лица или захват по грудь. Это сразу направляет нейросеть в нужное русло, отсекая варианты с полноростовыми фигурами или странными кадрированиями.

Все лучшие нейросети мира теперь в твоём кармане! ⚡

Тексты, топовое видео, картинки и аудио. Самые мощные версии GPT, Claude, Midjourney, Sora, Kling и еще 90+ ИИ-моделей собраны в одном месте. Работает невероятно быстро: через удобный сайт или прямо в Telegram. Больше никаких блокировок, VPN, иностранных карт и переплат.

Жми на ссылку ниже и забирай свои бесплатные генерации для тест-драйва платформы 👉 https://clck.ru/3RNCRL

Следующий важный элемент — описание самого персонажа. И здесь кроется подводный камень, о который спотыкается большинство новичков. Многие пишут что-то вроде «beautiful woman, blue eyes, long hair» и ждут чуда. На самом деле Midjourney гораздо лучше реагирует на конкретные, осязаемые описания. Вместо «красивая женщина» нет смысла писать абстракцию — куда эффективнее сработает «woman in her early 30s with sun-kissed skin, faint freckles across the nose, deep-set hazel eyes, slightly asymmetrical smile». Это не просто набор слов. Это — характер. А характер нейросеть чувствует и передаёт гораздо охотнее, чем шаблонную красоту.

Освещение — главный скульптор лица

Без правильного света даже самый детализированный портрет выглядит плоско. Ведь свет — это не просто техническая характеристика, а полноценный инструмент передачи настроения, глубины и объёма. В Midjourney существует целый кладезь терминов, связанных с освещением, и каждый из них кардинально меняет итоговую картинку.

Один из самых популярных приёмов — Rembrandt lighting. Тот самый характерный треугольник света на затенённой щеке, который голландский мастер использовал ещё в XVII веке. Нейросеть воспроизводит его довольно точно, создавая драматичный объёмный портрет с глубокими тенями. Далее стоит упомянуть golden hour lighting — мягкий тёплый свет, заливающий лицо медовым сиянием, словно съёмка проходит за час до заката. Выглядит впечатляюще, тем более что такой свет скрадывает мелкие несовершенства кожи и добавляет романтичный антураж. Отдельно стоит выделить rim light (контровой свет), который очерчивает силуэт тонкой светящейся линией — приём любимый киношниками и идеально работающий для портретов с тёмным фоном. Ну и, конечно же, studio lighting для тех, кому нужен чистый коммерческий результат без лишних изысков.

Стоит ли указывать камеру и объектив?

Однозначно. И вот почему. Midjourney обучена на миллионах фотографий с метаданными, в которых прописаны модель камеры, фокусное расстояние и диафрагма. Когда в промте появляется «shot on Canon EOS R5, 85mm f/1.4», нейросеть мгновенно «вспоминает» характерную картинку — мягкое размытие фона (боке), пластичная передача кожи, естественная глубина резкости. Фокусное расстояние 85 миллиметров — золотой стандарт портретной фотографии, и нейросеть это прекрасно «знает». А если указать 35mm, пропорции лица слегка исказятся, появится эффект «рыбьего глаза» — иногда это даже интересно, но для классического портрета не годится.

Кстати, нет смысла ограничиваться только фотографическим стилем. Midjourney прекрасно имитирует живопись маслом, акварель, уголь, пастель. Для этого достаточно добавить в промт что-то вроде «oil painting style, visible brushstrokes, canvas texture» — и портрет моментально приобретает совершенно иную фактуру, словно его писали вручную. Впрочем, нужно отметить, что при таком подходе детализация лица может слегка пострадать, ведь нейросеть начинает «думать» текстурами мазков, а не порами кожи.

Магия негативных промтов

Без этого — никуда. Негативный промт (параметр —no в Midjourney) — своеобразный спасательный круг для тех, кто устал от типичных артефактов. Нейросеть при генерации портретов часто «грешит» несколькими вещами: размытые или дублированные зубы, неестественно гладкая кожа, аляповатый макияж, странные украшения, которые никто не заказывал. Добавление —no blurry, deformed, extra fingers, plastic skin, overexposed ощутимо повышает процент удачных генераций. Это не панацея, но разница между промтом с негативными указаниями и без них — колоссальная.

Тем более что Midjourney порой слишком увлекается «украшательством». Стоит написать «woman portrait», и нейросеть с энтузиазмом навесит серёжки, ожерелье, диадему и ещё какой-нибудь вычурный головной убор. Если хочется чистого, лаконичного портрета — без всей этой наляпистости — нет смысла стесняться писать длинный негативный промт. Да и само качество генерации от этого только выиграет.

Параметры, которые меняют всё

Сухие цифры и буквы, которые добавляются в конце промта, творят чудеса. Во-первых, —ar (aspect ratio) — соотношение сторон. Для классического портрета идеально работает 2:3 или 3:4. Вертикальная ориентация подчёркивает вытянутость фигуры и делает композицию более «журнальной». Во-вторых, —stylize (или —s) — параметр, управляющий степенью художественной интерпретации. Низкие значения (около 50–100) дают более «фотографичный», сдержанный результат. Высокие (750–1000) — превращают портрет в нечто более артистичное, порой даже сюрреалистичное. Ну и, наконец, —chaos — степень разнообразия между четырьмя вариантами в сетке. При нулевом значении все четыре картинки будут почти одинаковыми, а при максимальном — совершенно разными.

Отдельно стоит упомянуть —v 6.1 (или актуальную версию модели). Каждая новая итерация движка заметно улучшает анатомию и детализацию. Не стоит экспериментировать с устаревшими версиями, если цель — реалистичный портрет. Разве что для стилизации под ранний цифровой арт, но это уже совсем другая история.

Как добиться эмоции, а не «маски»?

Задача не из лёгких. Многие пользователи жалуются, что портреты в Midjourney выглядят эмоционально пустыми — красивые, но мёртвые лица, как на обложке стокового каталога. Дело в том, что слово «smiling» нейросеть трактует как стандартную «фотогеничную» улыбку — натянутую, ровную, без огонька. А живая эмоция — она ведь всегда чуть «кривая», чуть избыточная или, наоборот, еле уловимая.

Секрет — в конкретике. Вместо «happy expression» куда лучше сработает «caught mid-laugh, eyes squinting, slight crow’s feet». Вместо «sad» — «looking down with glistening eyes, barely holding back tears, slight redness on the nose tip». Нейросеть реагирует на физические описания эмоции, а не на абстрактные ярлыки. Это же правило касается и взгляда — «looking directly at camera with quiet confidence» даст совершенно иной результат, чем просто «looking at camera». Кроме того, контекст вокруг персонажа тоже влияет на выражение лица: промт с дождём за окном и тёплой кружкой в руках автоматически «настраивает» модель на задумчивую меланхолию. И это довольно логично — нейросеть считывает настроение сцены целиком.

Референсы и —sref: тайное оружие

Midjourney умеет «подсматривать». Параметр —sref (style reference) позволяет скормить нейросети изображение, стилистику которого она попытается повторить. Для портретов это настоящая находка. Нашёл потрясающую фотографию с мягким контровым светом и зернистой плёночной текстурой — загрузил как референс, и Midjourney начнёт тяготеть к похожему визуальному языку. Безусловно, один в один она не скопирует. Но общее настроение, цветовую палитру и характер светотени передаст вполне убедительно.

А вот с —cref (character reference) дело обстоит ещё интереснее. Этот параметр фиксирует внешность конкретного персонажа — черты лица, причёску, общие пропорции — и позволяет генерировать того же «человека» в разных позах и ситуациях. Для тех, кто создаёт серии портретов или персонажей для визуальных новелл, это грандиозный инструмент. Впрочем, идеальной консистентности ждать не стоит: нейросеть периодически «забывает» мелкие детали вроде формы ушей или точного оттенка глаз. Но общее сходство сохраняется на довольно достойном уровне.

Этническое разнообразие и возраст

Midjourney по умолчанию тяготеет к определённому «среднеевропейскому» типажу — светлая кожа, правильные черты, возраст 25–30 лет. И если не указать иное, львиная доля портретов будет выглядеть как каталог модельного агентства. Скучно. Однообразно. Стоит задуматься о том, что самые выразительные портреты в истории фотографии — это как раз лица с характером: морщинистый рыбак с Сицилии, смеющаяся старушка из Раджастхана, подросток с дредами на улицах Кингстона.

Указание этнической принадлежности, возраста и даже профессии кардинально меняет результат. «Elderly Japanese fisherman, weathered skin, deep wrinkles, kind eyes, 70 years old» — и перед глазами возникает портрет, от которого невозможно оторваться. Тем более что Midjourney великолепно передаёт текстуру возрастной кожи — все эти складочки, пигментные пятнышки, седые волоски в бровях. Это куда интереснее очередного «гладкого» лица без единой поры.

Фон и композиция: не только лицо

Многие забывают, что портрет — это не только лицо. Фон способен как вытянуть снимок, так и безнадёжно его «убить». Размытый фон (bokeh background) — классика, которая работает почти всегда. Но иногда хочется чего-то более осмысленного. Вот тут и начинается самое интересное.

Контекстный фон — когда окружение рассказывает историю о персонаже — делает портрет в разы глубже. Художник на фоне захламлённой мастерской с тюбиками краски и незаконченными холстами. Пожилой учёный в кабинете, заваленном пожелтевшими книгами. Девочка у запотевшего окна с каплями дождя. Каждая такая деталь добавляет слой повествования, и зритель невольно начинает «читать» портрет, а не просто смотреть на него. К тому же, описание фона помогает нейросети точнее определить освещение сцены — тёплый свет настольной лампы, холодный свет из окна, мерцание свечей — всё это она считывает из контекста и вносит в общую палитру.

Типичные ошибки и как их избежать

Первая и самая распространённая — перегруженный промт. Новички часто пытаются впихнуть в одну строку буквально всё: тип освещения, три вида одежды, конкретную позу, описание макияжа, название камеры, стилистику, настроение и ещё пару прилагательных «на всякий случай». В итоге нейросеть путается и выдаёт нечто среднее арифметическое между всеми запросами — невнятное, перенасыщенное месиво. Не стоит перегружать промт больше, чем 60–75 словами. Лаконичность здесь — не враг, а союзник.

Вторая ошибка — игнорирование функции vary (subtle) и vary (strong). Когда из четырёх вариантов один приближается к задуманному, но ещё не дотягивает — вместо того чтобы генерировать заново с нуля, куда разумнее «допилить» удачный вариант через вариации. Subtle сохранит общую композицию и внесёт мелкие изменения, strong — перетасует более серьёзно. Этим же приёмом пользуются опытные пользователи, чтобы постепенно «выруливать» к идеальному результату. Путь небыстрый, но кропотливый.

Ну, а третья ловушка — слепое копирование чужих промтов из интернета. Да, на Reddit и в Discord-каналах Midjourney щедро делятся «рецептами» удачных генераций. Но каждый промт работает в контексте конкретной версии модели, конкретных настроек и даже конкретного «сида» (случайного числа). Скопированный один в один чужой промт может дать совершенно иной результат. Гораздо полезнее понять логику построения — и собирать свои промты, отталкиваясь от принципов, а не от готовых формул.

Пример рабочего промта

Чтобы не оставаться голословным, стоит разобрать конкретный пример. Допустим, нужен портрет мужчины средних лет с характером — не модель, а «живой» человек. Промт может выглядеть так: «Close-up portrait of a 45-year-old man with salt-and-pepper stubble, deep-set brown eyes, slightly crooked nose, weathered skin with visible pores, wearing a dark wool coat, Rembrandt lighting, shallow depth of field, shot on Nikon Z9 85mm f/1.2, muted earthy tones, editorial photography —ar 2:3 —s 200 —no smooth skin, plastic, airbrushed, jewelry». Каждый элемент здесь несёт смысловую нагрузку — от типа съёмки до негативного промта, убирающего «пластиковость». И результат, как правило, впечатляет.

Все топовые нейросети в одном месте

Разумеется, с первого раза «десятка из десяти» не выпадет. Нужно будет прогнать генерацию два-три-пять раз, поиграть с вариациями, возможно, чуть скорректировать формулировку. Но каждая такая итерация — это опыт. Глаз «настраивается», понимание логики нейросети крепнет, и скорость достижения нужного результата с каждым разом растёт.

Постобработка: стоит ли «доводить» результат?

Коротко — да. Midjourney генерирует изображение с разрешением 1024×1024 пикселей (или соответственно при другом соотношении сторон), и для публикации в соцсетях этого обычно хватает. Но если портрет нужен для печати или для более серьёзного применения, без апскейла не обойтись. Встроенный upscale в Midjourney увеличивает разрешение вдвое, а сторонние инструменты (вроде Topaz Gigapixel или Magnific AI) могут «разогнать» картинку до внушительных размеров, сохраняя детализацию пор и волосков.

К тому же, даже отличная генерация иногда нуждается в лёгкой цветокоррекции. Midjourney порой слегка перенасыщает тёплые тона или «задирает» контраст. Быстрая правка в Lightroom или даже в бесплатном Snapseed — и портрет приобретает тот самый изысканный «плёночный» оттенок, который отличает профессиональную работу от случайной генерации. Не стоит пренебрегать этим финальным штрихом — именно он превращает хорошую картинку в портрет, который приковывает внимание.

Портрет в Midjourney — это всегда диалог между человеком и алгоритмом. Нейросеть подбрасывает варианты, а окончательное решение остаётся за автором — за его вкусом, чутьём и готовностью экспериментировать. Каждый новый промт — маленький шаг к пониманию того, как машина «видит» лицо. И чем глубже это понимание, тем ближе результат к тому самому идеальному портрету, который запомнится надолго. Удачи в экспериментах — и пусть каждая генерация приближает к шедевру.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *