Как создавать realistic фото в Midjourney: секреты промптов

В сети сейчас полно картинок, сгенерированных нейросетями, и львиная доля из них выглядит именно так — как картинки. Глянцевые лица без единой поры, неестественно ровный свет, пластиковая кожа, словно с обложки каталога косметической клиники. Человеческий глаз моментально считывает подвох, даже если зритель не может объяснить, что именно не так. Ведь мозг за тысячи лет научился распознавать лица и текстуры с потрясающей точностью — и обмануть его «красивой» генерацией довольно сложно. Но Midjourney, особенно начиная с пятой версии, умеет выдавать кадры, которые от настоящих фотографий отличит разве что эксперт. А чтобы добиться такого результата, нужно разобраться в анатомии правильного промпта.

Все топовые нейросети в одном месте

Почему Midjourney тяготеет к «нарисованности»?

Дело в том, что нейросеть по умолчанию стремится к визуальному совершенству. Каждое сгенерированное изображение она старается сделать максимально эстетичным — с точки зрения алгоритма, разумеется. А алгоритм «красоту» понимает довольно буквально: симметрия, насыщенность, контраст, отсутствие шума. На самом деле настоящая фотография устроена совсем иначе. В ней присутствуют хроматические аберрации, лёгкая расфокусировка на заднем плане, зерно матрицы, микроразмытие от дыхания фотографа. Все эти «дефекты» наш мозг воспринимает как маркеры реальности. И вот тут всплывает главный нюанс: чтобы получить реалистичный снимок, приходится сознательно просить нейросеть сделать картинку «хуже» — грязнее, шумнее, несовершеннее.

Фундамент промпта — тип камеры и объектив

С чего начинается скрупулёзная работа над реалистичным кадром? С указания конкретной камеры. Не абстрактного «photo», а модели аппарата с конкретным объективом. Midjourney обучена на миллионах фотографий с EXIF-метаданными, и когда в промпте мелькает, скажем, «Canon EOS R5» или «Nikon D850», нейросеть вытягивает из памяти характерную цветопередачу, глубину резкости, особенности боке. Это тонкий, но невероятно мощный приём.

Один из самых популярных вариантов — связка «shot on Sony A7III with 85mm f/1.4 lens». Такой промпт моментально задаёт нейросети рамки: малая глубина резкости, мягкое кремовое размытие фона, характерная для Sony цветовая палитра с холодноватыми тенями. А вот если нужен жёсткий репортажный стиль, стоит обратиться к «Leica M10» или даже «Fujifilm X-T4 with 23mm f/1.4». Каждая камера привносит свой узнаваемый почерк. Кстати, не менее важно фокусное расстояние. Портрет на 85 мм и портрет на 35 мм — это два совершенно разных настроения. Широкоугольник (вроде 24 мм) добавит перспективных искажений, а длиннофокусный объектив сожмёт планы и создаст ту самую «фотографическую» компрессию, которая сразу бросается в глаза.

Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸

Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.

Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL

Свет решает всё

Без грамотного описания света реалистичный кадр не получится. Точка. Midjourney по умолчанию заливает сцену ровным приятным светом — а ведь именно это и выдаёт генерацию. В реальности свет всегда имеет направление, температуру, жёсткость. И всё это стоит прописывать явно.

К слову, один из самых действенных приёмов — «golden hour lighting» в сочетании с «natural light coming from the left». Такая связка заставляет нейросеть выстроить тёплые тени, мягкие переходы, лёгкий контровой свет. Для студийных портретов хорошо работает «Rembrandt lighting» — классическая схема с характерным треугольником света на щеке. А если нужен документальный эффект, то «overcast day, flat diffused light» творит чудеса: картинка сразу лишается гламурного лоска и начинает выглядеть как кадр из жизни. Нужно отметить, что слова «cinematic lighting» тоже дают неплохой результат, но довольно предсказуемый — нейросеть начинает штамповать кадры в стиле голливудских постеров, а это не всегда то, чего хочется.

Что добавить в промпт для «эффекта реальной плёнки»?

Настоящий кладезь реализма — это описание физических артефактов фотографии. Тех самых несовершенств, о которых шла речь выше. Во-первых, стоит упомянуть зернистость: «slight film grain» или «ISO 800 noise». Во-вторых, хроматические аберрации на краях кадра — «slight chromatic aberration» — добавляют ту едва заметную цветную каёмку, которую человеческий глаз воспринимает как безусловный признак оптики. Ну и, наконец, «lens flare» или «subtle light leak» привносят в кадр атмосферу старой добротной аналоговой съёмки.

Отдельно стоит упомянуть текстуру кожи. Это, пожалуй, самый щепетильный момент. Midjourney обожает «вылизывать» лица до состояния фарфоровой куклы. Чтобы этого избежать, в промпт имеет смысл добавить «natural skin texture with visible pores» или даже «imperfect skin, freckles, fine lines». Звучит грубовато, но результат впечатляет — лицо сразу обретает ту живую фактуру, которой так не хватает сгенерированным портретам. Да и сами зрители больше доверяют изображению, где у человека есть хотя бы пара морщинок.

Параметры Midjourney: тонкая настройка

Помимо самого текста промпта, Midjourney предлагает набор параметров, которые серьёзно влияют на конечный результат. Первый и самый важный — —style raw. Эта опция снижает «художественную» обработку нейросети и выдаёт более грубый, натуральный кадр. Без неё Midjourney добавляет свою фирменную «красивость», которая сразу же разрушает иллюзию реальности.

Следующий важный критерий — параметр —s (stylization). Для реалистичных фото значение не стоит выставлять выше 50–100. При стандартных настройках (около 100) нейросеть уже начинает подмешивать художественные интерпретации. А вот при —s 20 или —s 30 результат получается более «сырой» — как будто снимок только что вытащили из RAW-конвертера без особой цветокоррекции. К тому же не стоит забывать про —ar (соотношение сторон). Стандартный квадрат 1:1 — это формат Instagram, но он редко ассоциируется с «настоящей» фотографией. Для реализма лучше задавать —ar 3:2 (классический кадр 35-мм плёнки) или —ar 16:9 для кинематографического эффекта.

Структура промпта: от общего к деталям

Многие новички совершают одну и ту же ошибку — перегружают промпт десятками слов, но в хаотичном порядке. Midjourney читает текст слева направо, и слова, стоящие в начале, получают больший «вес». Отсюда вытекает простой, но неоднозначный принцип: самое главное — вперёд.

Начинать стоит с типа изображения. Слова вроде «editorial photograph», «candid street photo», «photojournalistic shot» или «raw documentary photograph» — это фундамент. Именно они задают тональность всей генерации. Далее следует описание субъекта — кто или что в кадре. Здесь важна конкретика: не «красивая женщина», а «35-year-old woman with auburn hair, slight sunburn, wearing a linen shirt». Чем больше точных деталей, тем меньше у нейросети простора для своих «украшательств». После субъекта идёт описание действия или позы, затем — окружение и фон, потом — свет, и в самом конце — технические детали (камера, объектив, плёнка). Впрочем, жёсткой догмы тут нет — это скорее ориентир, чем постулат.

Стоит ли использовать негативные промпты?

Безусловно. И вот почему. Midjourney, как уже говорилось, тяготеет к идеализации. Параметр —no помогает отсечь нежелательные элементы. Самая распространённая связка для реалистичных фото — —no illustration, painting, cartoon, 3d render, drawing, anime, oversaturated, airbrushed skin. Каждое из этих слов отталкивает нейросеть от цифровой «наляпистости» и приближает к натуральному фотографическому стилю.

Однако тут есть подводные камни. Если перегрузить негативный промпт, результат может стать непредсказуемым. Нейросеть начинает «путаться», пытаясь угодить и позитивным, и негативным инструкциям одновременно. Оптимальное количество — от трёх до семи слов в —no. Ну, а если результат всё равно получается слишком «цифровым», стоит пойти от обратного и усилить позитивную часть промпта, добавив «raw, unedited, straight from camera».

Плёночная фотография как спасательный круг

Отдельная тема — эмуляция аналоговой плёнки. Это, пожалуй, самый мощный инструмент для тех, кто хочет добиться максимального реализма. Дело в том, что нейросеть «знает» визуальные характеристики конкретных плёнок — от Kodak Portra 400 до Fujifilm Superia. И если указать в промпте «shot on Kodak Portra 400 film», картинка моментально приобретает мягкие пастельные тона, характерное зерно, слегка выбеленные тени.

Для репортажной и уличной фотографии великолепно работает «Tri-X 400 black and white film» — грубое контрастное зерно, глубокий чёрный, эстетика Magnum Photos. А вот Fuji Velvia 50 выдаёт насыщенные, почти ядовитые цвета — это идеальный вариант для пейзажей. К слову, необязательно ограничиваться реально существующими плёнками. Midjourney неплохо реагирует и на описательные конструкции вроде «vintage 1970s Polaroid aesthetic, faded colors, soft focus, light leaks». Тем более что именно такой стиль — с его неидеальностью и ностальгическим налётом — сейчас на пике моды в визуальном контенте.

Как добиться реализма в портретах?

Портреты — самая сложная территория. Здесь любой промах виден мгновенно. Человеческое лицо — это то, что наш мозг анализирует тщательнее всего. Малейшая асимметрия зрачков, неестественный блеск глаз, слишком ровные зубы — и иллюзия рушится.

Один из рабочих приёмов — делать акцент не на красоте, а на характере. «Tired middle-aged man with stubble, deep-set eyes, weathered face» даст гораздо более убедительный результат, чем «handsome man, perfect features». Нельзя не упомянуть и про глаза — главную головную боль всех генеративных моделей. Стоит добавить «realistic eye reflections, natural catchlights» — и нейросеть начинает прорисовывать те микроскопические блики, которые отражаются от радужки в реальном мире. А ещё один нюанс: фон. Не стоит оставлять его на откуп нейросети. Конкретная локация — «in a dimly lit bar, bokeh background of neon signs» — привязывает портрет к реальному месту, и это усиливает доверие зрителя в разы.

Уличная и репортажная съёмка

Вот где Midjourney v6 по-настоящему раскрывается. Уличная фотография изначально предполагает несовершенство: случайные прохожие в кадре, смазанное движение, неидеальный свет, зернистая ночная съёмка. Всё это нейросеть воспроизводит с удивительной точностью — если, конечно, попросить правильно.

Промпт вроде «candid street photograph, Tokyo at night, rain-soaked pavement reflecting neon, a lone salaryman with umbrella, shot from across the street, Leica Q2, available light only, slight motion blur» — это практически готовый кадр для фотоконкурса. Ведь в нём собрано всё: конкретная локация, атмосферное состояние (дождь), живой субъект с историей, точка съёмки, камера, условия освещения и даже «дефект» в виде размытия от движения. Каждая деталь здесь отдаляет картинку от «сгенерированного» вида и приближает к «подсмотренному моменту жизни». И это, пожалуй, главный секрет — реалистичная фотография всегда рассказывает историю, а не просто демонстрирует объект.

Распространённые ошибки

Ложка дёгтя. Не всё так гладко, как хотелось бы. Одна из самых частых ошибок — слово «realistic» в промпте. Звучит парадоксально, но оно зачастую ухудшает результат. Дело в том, что Midjourney интерпретирует «realistic» довольно размыто, подмешивая туда и 3D-рендер, и гиперреалистичную живопись. Гораздо эффективнее работают конкретные фотографические термины: «editorial», «photojournalistic», «raw photograph», «DSLR shot».

Ещё одна типичная махинация новичков — перегрузка промпта прилагательными. «Beautiful, stunning, amazing, breathtaking, gorgeous» — все эти слова не добавляют реализма, а скорее уводят генерацию в сторону «идеального» цифрового арта. Конкретные существительные и глаголы работают куда лучше, чем восторженные эпитеты. К тому же многие забывают про композицию. Фразы «rule of thirds», «off-center composition», «shot from below» или «over-the-shoulder perspective» привносят в кадр то визуальное напряжение, которое свойственно работам реальных фотографов, а не отцентрированным «аватаркам».

Пример добротного промпта целиком

Чтобы всё вышесказанное не осталось теорией, стоит разобрать конкретный пример. Вот промпт, который выдаёт практически неотличимый от реальности результат:

Все топовые нейросети в одном месте

Raw candid photograph of a 40-year-old fisherman mending nets on a weathered wooden dock, early morning, fog rolling in from the sea, natural skin texture with visible wrinkles and sunspots, wearing a faded yellow rain jacket, shot on Nikon D850 with 50mm f/1.8 lens, shallow depth of field, soft diffused light, muted color palette, slight film grain, editorial style —ar 3:2 —style raw —s 30 —no illustration, painting, 3d render, airbrushed

Что здесь работает? Во-первых, «raw candid photograph» — моментальная установка на документальность. Далее — возраст и конкретное занятие персонажа (не «мужчина у воды», а «рыбак, чинящий сети»). Туман, утренний свет, выцветшая куртка — всё это мелкие детали, за которые цепляется нейросеть. Камера и объектив задают техническую рамку. А параметры —style raw и —s 30 убирают излишнюю стилизацию. Вся суть в том, что каждый элемент промпта выполняет конкретную функцию — ни одного «красивого» слова ради красоты.

Версия модели: v5 против v6

Нельзя обойти стороной и разницу между версиями. В Midjourney v5 реализм уже был впечатляющим, но именно шестая версия совершила качественный скачок. Текстуры стали детальнее, руки — анатомически корректнее (хотя и не всегда), а отклик на фотографическую лексику — точнее. К тому же v6 лучше понимает длинные развёрнутые промпты и не «теряет» детали где-то в середине описания.

Но есть и обратная сторона медали. Шестая версия порой слишком «угодлива» — она интерпретирует промпт буквальнее, чем v5, и если описание составлено неаккуратно, результат выходит перегруженным. Буквально десятилетие назад нейросети едва справлялись с генерацией котят, а сейчас выдают портреты, которые не отличишь от студийной съёмки. И всё-таки ключ к успеху — не технология, а умение с ней разговаривать на правильном языке.

Фотореализм в Midjourney — это не магия и не случайность. Это скрупулёзная работа с деталями, понимание физики реальной съёмки и готовность отказаться от «красивости» ради правды. Каждый удачный промпт — маленькое исследование, где сплетаются знание оптики, опыт фотографии и чувство момента. Стоит потратить вечер на эксперименты, и результат порадует даже скептиков. Удачи в генерации — пусть ваши кадры обманывают не только алгоритмы, но и самих фотографов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *