Как создать реалистичное фото в Midjourney: скрытые настройки и правильные промпты

Ещё пару лет назад сама идея о том, что нейросеть сможет выдать картинку, неотличимую от студийного снимка, казалась довольно смелой фантазией. Сегодня же ленты соцсетей пестрят «фотографиями», которые на деле никогда не видели объектива камеры, — и львиная доля из них сделана именно в Midjourney. Кто-то грезит портретами с журнальной обложки, кто-то хочет продуктовую съёмку без аренды студии, а кому-то нужны пейзажи из мест, где он никогда не бывал. Но вся суть в том, что между размытым «пластиковым» результатом и по-настоящему убедительным кадром лежит пропасть из нюансов — от скрытых параметров модели до правильной структуры текстового запроса. А начать стоит с понимания того, как именно Midjourney «думает» и на какие слова реагирует острее всего.

Все топовые нейросети в одном месте

Почему Midjourney выдаёт «пластик» вместо реализма?

Проблема знакома каждому, кто хоть раз вбивал в строку промпта что-то вроде «realistic photo of a woman». Результат — лицо без пор, кожа, будто покрытая слоем силикона, и глаза с неестественным блеском. Зрелище, прямо скажем, удручающее. Дело в том, что модель по умолчанию тяготеет к «идеализированной» эстетике, где каждый пиксель вылизан до стерильности. Это связано с тем, что обучающая выборка содержит огромное количество отретушированных стоковых снимков и цифровых иллюстраций. И нейросеть, не получив чёткой команды, воспроизводит именно этот усреднённый «глянцевый» стиль. Ведь для неё красиво — значит гладко. А для зрителя красиво — значит правдоподобно.

Второй подводный камень — сама архитектура промпта. Многие обыватели пишут короткие фразы из трёх-четырёх слов и надеются на чудо. Но Midjourney — не телепат. Без конкретных указаний на тип освещения, текстуру материалов, оптические характеристики объектива и даже марку камеры результат будет дрейфовать в сторону цифровой иллюстрации. К тому же каждая новая версия модели (от v5 до v6.1) по-разному интерпретирует одни и те же слова, так что промпт, который творил чудеса полгода назад, сейчас может выдать совершенно иной результат.

Скрытые параметры, о которых молчат туториалы

Начать нужно с параметра —style raw. Это, пожалуй, главный спасательный круг для тех, кто гонится за фотореализмом. По умолчанию Midjourney накладывает собственный «художественный» фильтр на любой запрос — добавляет насыщенность, контраст, иногда драматичное освещение. Параметр raw этот фильтр отключает. Картинка становится суше, спокойнее, ближе к тому, что выдала бы настоящая камера без постобработки. Не стоит забывать: именно этот режим позволяет текстурам кожи, ткани и металла выглядеть натурально, без «конфетной» перенасыщенности.

Все топовые нейросети в одной подписке! 🚀

Устали оплачивать десятки сервисов отдельно и постоянно включать VPN? Появилась платформа, которая объединяет более 90 передовых ИИ в одном окне. Пишите тексты с новейшими версиями GPT и Claude, создавайте шедевры в Midjourney и генерируйте видео в Sora и Kling. Тексты, изображения, видео и музыка — всё работает на любых устройствах без «танцев с бубном».

Попробуйте бесплатно прямо сейчас! Переходите по ссылке и получите бонусные токены для старта 👉 https://clck.ru/3RNCRL

Следующий важный критерий — параметр —s (stylize). Значение по умолчанию стоит на отметке 100, и многие даже не подозревают, что его можно снизить до нуля или поднять до тысячи. Для реалистичных фото оптимальный диапазон — от 15 до 50. При значениях ниже 15 картинка начинает «рассыпаться», терять детализацию. А выше 50 нейросеть снова тянет одеяло на себя и навязывает художественную стилизацию. Золотая середина — где-то около 25–35 для портретов и 40–50 для пейзажей. Впрочем, экспериментировать тут не только можно, но и нужно.

Отдельно стоит упомянуть параметр —chaos. Его диапазон — от 0 до 100, и на первый взгляд он не имеет отношения к реализму. Однако при значениях 5–15 хаос вносит ту самую лёгкую непредсказуемость, которая делает снимок живым. Идеальная симметрия и выверенная композиция — визитная карточка ИИ-генерации, а небольшой «хаос» добавляет случайных деталей: асимметричные тени, чуть сбитый горизонт, непропорционально длинная тень от столба на заднем плане. Мелочи, которые мозг зрителя считывает как маркеры настоящей фотографии.

Анатомия правильного промпта

Задача не из лёгких. Ведь промпт для фотореалистичного изображения строится совершенно иначе, чем для иллюстрации или арта. Здесь работает принцип скрупулёзного описания «от камеры к сцене». Первым делом стоит обозначить тип снимка: candid street photography, editorial portrait, product shot или documentary photography. Это сразу задаёт модели рамку, внутри которой она будет работать. Без такого «якоря» нейросеть не понимает, какой именно жанр реализма от неё ждут.

Далее следует блок оптики. И вот тут кроется настоящий кладезь возможностей. Midjourney прекрасно «знает» разницу между Canon EF 85mm f/1.4 и Sigma 35mm f/1.4 Art. Указание конкретного объектива меняет глубину резкости, характер боке и даже цветопередачу. К слову, упоминание марки камеры тоже работает: shot on Nikon D850 выдаст чуть более «тёплую» палитру, а shot on Sony A7R IV — холодноватый, детализированный снимок с характерной для Sony резкостью. Это не магия — нейросеть обучалась на миллионах подписанных EXIF-данными фотографий и выучила эти закономерности.

Нужно отметить, что описание света — отдельная история, которая сильнее всего влияет на результат. Фраза «natural light» даст мягкий рассеянный свет, но довольно скучный. А вот «golden hour side lighting, long shadows» — совсем другое дело: появляются тёплые тона, контрастные тени, объём. Для студийных портретов хорошо срабатывают конструкции вроде «Rembrandt lighting, single softbox camera left, dark background». И здесь же стоит задуматься о несовершенствах — добавление слов «lens flare», «slight motion blur» или «film grain» привносит те «дефекты», которые камера неизбежно создаёт в реальности.

Что насчёт текстур и деталей?

Обе стороны медали выглядят так: Midjourney умеет генерировать потрясающие текстуры, но делает это только по запросу. Без прямого указания кожа останется восковой, ткань — невесомой, а металл — однородно серым. Для портретов стоит добавлять фразы «skin pores visible», «fine facial hair», «subtle skin imperfections». Для предметной съёмки — «scratched surface», «fingerprints on glass», «dust particles in the air». Каждая такая деталь оседает в финальном изображении как свидетельство реальности. Да и зрителю цепляться взглядом за мелочи гораздо интереснее, чем за идеально чистую пустоту.

Отдельная тема — фон. Многие забывают о нём, сосредоточившись на главном объекте, а зря. В настоящей фотографии задний план живёт своей жизнью: размытые силуэты прохожих, витрины магазинов, граффити на стене, мокрый асфальт с отражениями. Фраза «busy urban background, out of focus» творит чудеса — Midjourney заполняет пространство за моделью десятками мелких деталей, которые при размытии создают тот самый «воздух» снимка. А вот «plain white background» для реализма — выбор неоднозначный: такой фон сразу напоминает о цифровых рендерах.

Стоит ли указывать негативные промпты?

Midjourney (в отличие от Stable Diffusion) не поддерживает классический негативный промпт в виде отдельного поля. Но выход есть — параметр —no. Он позволяет исключить конкретные элементы из генерации. Для фотореализма этот параметр — настоящее спасение. Конструкция —no illustration, painting, drawing, cartoon, 3d render, anime, cgi отсекает львиную долю «рисованных» интерпретаций. Кроме того, можно добавить —no watermark, text, logo, чтобы случайные надписи не всплывали на изображении. Не стоит перебарщивать: больше десяти слов в параметре —no начинают конфликтовать друг с другом, и результат становится непредсказуемым.

Кстати, довольно часто возникает вопрос: а нужно ли писать «photorealistic» в промпте? На самом деле — да, но с оговоркой. Само по себе это слово ещё ничего не гарантирует. Однако в связке с указанием камеры, объектива и типа съёмки оно работает как дополнительный «переключатель». Что-то вроде финального штриха. Но если кроме «photorealistic» в промпте ничего нет — нейросеть воспримет это слишком буквально и выдаст «гиперреализм», похожий на 3D-рендер. А это, согласитесь, совсем не то, чего хочется.

Версии модели и их особенности

Буквально год назад всё изменилось. Выход версии v6 стал переломным моментом для фотореалистичной генерации. Если v5.2 требовала длинных, скрупулёзно выстроенных промптов с десятками параметров, то шестая версия научилась «понимать» естественный язык значительно лучше. Однако на этом дело не закончилось — появилась v6.1, в которой текстуры стали ещё детальнее, а работа с руками (вечная боль нейросетей) заметно улучшилась. Стоит отметить, что каждая версия по-разному реагирует на один и тот же промпт, так что переход между ними — это всегда период адаптации и тестирования.

Нельзя не упомянуть и режим —v 6.1 —style raw в комбинации. Эта связка на сегодня — самый мощный добротный инструмент для фотореализма в Midjourney. Ну и, конечно же, не стоит забывать про —ar (aspect ratio). Для портретов работают соотношения 3:4 или 4:5 — именно такие пропорции используют в Instagram и на обложках журналов. Для пейзажей — 16:9 или даже 21:9, если нужен кинематографический широкоформатный эффект. А вот стандартный квадрат 1:1 для реалистичных фото подходит хуже всего: он сразу выдаёт «цифровое» происхождение картинки, потому что ни одна камера не снимает в таком формате по умолчанию.

Пример промпта от начала до конца

Разложить всё по полочкам проще на конкретном примере. Допустим, нужен портрет мужчины средних лет на улице города. Вместо банального «realistic photo of a man in the city» стоит выстроить запрос послойно. Первый слой — жанр и настроение: «candid street portrait of a 45-year-old man, pensive expression». Второй — оптика и камера: «shot on Fujifilm X-T5 with 56mm f/1.2 lens». Третий — свет и атмосфера: «overcast day, diffused natural light, wet cobblestone reflections». Четвёртый — текстуры и несовершенства: «visible skin texture, stubble, slight under-eye circles, wrinkled linen shirt». Ну, а финальный — технические параметры: «—ar 3:4 —v 6.1 —style raw —s 30 —no illustration, cartoon, 3d render».

Результат такого промпта разительно отличается от того, что выдаёт короткий запрос. Появляются поры на коже, лёгкая асимметрия лица, неидеальное освещение — всё то, за что взгляд цепляется и признаёт «настоящим». Тем более что Midjourney при детальном описании начинает прорабатывать даже такие мелочи, как отражение неба в зрачках или текстура волокон на рубашке. Но есть ложка дёгтя: слишком длинный промпт (больше 60–70 слов) нейросеть начинает «забывать», отбрасывая последние фразы. Поэтому баланс между детальностью и лаконичностью — это, по сути, главное ремесло промпт-инженера.

Как избежать типичных ошибок?

Первая и самая распространённая ошибка — погоня за красотой. Звучит парадоксально, но для реализма нет смысла писать «beautiful», «stunning» или «perfect». Эти слова толкают нейросеть в сторону идеализации, и кожа снова превращается в фарфор, а глаза — в стеклянные шары. Для живого снимка лучше работают нейтральные или даже «некомплиментарные» описания: «tired eyes», «asymmetric smile», «messy hair». Именно несовершенства приковывают внимание и создают ощущение подлинности.

Вторая проблема — игнорирование контекста среды. Человек не существует в вакууме, и настоящая фотография всегда фиксирует взаимодействие объекта с окружением. Тень на стене от жалюзи. Блик от витрины на щеке. Пар изо рта в морозный день. Эти «случайные» детали Midjourney умеет генерировать, но только если о них попросить. А если не попросить — получится фигура, аккуратно вырезанная из контекста и поставленная на абстрактный фон. К слову, даже указание времени суток («3 PM autumn light») сильно меняет результат, потому что нейросеть «знает», как выглядит свет в разное время года.

Ну, а третья ошибка — отказ от итераций. Midjourney редко выдаёт идеальный реалистичный результат с первой попытки. Обычно процесс выглядит так: первая генерация показывает общее направление, затем нужна вариация (V-кнопка) удачного варианта, потом — апскейл и, возможно, ещё одна доработка через —zoom или —pan. Многие бросают после первого результата. И зря. Ведь именно на третьей-четвёртой итерации всплывают те самые мелкие текстурные детали, которые превращают цифровую картинку в убедительную фотографию.

Работа с освещением: тонкости, которые меняют всё

Свет — душа снимка. Это знает любой фотограф, и для Midjourney этот постулат работает ровно так же. Один и тот же промпт при смене описания освещения выдаёт совершенно разные по настроению картинки. Мягкий рассеянный свет пасмурного дня — «overcast flat lighting» — убирает резкие тени и делает цвета приглушёнными. Результат напоминает скандинавскую фотошколу: минимализм, сдержанность, честность. А вот «harsh midday sun, deep shadows» — совсем другая история: контрастная картинка с выжженными светами и провалами в тенях, характерная для уличной съёмки в южных странах.

Все топовые нейросети в одном месте

Особый интерес вызывает искусственное освещение. Неоновый свет («neon signs reflecting on wet pavement, cyan and magenta tones») создаёт атмосферу ночного города по мотивам Блейдраннера. Свет от экрана смартфона на лице («face lit by phone screen in dark room») — популярный приём, который Midjourney воспроизводит с впечатляющей точностью. И всё-таки самый «фотографичный» результат дают смешанные источники: например, «warm tungsten indoor light mixing with cool blue window light». Такой контраст цветовых температур — то, что камера фиксирует повседневно, а нейросеть без подсказки генерировать не станет.

Пост-обработка: нужно ли дорабатывать результат?

Короткий ответ — да, почти всегда. Даже лучший результат из Midjourney нуждается в финальной доводке, если цель — полная неотличимость от реального снимка. Во-первых, стоит пропустить изображение через Lightroom или аналог и добавить лёгкую цветокоррекцию: чуть приглушить насыщенность зелёного (нейросети его перенасыщают), добавить зерно (grain) с размером 25–35 единиц и слегка затемнить углы виньеткой. Во-вторых, хроматические аберрации — те самые цветные каёмки на контрастных границах — можно добавить вручную в Photoshop. Да, это махинация наоборот: мы намеренно вносим «дефект», чтобы снимок стал реалистичнее.

Нельзя не упомянуть и апскейл. Встроенный апскейлер Midjourney работает довольно прилично, но для печати или крупного формата лучше использовать внешние инструменты вроде Topaz Gigapixel AI или Magnific. Они дорисовывают текстуры на микроуровне — волоски, поры, нитки ткани — и делают это аккуратнее, чем стандартный механизм. Кошелёк, конечно, станет легче (подписка на Topaz бьёт по бюджету), но результат того стоит. Тем более что после апскейла изображение выдерживает разрешение до 8000×8000 пикселей, чего с лихвой хватает даже для широкоформатной печати.

Midjourney — инструмент с грандиозным потенциалом, но без понимания его внутренней механики добиться фотореализма практически невозможно. Стоит запомнить три вещи: конкретика в промпте решает всё, параметры —style raw и —s — ваши верные союзники, а несовершенства делают картинку живой. Экспериментировать, пробовать новые связки слов и не бояться «грязных» деталей — вот рецепт, который со временем начнёт приносить результаты, неотличимые от настоящих фотографий. Удачи в этом увлекательном ремесле — каждый новый промпт приближает к мастерству.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *