Промт для реалистичной фотографии (с примерами готовых промтов)

Не кажется ли вам странным, что в погоне за идеальной картинкой нейросети часто выдают нечто совершенно безжизненное? В сети представлено множество руководств, обещающих шедевры в один клик, но на деле пользователь получает пластиковую кожу, неестественный блеск в глазах и пальцы, количество которых противоречит анатомии. Глянцевая безупречность, которой грешат базовые настройки генераторов вроде Midjourney или Stable Diffusion, вызывает у зрителя эффект «зловещей долины», а не восхищение. Обыватель смотрит на экран и сразу понимает: здесь поработал алгоритм, а не фотохудожник. Мечта о создании кадров, неотличимых от снимков на плёнку, разбивается о «пластмассовую» реальность машинного кода. Но чтобы не ошибиться и получить действительно живой результат, нужно кардинально пересмотреть подход к формированию запроса.

Почему получается пластик?

Главная проблема кроется в самой природе обучения нейросетей. Алгоритм, просмотрев миллиарды изображений, стремится к усреднению. Он убирает шумы, сглаживает неровности и выдаёт «среднестатистическую» красоту, которая в реальности не существует. Ведь живой человек имеет поры, микроморщины, пушок на коже и лёгкую асимметрию лица. ИИ же пытается это исправить, считая дефектом. Натыкаешься на такие генерации довольно часто: свет выстроен идеально, композиция выверена, но души в этом нет. А нам нужна именно она. Имперфектность. Задача промт-инженера — заставить машину «испортить» идеальную картинку, добавив в нее хаос реальности. Сложно ли это? Довольно сложно, если не знать правильных слов-триггеров.

Техническая база

Начинать построение запроса стоит не с объекта, а с инструмента съёмки. Это база. Если вы не укажете камеру, нейросеть выберет свой любимый стиль — цифровой арт. Чтобы этого избежать, нужно четко прописать модель фотоаппарата и объектива. И тут есть свои нюансы. Упоминание плёночных камер творит чудеса. Например, «Shot on Canon AE-1» или «Leica M6» сразу задает определенную эстетику. К слову, львиная доля успеха зависит от плёнки. Добавьте в промт «Kodak Portra 400» или «Fujifilm Pro 400H», и вы увидите, как изменятся цвета. Они станут мягче, появится то самое зерно, за которым гоняются фотографы. А если ещё вспомнить про объективы, то результат станет ещё убедительнее. Для портретов идеально подходит фокусное расстояние 85mm, дающее красивое размытие фона (боке), а для уличной съёмки — 35mm.

Работа со светом

Свет — это то, что оживляет плоскую картинку. Просто написать «good lighting» недостаточно. Это слишком размытое понятие. Нейросеть поймет его по-своему и зальёт сцену студийным, скучным светом. Стоит использовать более конкретные термины. «Natural lighting» (естественное освещение) — хороший старт, но можно пойти дальше. Попробуйте «Cinematic lighting» для драматизма или «Golden hour» для тёплых, закатных тонов. Особый интерес вызывает «Volumetric lighting» — объёмный свет, когда в воздухе видна пыль или туман, через которые пробиваются лучи. Это сразу добавляет атмосферы. Ну и, конечно же, не стоит забывать про тени. Жёсткие тени («Hard shadows») делают кадр более реалистичным и осязаемым, в то время как мягкие часто уводят изображение в сторону 3D-рендера.

Детализация кожи и текстур

Именно на коже «палятся» большинство генераций. Чтобы избежать эффекта резиновой маски, нужно буквально заставлять ИИ прорисовывать текстуру. Слова-маркеры здесь играют решающую роль. Используйте связки вроде «highly detailed skin», «skin texture», «visible pores», «micro details». Но есть и подводные камни. Если переборщить, лицо может превратиться в карту кратеров. Здесь важен баланс. Интересный прием — добавить слово «imperfections» (несовершенства) или «freckles» (веснушки). Даже лёгкая небритость или выбившийся локон волос делают портрет в разы живее. К тому же, стоит упомянуть возраст. Удивительно, но нейросети лучше рисуют пожилых людей, так как морщины дают необходимую текстуру, за которую алгоритму проще «зацепиться».

Структура правильного запроса

Как же выглядит идеальная формула? Она не должна быть хаотичным набором тегов. Логика здесь простая, но строгая. Сначала идет описание объекта (кто и что делает). Затем — описание окружения (где это происходит). Далее следует блок технических параметров (камера, плёнка, объектив). Завершает конструкцию описание освещения и стиля. Инверсия блоков возможна, но такой порядок наиболее понятен для машины. А вот длинные описания одежды или эмоций лучше вписывать в самое начало, так как вес слов уменьшается ближе к концу промта.

Пример портретного фото

Рассмотрим конкретный сценарий. Допустим, нам нужен крупный план девушки с реалистичной кожей. Промт может выглядеть так:

Close-up portrait of a young woman looking at the camera, highly detailed skin texture, visible pores, freckles, messy hair, natural makeup. Shot on Sony A7R IV, 85mm lens, f/1.8, realistic photography, cinematic lighting, soft bokeh background, hyperrealistic, 8k

Обратите внимание на детали. Мы указали не просто «женщина», а добавили текстуру, поры и даже «небрежную причёску». Диафрагма f/1.8 задала малую глубину резкости, размыв фон. Это надёжно. Потому что проверено. Временем. Такой запрос практически гарантированно даст фотореалистичный результат, который не стыдно показать даже профессиональному фотографу.

Городской репортаж

А если мы хотим снять уличную сцену? Здесь важна динамика и случайность. Статичные позы убивают реализм. Попробуем такой вариант:

Candid shot of an old man reading a newspaper on a bench in rainy London, wet asphalt reflections, gloomy atmosphere, motion blur on passing cars. Shot on Leica Q2, 28mm lens, street photography style, high contrast, Kodak Tri-X 400 film grain, black and white

Тут «изюминка» кроется в слове «candid» (непостановочный, случайный). Оно даёт команду нейросети создать ощущение подсмотренного момента. Плюс чёрно-белая плёнка Kodak Tri-X добавляет исторического антуража и скрывает мелкие огрехи генерации цветов. Зрелище получается атмосферное.

Предметная съёмка и еда

Еда — ещё одна сложная тема. Часто бургеры или супы выглядят как пластиковые муляжи с витрины. Чтобы этого избежать, нужно добавить сенсорных ощущений. Пар, капли воды, крошки на столе. Пример запроса:

Delicious cheeseburger on a rustic wooden table, steam rising, melting cheese, crumbs, grease, professional food photography. Macro shot, 100mm lens, depth of field, studio lighting, softbox, sharp focus, 4k texture

Слова «grease» (жир) и «crumbs» (крошки) здесь ключевые. Они добавляют ту самую «грязь», которая делает еду настоящей. Идеальная булка без единой трещины выглядит подозрительно, а вот слегка помятая, с кунжутом, рассыпанным рядом, — вызывает аппетит.

Стиль «Полароид» и винтаж

Иногда для реализма нужно снизить качество. Парадокс? Вовсе нет. Современные камеры слишком резкие. А вот старые снимки с их засветами и нечёткостью воспринимаются мозгом как документальное доказательство реальности. Промт для такого стиля:

Flash photo of a group of friends at a house party in the 90s, vintage clothes, red eyes effect, film grain, noise, vignette, direct flash, Polaroid aesthetic, amateur photography style

Здесь мы намеренно просим «red eyes effect» (эффект красных глаз) и «direct flash» (прямая вспышка в лоб). Это те самые ошибки любителей, которые превращают картинку в настоящий слепок эпохи. Выглядит это добротно и ностальгично.

Отрицательные промты (Negative prompts)

Нельзя не упомянуть и о том, что мы хотим исключить. Многие генераторы позволяют вписывать «Negative prompt». Это своего рода фильтр. Сюда стоит вписать всё то, что выдаёт искусственность:

cartoon, 3d render, illustration, painting, drawing, plastic skin, smooth skin, doll, symmetrical, blurred, low quality, deformed hands, extra fingers

Впрочем, не стоит перегружать этот блок. Слишком большое количество запретов может сбить нейросеть с толку, и она выдаст просто серый шум. Действовать нужно аккуратно, отсекая только самое очевидное.

Типичные ошибки новичков

Самая распространенная ошибка — использование противоречивых стилей. Нельзя одновременно просить «Cyberpunk» и «19th century historical photo» (хотя, если это задумка, то можно, но реализма не ждите). Также часто новички злоупотребляют словами «best quality» или «masterpiece». Сами по себе эти слова мало что значат для алгоритма в контексте фотореализма. Они скорее сделают картинку более «художественной», похожей на артstation, чем на фотографию. Лучше заменить их на «raw photo» (сырое, необработанное фото). Этот тег даёт команду не применять встроенные фильтры «украшательства».

Роль случайности

Ещё один важный момент — параметр хаоса или стилизации (в Midjourney это –s или –c). Высокие значения стилизации часто уводят картинку в сторону живописи. Для фотореализма стоит держать эти параметры на средних или низких значениях. Ведь реальность редко бывает вычурной и перенасыщенной. Она обыденна. И в этой обыденности кроется её красота. Цвета в жизни редко бывают кислотными, а композиция не всегда подчиняется правилу золотого сечения. Позвольте нейросети совершать ошибки. Иногда случайно «заваленный» горизонт делает кадр более верным, чем выверенная по линейке геометрия.

Психология восприятия

Почему нам так важно получить реалистичный кадр? Дело в том, что мы привыкли доверять фотографии. Это документ. И когда мы видим фальшь, наш мозг посылает сигнал тревоги. Создавая промт, вы, по сути, играете с восприятием зрителя. Вы — режиссёр, оператор и осветитель в одном лице. И ваш главный инструмент — слово. Тщательный подбор эпитетов, знание технической части фотографии и понимание того, как работает свет, — вот три кита успешной генерации. Это серьёзное вложение времени, но оно окупается результатом.

Практика и эксперименты

Ни один готовый промт не является панацеей. Это лишь отправная точка. В зависимости от версии нейросети, одна и та же фраза может давать кардинально разные результаты. Поэтому не бойтесь менять переменные. Замените «Canon» на «Nikon», поменяйте «солнечный день» на «пасмурное утро», добавьте туман или дождь. Смотрите, как меняется картинка. Фотореализм — это постоянный поиск баланса между детализацией и естественностью. И помните, что самые удачные кадры часто рождаются из ошибок или неожиданных сочетаний слов.

В заключение хочется сказать, что магия промт-инжиниринга доступна каждому, кто готов проявить немного терпения и фантазии. Не останавливайтесь на первых полученных вариантах, даже если они кажутся неплохими. Шлифуйте запрос, добавляйте нюансы, играйте со светом и оптикой. Погружение в этот процесс затягивает, а результат, когда на экране появляется изображение, в реальность которого хочется верить, приносит настоящее удовлетворение. Пусть ваши генерации всегда будут живыми, а каждый новый промт становится открытием. Удачных экспериментов!