Промт для фотореалистичного изображения (с примерами готовых промтов)

Создание цифрового двойника реальности всегда было своего рода Святым Граалем для художников, а с приходом нейросетей эта мечта, казалось бы, стала доступна каждому по щелчку мыши. Однако эйфория от первых попыток довольно часто сменяется разочарованием: вместо живого фото на экране появляется «пластиковая» кукла с бессмысленным взглядом или пейзаж, который больше напоминает скриншот из видеоигры десятилетней давности. Почему так происходит? Дело вовсе не в том, что алгоритм «глупый» или программа дала сбой. Проблема кроется в коммуникации. Мы пытаемся объяснить машине задачу человеческим языком, забывая, что она мыслит токенами, тегами и визуальными паттернами. И чтобы получить результат, от которого у зрителя перехватит дыхание, придётся освоить новый диалект — язык промт-инжиниринга. Но чтобы не ошибиться и не потратить часы на генерацию мусора, стоит разобраться в механике этого процесса досконально.

С чего начинается реализм?

Сложно ли обмануть человеческий глаз? Безусловно. Наш мозг эволюционировал миллионы лет, чтобы распознавать подвох, будь то неестественный оттенок кожи или странная физика света. Нейросеть же, в свою очередь, не знает, как выглядит мир «на самом деле». Она лишь видит миллиарды картинок, на которых обучалась. И вот тут кроется главный нюанс. Если вы просто попросите «красивую девушку», ИИ выдаст усреднённый, отшлифованный до блеска образ. Идеальный. И потому — мёртвый. Фотореализм рождается не в совершенстве, а в изъянах. В неровностях текстуры, в случайном блике, в лёгком расфокусе на заднем плане. Поэтому ваш запрос должен стать инструкцией не для художника, а для фотографа. Вы не рисуете, вы настраиваете камеру.

Техническая часть

Фотография — это прежде всего оптика. Игнорировать этот факт при написании промта не стоит. Если вы не укажете нейросети, на что «снимать», она выберет настройки по умолчанию, которые редко отличаются художественной ценностью. Первым делом стоит определиться с фокусным расстоянием. Для портретов золотым стандартом считается 85mm или 100mm. Эти значения позволяют избежать перспективных искажений, которые свойственны широкому углу. А вот если ваша цель — грандиозный пейзаж или тесный интерьер, тут уж пригодится 16mm или 24mm.

Но одной лишь цифрой дело не ограничивается. Львиная доля успеха зависит от указания конкретной модели камеры или плёнки. Упоминание «Shot on Sony A7R IV» или «Kodak Portra 400» творит чудеса. Это своего рода код, который подтягивает из базы данных нейросети определённую цветовую гамму, зернистость и детализацию. Например, плёнка Fujifilm добавит кадру мягкие, пастельные тона и приятный зелёный оттенок в тенях, а цифровая матрица Canon славится своей работой с телесными тонами (skintones). Не стоит забывать и про разрешение: теги «8k», «UHD», «sharp focus» работают как команда «собраться» для алгоритма, заставляя его прорисовывать мельчайшие детали.

Свет выстраивает композицию

Свет. Без него даже самая детальная текстура превратится в плоское пятно. Обыватель часто пишет просто «lighting», но для фотореализма этого категорически мало. Здесь нужно действовать тоньше. Освещение должно иметь характер. Мягкий, рассеянный свет (soft lighting) идеален для женских портретов, так как сглаживает неровности, но может убить объём. Жёсткий свет (hard lighting) создает драматичные тени, подчёркивая рельеф лица или ландшафта.

Один из самых мощных инструментов в арсенале промт-инженера — это «volumetric lighting» (объёмный свет). Представьте лучи солнца, пробивающиеся сквозь пыльный воздух в старом чердаке или туманный утренний лес. Именно этот тег добавляет воздуху плотность, делая атмосферу осязаемой. А если ещё вспомнить про «cinematic lighting» или «rim light» (контровой свет), который очерчивает силуэт тонкой светящейся линией, отрывая объект от фона, то изображение сразу приобретает глубину, достойную голливудского фильма. Ну и, конечно же, «global illumination» — термин из 3D-графики, который помогает правильно рассчитать отражения света от поверхностей, добавляя сцене правдоподобия.

Текстура и детализация

Именно на этом этапе чаще всего сыплются новички. Гладкая, словно отполированная кожа — главный враг реализма. Живой человек имеет поры, морщинки, пушок, родинки и веснушки. Поэтому не скупитесь на «неприятные» слова. В промт обязательно стоит включить «highly detailed skin», «skin texture», «pores», «imperfections». Звучит странно? Возможно. Но результат того стоит. Нейросеть перестанет «мылить» лицо и начнёт прорисовывать его как физический объект.

Это же правило касается и окружения. Стена не может быть просто серой — она должна быть «concrete texture» или «weathered wall». Одежда имеет плетение ткани («fabric texture», «detailed wool»). Глаз зрителя натыкается на эти микро-детали и верит увиденному. Кстати, отличным усилителем реализма служит тег «depth of field» (глубина резкости). Размытый фон (bokeh) не только акцентирует внимание на главном объекте, но и скрывает огрехи генерации на заднем плане, которые довольно часто всплывают при создании сложных сцен.

Готовые формулы: Портретная съёмка

Перейдём к практике. Допустим, нам нужен гиперреалистичный портрет пожилого мужчины, чьё лицо — это карта прожитых лет. Нам нужно передать мудрость, усталость и текстуру. Промт будет строиться по принципу наслоения смыслов. Сначала объект, потом детали, затем технические параметры.

Примерный сценарий выглядит так. Мы начинаем с описания героя:

hyper-realistic close-up portrait of an elderly fisherman with a white beard and weathered face

Далее добавляем детали, которые «оживят» картинку:

deep wrinkles, detailed skin texture, pores, age spots, intense gaze

Теперь выставляем свет:

dramatic side lighting, volumetric light, moody atmosphere

И, наконец, «добиваем» техническими тегами для качества:

shot on 35mm lens, f/1.8, bokeh, 8k, highly detailed, sharp focus

А что насчёт женского портрета в современном стиле? Здесь подход будет иным. Нам нужна лёгкость и естественность.

Medium shot of a young woman with messy bun hairstyle walking in a city street, casual clothes

Добавляем атмосферу и свет:

golden hour sunlight, soft lens flare, urban background

И полируем техникой:

Kodak Portra 400 style, film grain, candid shot, motion blur on background, high resolution

Обратите внимание на слово «candid» — оно подсказывает нейросети, что кадр должен выглядеть случайным, непостановочным, что резко повышает градус доверия к изображению.

Архитектура и интерьеры

Сгенерировать дом или комнату порой сложнее, чем человека. Геометрия не прощает ошибок. Если линии «поплыли», магия рушится. Здесь на помощь приходят термины из архитектурной визуализации. Ключевые слова вроде «Unreal Engine 5 render», «V-Ray», «ArchViz» дают понять системе, что мы ждем физически корректного поведения света и материалов.

Представьте современную гостиную. Нам нужно не просто перечисление мебели, а ощущение пространства. Промт может звучать так:

Modern minimalist living room interior, scandinavian style, beige and wood color palette

Но это база. Чтобы вдохнуть жизнь, добавляем:

morning sunlight streaming through sheer curtains, dust motes in the air, cozy atmosphere

И закрепляем качество:

photorealistic, wide angle lens 16mm, architectural photography, hyper-detailed textures, 8k

Если же душа тяготеет к экстерьерам, например, к дождливой улице киберпанка (классика жанра), то упор делаем на отражения:

Futuristic city street at night, neon signs reflecting in rain puddles

Важный нюанс — мокрый асфальт всегда выглядит реалистичнее сухого из-за сложности световых бликов. Добавляем:

wet asphalt texture, steam rising from vents, crowd of people with umbrellas

Технический блок:

cinematic shot, ray tracing, global illumination, highly detailed, photorealism

Подводные камни и «негатив»

Есть и обратная сторона медали. Иногда, сколько бы вы ни старались, нейросеть упорно рисует лишние пальцы, странные артефакты или превращает картинку в мультик. Тут в игру вступает Negative Prompt (негативный промт) — то, чего на изображении быть не должно. Это своего рода фильтр безопасности.

В поле негативного промта стоит внести всё, что ассоциируется с плохим качеством:

cartoon, illustration, 3d render, painting, drawing, bad anatomy, disfigured, blurry, low quality, pixelated, ugly

Особенно важно указать smooth skin или plastic look, если вы боретесь за текстуру. Это поможет отсечь стилизацию и заставит алгоритм держаться в рамках фотореализма. Также не лишним будет добавить text, watermark, signature, чтобы нейросеть не пыталась имитировать подписи фотографов, которые она видела в обучающей выборке.

Финальный штрих

Создание промта — это не точная наука, а скорее алхимия. Здесь нет единственно верного рецепта, который сработает в 100% случаев. Одна и та же фраза в разных моделях (будь то Midjourney, Stable Diffusion или DALL-E) даст совершенно разный результат. Тем более, что сами нейросети обновляются с бешеной скоростью, меняя своё восприятие слов.

Главное — не бояться экспериментировать с порядком слов. В начале предложения теги имеют больший вес, чем в конце. Если свет для вас важнее модели — ставьте его вперёд. Играйте с весами (коэффициентами значимости слов), смешивайте стили фотографов и эпохи. Ведь промт — это лишь карта, по которой ИИ ищет сокровища в своих цифровых чертогах. И чем точнее будет эта карта, тем богаче окажется добыча. Пусть ваши генерации всегда поражают воображение глубиной и реализмом!