Промт для фотореализма (с примерами готовых промтов)

В сети представлено множество руководств по генерации изображений, но почему-то у одних пользователей получаются снимки, которые невозможно отличить от работ победителей World Press Photo, а у других — глянцевые пластиковые куклы с безжизненным взглядом. Проблема кроется не в самой нейросети, будь то Midjourney или Stable Diffusion, а в подходе к формулированию задачи. ИИ по умолчанию стремится к идеализации, сглаживанию и симметрии, что на корню убивает ощущение реальности, ведь настоящий мир полон хаоса, несовершенств и сложных текстур. Удивительно, но чтобы получить живой кадр, нужно заставить алгоритм “испортить” идеальную картинку, и начать стоит с понимания того, как видит мир объектив фотокамеры.

Техническая часть запроса

Сложно ли обмануть глаз зрителя? Да, но результат того стоит. Основа любого фотореалистичного промта — это имитация настроек реального оборудования. Если просто написать «красивая девушка», нейросеть нарисует усреднённый цифровой арт. А вот если указать конкретную модель камеры и объектива, алгоритм подтянет данные о характере оптических искажений, глубине резкости и цветопередаче. Львиная доля успеха зависит от фокусного расстояния. Для портретов, например, идеально подходит 85mm или 100mm, которые дают правильные пропорции лица и красивое размытие фона. Широкий угол, скажем, 16mm или 24mm, пригодится для архитектуры или динамичных сцен, хотя и может искажать геометрию по краям кадра.

Не стоит забывать и про диафрагму. Значение f/1.8 или f/1.2 создаст то самое «боке», за которым так гоняются фотографы, отделяя объект от фона. А закрытая диафрагма f/8 или f/11 сделает резким весь кадр, что актуально для пейзажей. К слову, упоминание конкретных брендов, таких как Sony A7R IV, Fujifilm GFX 100 или Leica M6, добавляет снимку характерный цветовой профиль. Это же правило касается и плёнки. Добавление в промт названий Kodak Portra 400 или CineStill 800T мгновенно меняет цифровую стерильность на тёплое, зернистое и ламповое изображение. Ведь именно плёночное зерно часто служит тем самым маркером, по которому наш мозг считывает «настоящесть» картинки.

Работа со светом

Свет творит чудеса, если уметь им управлять. Плоское фронтальное освещение убивает объем, превращая лицо в маску. Поэтому в промтах стоит использовать описания сложных световых схем. Один из самых беспроигрышных вариантов — это «natural lighting» (естественное освещение) или «golden hour» (золотой час), когда солнце находится низко над горизонтом, давая мягкие длинные тени. Однако спектр решений этим не ограничивается. Для создания драматизма отлично подходит «cinematic lighting» (кинематографичное освещение) или «chiaroscuro» (кьяроскуро) — техника, построенная на жёстком контрасте света и тени.

А вот если хочется интимности и уюта, выручит «volumetric lighting» (объемный свет), который делает видимыми лучи, пробивающиеся сквозь пыль или дымку. Также довольно часто используется «rembrandt lighting» — классическая схема с треугольником света на щеке, придающая портрету благородство. Тем более, что нейросети прекрасно понимают эти термины. Ну и, наконец, нельзя не упомянуть про отражения и блики. Слова «ray tracing» или «global illumination», пришедшие из 3D-графики, помогают алгоритму корректно просчитать, как свет взаимодействует с поверхностями, добавляя сцене физической достоверности.

Детализация и несовершенства

Идеальная кожа — враг фотореализма. В жизни на лице всегда есть поры, микроморщинки, пушок, веснушки или лёгкая асимметрия. ИИ же пытается всё это «заштукатурить». Чтобы сбить этот фильтр, необходимо прямым текстом требовать детализацию текстур. Такие слова, как «skin texture», «pores», «imperfections», «detailed eyes», заставляют нейросеть прорисовывать микрорельеф кожи. Это выглядит впечатляюще, особенно на крупных планах. Грезят о гламуре многие, но верят зрители именно в несовершенства.

Впрочем, нюанс касается не только людей. Одежда должна иметь текстуру ткани, на мебели могут быть потёртости, а на улице — мусор или лужи. Промт «dirty street» или «worn out clothes» сделает сцену обжитой и правдоподобной. Стерильная чистота вызывает подсознательное недоверие. К тому же, добавление случайных элементов, так называемого визуального шума, помогает избавиться от ощущения искусственности. Случайный прохожий на заднем плане, блик в объективе или лёгкая расфокусировка — всё это работает на создание иллюзии моментального снимка, выхваченного из потока жизни.

Портретная съёмка

Как составить идеальный запрос? Начать нужно с главного героя, а затем нанизывать на него технические параметры. Рассмотрим конкретный пример для создания глубокого психологического портрета.

Промт может звучать так:

«Close-up portrait of an elderly fisherman with weathered skin, deep wrinkles, looking directly at camera, wearing a yellow raincoat, rainy day, overcast sky, dramatic lighting, shot on 35mm lens, f/2.8, hyper-realistic, highly detailed skin texture, raw photo, Fujifilm color palette».

Здесь мы видим чёткую структуру. Сначала идет описание объекта (пожилой рыбак) и его характерных черт (обветренная кожа). Затем задается атмосфера (дождь, пасмурно) и технические параметры (35мм, открытая диафрагма). Упоминание «raw photo» сигнализирует нейросети, что изображение не должно выглядеть обработанным. А вот другой вариант, для студийного женского портрета:

«Fashion portrait of a young woman with freckles, natural makeup, messy hair bun, soft studio lighting, rim light, neutral background, shot on Sony A7R IV, 85mm lens, sharp focus on eyes, 8k resolution, texture of the skin, realistic photography».

Здесь акцент смещен на мягкость и детализацию глаз, а «messy hair» (растрёпанные волосы) добавляют ту самую необходимую небрежность.

Уличная фотография и пейзажи

Сложно ли передать атмосферу города? Вполне, если забыть про динамику. Статика убивает стрит-фото. Для имитации репортажной съёмки стоит использовать слова «candid shot» (случайный кадр) или «motion blur» (размытие в движении).

Пример промта для городской сцены:

«Busy street of Tokyo at night, neon lights reflecting in puddles, people walking with umbrellas, cyberpunk vibes, cinematic composition, shot on Kodak Portra 800, grain, volumetric fog, wide angle 24mm, motion blur, realistic colors, high contrast».

Обратите внимание на упоминание плёнки Kodak Portra 800 — она даёт специфические, узнаваемые цвета при ночной съёмке. Для пейзажей же важнее всего масштаб и детализация. Вот добротный вариант для природы:

«Majestic view of Norwegian fjords during sunrise, morning mist, calm water reflection, hyper-realistic, wide angle shot, massive scale, detailed rocks and vegetation, f/16, sharp depth of field, National Geographic style, raw image».

Указание диафрагмы f/16 гарантирует, что и передний план (камни), и задний (горы) будут в фокусе.

Предметная съёмка и еда

Еда на фото должна вызывать аппетит, а не подозрение, что она сделана из пластика. Главное — угадать с палитрой и текстурами. Глянцевый блеск соуса, пар, поднимающийся от горячего блюда, крошки на столе — всё это создаёт антураж.

Попробуйте такой запрос:

«Professional food photography of a juicy burger on a wooden board, melting cheese, steam rising, macro shot, shallow depth of field, blurred restaurant background, warm lighting, delicious details, sesame seeds on bun, 4k, highly detailed textures, shot with 100mm macro lens».

Использование макрообъектива (100mm macro) позволяет показать мельчайшие детали, вроде кунжута или капель жира, что критически важно для восприятия вкуса через зрение. А размытый фон концентрирует внимание на главном объекте. Это же правило работает и для предметной съёмки ювелирных изделий или техники:

«Product photography of a luxury perfume bottle, glass texture with water drops, elegant lighting, reflection on black surface, minimal composition, golden details, sharp focus, advertising standard, 8k».

Стиль и эпоха

Винтажные фото сейчас на пике популярности. Но просто написать «старое фото» недостаточно. Нужно погрузить ИИ в контекст времени.

Пример для имитации 90-х:

«Flash photography from the 90s, group of teenagers at a house party, red eyes effect, polaroid style, slightly blurry, candid moment, vintage clothes, chaotic composition, hard flash shadow, vhs aesthetic, authentic look».

Такие элементы, как «эффект красных глаз» или «жёсткая тень от вспышки», являются техническим браком, но именно они делают кадр до боли родным и реалистичным для той эпохи. Или вариант для 1920-х:

«Black and white photograph from 1920s, vintage street of New York, retro cars, men in hats, grainy film texture, scratched photo, sepia tone, historical accuracy, daguerreotype style».

Здесь уже в ход идут царапины и сепия, создавая ощущение архивного документа.

Чего стоит избегать?

Многие считают, что чем длиннее промт, тем лучше, однако это опасное заблуждение. Перегруженный запрос часто сбивает нейросеть с толку, и она начинает игнорировать важные части. Не стоит использовать абстрактные понятия вроде «истинная красота» или «смысл жизни» — алгоритм их не понимает. Также лучше отказаться от противоречивых команд, например, требовать одновременно «soft lighting» и «harsh shadows». Это приведёт к визуальной каше.

Отдельно стоит упомянуть так называемые «негативные промты» (параметр –no в Midjourney или отдельное поле в SD). В них обязательно нужно вписывать то, что убивает реализм:

«cartoon, 3d render, illustration, drawing, painting, anime, plastic skin, deformed hands, extra fingers, blurry, low quality, watermark, text, bad anatomy».

Это своего рода спасательный круг, который отсекает все лишнее. Тем более, что исключение стилистики рисунка (drawing, painting) принудительно толкает генерацию в сторону фотореализма.

Секретные ингредиенты

Существует ряд слов-триггеров, которые не относятся к фотографии напрямую, но значительно улучшают качество картинки. Например, «Unreal Engine 5» — казалось бы, движок для игр, но его упоминание добавляет детализацию освещения. Слово «octane render» работает схожим образом, повышая проработку текстур. Но с ними нужно быть осторожным, чтобы не уйти в 3D-графику.

Лучше использовать названия авторитетных источников. «National Geographic», «Vogue», «Magnum Photos» — эти маркеры задают определенную планку качества и стилистику. Если вы хотите суровый репортаж, добавьте имя известного военного фотографа, скажем, «style of Steve McCurry». А если нужен гламур — «style of Annie Leibovitz». ИИ обучался на миллионах изображений и прекрасно знает почерк мастеров. Это надёжный, проверенный способ получить предсказуемый результат.

Эксперименты и анализ

Фотореализм — это не застывшая догма, а постоянный поиск. Иногда случайная опечатка в промте или неожиданное сочетание параметров дают результат, превосходящий все ожидания. Не бойтесь смешивать стили, ставить камеру в неожиданные ракурсы и играть со светом. Ведь именно в этих экспериментах рождается ваш уникальный авторский стиль, который будет выделять ваши работы из потока однотипных генераций.

Финальный штрих в создании изображения — это всегда ваш вкус и насмотренность. Пробуйте, меняйте объективы, играйте с плёнкой и не забывайте про детали. Пусть каждый ваш запрос станет шагом к созданию настоящего шедевра, который заставит зрителя замереть в восхищении и задаться вопросом: «Неужели это не фотография?». Удачи в творческих поисках, и пусть нейросеть понимает вас с полуслова!