Промт для реалистичной кожи (с примерами готовых промтов)

Глянцевая, словно облитая маслом физиономия — знакомая картина для любого, кто хоть раз пытался сгенерировать портрет нейросетью? Искусственный интеллект, стремясь к некоему усреднённому идеалу красоты, довольно часто выдает результат, напоминающий скорее манекен из дорогого бутика, чем живого человека. Мы видим правильные черты лица, симметрию, но глаз моментально считывает фальшь: слишком гладко, слишком чисто, слишком «пластиково». Виной тому — обучающие датасеты, переполненные отретушированными фотографиями из глянцевых журналов и стоков, где текстура кожи безжалостно затерта в угоду коммерческой эстетике. Удивительно, но заставить алгоритм «вспомнить» о том, что люди состоят из пор, морщинок и несовершенств, — задача не из лёгких. Однако добиться эффекта живой, дышащей текстуры вполне реально, если знать правильные слова и понимать механику восприятия изображения.

Вредно ли использовать «бьютифайеры»?

Многие новички, желая получить красивую картинку, щедро сыплют в промт словами вроде «beautiful», «gorgeous» или «perfect face». Логика понятна: мы хотим получить эстетичный результат. Но на самом деле именно эти эпитеты и являются главными врагами реализма. Они запускают в нейросети ассоциативные ряды, связанные с цифровым артом и пережатым «гламуром». Лучше отказаться от абстрактных похвал внешности в пользу технических описаний. Ведь красота в реализме — это детализация, а не идеализация. Вместо «perfect skin» стоит написать «highly detailed skin texture» (высокодетализированная текстура кожи) или «visible pores» (видимые поры). Разница будет колоссальной. Нейросеть перестанет «мылить» лицо и начнет прорисовывать микрорельеф, который и заставляет наш мозг верить в происходящее на экране.

Свет и тень

Именно свет выявляет рельеф. Представьте себе лунную поверхность: в полдень она кажется плоской, но стоит солнцу опуститься к горизонту, как тени от кратеров становятся длинными и чёткими. То же самое происходит и с кожей. Плоское студийное освещение («soft box lighting») скрывает недостатки, но вместе с ними убивает и объём. Если ваша цель — гиперреализм, стоит обратиться к более жёстким или драматичным схемам света. К слову, отлично работают запросы «hard lighting» (жёсткий свет), «dramatic lighting» (драматичное освещение) или «side lighting» (боковое освещение). Тени, падающие от мельчайших неровностей кожи, создают тот самый «шум», который мы воспринимаем как естественность. А вот популярный тег «volumetric lighting» (объёмный свет) добавит атмосферности, но может смягчить детализацию, так что с ним нужно быть осторожнее.

Фотографическая лексика

Сложно ли обмануть зрителя, заставив его принять генерацию за снимок? Да, но результат того стоит. Для этого нужно говорить с нейросетью на языке фотографов. Простого слова «photo» недостаточно. Укажите конкретную технику и параметры съёмки. Это же очевидно: разные объективы по-разному передают фактуру. Например, макрообъективы («macro lens») предназначены для съёмки мелких деталей, и их упоминание заставит ИИ сфокусироваться на текстуре кожи. Также отличным маркером служит указание на профессиональные камеры с высоким разрешением, скажем, «shot on Sony A7R IV» или «Fujifilm GFX 100». Эти камеры известны своей невероятной резкостью, и нейросеть, «зная» об этом, попытается имитировать соответствующую чёткость. Не стоит забывать и про фокусное расстояние: «85mm» или «100mm» — это классика портретной съёмки, которая дает правильные пропорции лица без искажений.

Зернистость и плёночный эффект

Идеальная цифровая чистота — это враг реализма. Сенсоры реальных камер, особенно при недостаточном освещении, всегда дают небольшой цифровой шум. А плёночные фотографии обладают характерным «зерном». Искусственный интеллект по умолчанию стремится к стерильной чистоте, поэтому нам нужно принудительно добавить «грязи». Такие слова, как «film grain» (плёночное зерно), «noise» (шум) или указание конкретной плёнки, например, «Kodak Portra 400», творят чудеса. Зернистость разбивает ту самую пластиковую гладкость, маскируя мелкие огрехи генерации и добавляя изображению осязаемую фактуру. Это надежный визуальный якорь, который говорит нашему подсознанию: «Это было снято на физический носитель».

Что такое Subsurface Scattering?

В компьютерной графике есть термин, который является настоящим Святым Граалем для создателей цифровых персонажей. Речь идет о подповерхностном рассеивании, или «subsurface scattering». Дело в том, что наша кожа не является непрозрачным куском пластика. Свет проникает в верхние слои эпидермиса, рассеивается там и выходит обратно, приобретая теплый, красноватый оттенок из-за кровеносных сосудов. Именно этот эффект заставляет уши светиться красным, если смотреть сквозь них на солнце. Если добавить этот термин в промт, нейросеть попытается симулировать этот сложный физический процесс. Кожа перестанет выглядеть как крашеная штукатурка и приобретет глубину и ту самую «восковую» мягкость, свойственную живой плоти. Это серьезное вложение в качество итоговой картинки.

Несовершенства

Идеальность убивает веру в изображение. Живые люди несимметричны. У них есть родинки, веснушки, шрамы, расширенные поры, пушковые волосы («peach fuzz») и неровный тон кожи. Нейросеть же тяготеет к усреднению. Поэтому, чтобы получить реалистичный портрет, нужно буквально заставлять алгоритм рисовать недостатки. Смело добавляйте в описание: «freckles» (веснушки), «moles» (родинки), «acne scars» (шрамы от акне), «uneven skin tone» (неровный тон кожи), «wrinkles» (морщины). К тому же, наличие таких деталей делает лицо уникальным, наделяет его характером и историей. Портрет старухи с глубокими морщинами («weathered skin») всегда будет выглядеть реалистичнее, чем лицо юной девы, потому что текстура там выражена ярче. А для молодых лиц отлично работает упоминание «natural skin texture» (естественная текстура кожи) и «unmakeup» (без макияжа).

Примеры готовых решений: Крупный план

Давайте перейдем от теории к практике и рассмотрим конкретные конструкции. Предположим, нам нужен сверхреалистичный портрет девушки, где видна каждая поры. Начать нужно с главного объекта и стиля. Вот как может выглядеть базовая структура такого запроса:

Extreme close-up portrait of a young woman, natural look, no makeup. Highly detailed skin texture, visible pores, peach fuzz on cheeks, hyperrealistic. Shot on 85mm lens, f/1.8, depth of field, sharp focus on eyes, studio lighting. 8k resolution, raw photo, global illumination.

Этот набор команд заставит ИИ забыть о «пластиковых» фильтрах и выдать максимально честную картинку.

Примеры готовых решений: Кинематографичность

А если задача — создать кадр, похожий на скриншот из дорогого фильма? Здесь акценты смещаются с макро-детализации на атмосферу и освещение, хотя требования к коже остаются высокими. В таком случае промт может быть таким:

Cinematic shot of a man standing in the rain, night city background, neon lights reflection. Wet skin, sweat droplets, detailed facial features, rugged skin texture, stubble beard. Shot on Arri Alexa, anamorphic lens, film grain, color graded, teal and orange.

Такой подход создаст не просто портрет, а кадр с историей, где реалистичность кожи поддерживается общим антуражем.

Примеры готовых решений: Возрастной портрет

Старость — это кладезь текстур для нейросети. Здесь можно развернуться на полную катушку. Попробуйте следующую комбинацию:

Portrait of an elderly fisherman, weathering storm, intense gaze. Deep wrinkles, age spots, dry skin texture, coarse facial features, hyper detailed. Rembrandt lighting, side light, hard shadows. Macro photography, insane details, unreal engine 5 render style, 8k.

Последнее уточнение про движок Unreal Engine, кстати, является спорным моментом: иногда оно дает «пластик», но в сочетании с «photo real» может добавить резкости. Тут стоит экспериментировать.

Отрицательный промт (Negative Prompt)

Нельзя не упомянуть и о том, что нужно отсекать. Порой проще запретить нейросети делать плохо, чем заставить делать хорошо. В поле Negative Prompt (если ваш генератор это поддерживает) или через параметр «–no» стоит добавить все, что ассоциируется с искусственностью. Стандартный набор «джентльмена» включает:

airbrushed, smooth skin, plastic, cartoon, illustration, painting, blurry, out of focus, doll, 3d render

Особенно важно слово «airbrushed» (отретушированный аэрографом) — именно оно отвечает за тот самый журнальный глянец, от которого мы так старательно пытаемся уйти. Также полезно исключить «makeup», если вы стремитесь к максимальной естественности, так как макияж сам по себе сглаживает текстуру кожи.

Значение разрешения и апскейлинга

Есть ещё один нюанс, о котором часто забывают. Дело в том, что при генерации изображений с низким разрешением у нейросети физически не хватает пикселей, чтобы прорисовать поры. Лицо получается гладким просто из-за нехватки информации. Поэтому имеет смысл генерировать изображения с максимально доступным разрешением или использовать функции «Upscale» (увеличение). Причем современные апскейлеры (например, Magnific AI или встроенные инструменты в Stable Diffusion) умеют не просто растягивать картинку, а «додумывать» детали, генерируя новую текстуру кожи поверх старой. Это довольно мощный инструмент. Сгенерировав даже средний по качеству портрет, можно прогнать его через такой «улучшайзер» с промтом, акцентирующим внимание на текстуре, и получить результат совершенно иного уровня.

Стилевые миксы

Интересные результаты дает смешивание имен известных фотографов. У каждого мастера свой подход к работе с кожей и светом. Например, Ли Джеффрис (Lee Jeffries) известен своими невероятно детальными, высококонтрастными чёрно-белыми портретами бездомных, где каждая морщина выглядит как каньон. Добавление его имени в промт мгновенно добавит резкости и драматизма текстуре. Стив Маккарри (Steve McCurry) — это работа с цветом и естественным светом, дающая очень живые, документальные лица. Энни Лейбовиц (Annie Leibovitz) даст более художественную, но все же реалистичную картинку. А вот упоминания цифровых художников, вроде Artgerm или Greg Rutkowski, лучше избегать, если ваша цель — фотореализм. Они уведут стиль в сторону рисунка, как бы вы ни старались прописать текстуру.

Двойные прилагательные и синтаксис

Нейросети, особенно современные версии Midjourney или DALL-E 3, становятся всё более чувствительными к естественному языку, но всё же любят конкретику. Использование конструкции из двойных прилагательных, например, «грубая обветренная кожа» (rough weathered skin) или «мягкий рассеянный свет» (soft diffused light), помогает алгоритму точнее определить вектор генерации. Не стоит перегружать промт бесконечными существительными через запятую — это старая школа. Сейчас лучше работают связные фразы. Вместо «skin, pores, details» попробуйте написать «skin with distinct pores and microscopic details». Глаголы и предлоги помогают ИИ понять взаимосвязи между объектами, что делает итоговую композицию более цельной.

Стоит ли гнаться за длинными промтами?

Существует заблуждение, что чем длиннее «заклинание», тем лучше результат. Бытует мнение, что нужно скопировать «полотно» текста из интернета, и шедевр готов. На самом деле, перегруженный промт часто сбивает нейросеть с толку. Вес каждого слова падает. Если вы напишете 50 слов, слово «pores» может просто затеряться среди описаний одежды и фона. Лаконичность — сестра таланта и в промпт-инжиниринге. Выделите главное. Если для вас важна кожа, поставьте описание кожи в самое начало промта. Первые слова имеют наибольший вес для алгоритма. Начните с «Close-up photo of…», и уже потом описывайте цвет глаз или фасон платья.

Фактор случайности

И всё же, даже с идеальным промтом, результат не всегда гарантирован. Генерация — это всегда лотерея, бросок костей в многомерном пространстве. Один и тот же запрос может выдать и пластиковую куклу, и пугающе живого человека. Не стоит расстраиваться, если с первого раза не вышло. Иногда достаточно просто изменить «seed» (случайное число, на основе которого генерируется шум) или слегка перефразировать запрос. Попробуйте заменить «detailed skin» на «raw skin texture» или добавить «unretouched». Эксперимент — это единственно верный путь к успеху в этой области.

В конечном счёте, создание реалистичной кожи — это баланс между техническими командами и художественным чутьем. Не бойтесь добавлять недостатки, играть с жёстким светом и зернистостью плёнки. Именно в этих мелких, казалось бы, ненужных деталях и кроется магия настоящего фотореализма. Практикуйтесь, комбинируйте разные подходы, и очень скоро ваши цифровые портреты обретут плоть и кровь, заставляя зрителя всматриваться в каждую пору с немым вопросом: «Неужели это нарисовал компьютер?». Удачи в поисках своего идеального промта, и пусть ваши генерации всегда выглядят убедительно!