Создание действительно реалистичного портрета в нейросети — это занятие, напоминающее работу ювелира, где одно неверное слово превращает живого человека в пластиковую куклу из витрины магазина одежды. Ведь любой обыватель, впервые открывший Midjourney или Stable Diffusion, сталкивается с одной и той же проблемой: искусственный интеллект тяготеет к идеализации, разглаживая кожу до состояния фарфора и награждая персонажей бессмысленным, пустым взглядом. Казалось бы, достаточно написать «мужчина, фото», но результат неизменно разочаровывает своей искусственностью и отсутствием души. Но чтобы превратить бездушный набор пикселей в фотографию, от которой веет характером и историей, стоит погрузиться в нюансы промпт-инжиниринга гораздо глубже, чем кажется на первый взгляд.
Анатомия запроса
С чего начинается построение грамотного описания? Разумеется, с фундамента, на который потом, словно кирпичики, накладываются детали. Многие новички совершают ошибку, сваливая все слова в кучу, надеясь, что алгоритм сам разберётся. Однако порядок слов имеет колоссальное значение. В первую очередь стоит обозначить субъект, причем максимально конкретно. Просто «мужчина» — это слишком размыто. «Пожилой рыбак с обветренным лицом» или «молодой предприниматель в дорогом костюме» — вот уже более понятная задача для нейросети.
Далее следует блок описания внешности и одежды. Здесь кроется главный секрет реализма — несовершенства. Идеально симметричные лица вызывают у зрителя подсознательное отторжение, так называемый эффект «зловещей долины». Поэтому не стоит скупиться на такие детали, как шрамы, морщины, веснушки, лёгкая небритость или асимметрия. Именно эти «изъяны» делают портрет живым. Одежда же должна соответствовать контексту: странно видеть шахтёра в белоснежной рубашке. Текстуры тканей — шерсть, лён, кожа, деним — помогают нейросети правильно выстроить светотень и добавить тактильности изображению.
Освещение и атмосфера
Свет — это кисть фотографа, пусть даже виртуального. Без правильного света самая детализированная модель будет выглядеть плоской. Довольно часто пользователи забывают уточнять этот параметр, полагаясь на случайность. А зря. Ведь именно освещение задает настроение. Для драматичного мужского портрета идеально подходит «Rembrandt lighting» (рембрандтовское освещение) с характерным треугольником света на щеке. Если же цель — показать открытость и свежесть, выручит «soft natural light» (мягкий естественный свет).
Тем более, что существуют и более сложные схемы. Например, «cinematic lighting» (кинематографичное освещение) добавит кадру глубины и объема, а «volumetric lighting» (объёмный свет) создаст красивые лучи, пронизывающие пространство, например, дым или пыль. Нельзя не упомянуть и о цветовой температуре: «warm tones» (тёплые тона) сделают образ уютным и располагающим, тогда как «cool blue tones» (холодные синие тона) добавят отстраненности или технологичности, что отлично подходит для киберпанк-стилистики.
Технические параметры съёмки
Нужны ли эти цифры гуманитарию? Безусловно. Нейросеть обучалась на миллионах реальных фотографий, и теги, описывающие настройки камеры, служат для нее мощнейшими якорями. Указание фокусного расстояния меняет геометрию лица. Широкий угол (например, 24mm) искажает пропорции, делая нос больше, что редко подходит для классического портрета. А вот 85mm или 100mm — это золотой стандарт портретной съёмки, обеспечивающий правильные пропорции и красивое размытие фона.
К слову, о размытии. Тег «bokeh» или «depth of field» (глубина резкости) поможет отделить героя от фона, акцентируя внимание на глазах. Ещё один важный нюанс — зернистость плёнки. Цифровая стерильность убивает реализм. Добавление «film grain» (плёночное зерно) или упоминание конкретной плёнки, скажем, «Kodak Portra 400», творит настоящие чудеса, привнося в изображение ту самую «ламповую» теплоту и текстуру, которой так не хватает цифровым генерациям. Это довольно простой, но крайне эффективный трюк.
Стиль и детализация
Здесь в игру вступают модификаторы качества. Львиная доля успешных промтов содержит такие слова, как «hyperrealistic», «highly detailed», «8k resolution» и «Unreal Engine 5 render». Хотя последние два относятся скорее к компьютерной графике, они заставляют алгоритм прорабатывать мельчайшие детали. Но есть и подводные камни. Переизбыток таких тегов может привести к тому, что кожа станет похожа на пластик или воск. Чтобы этого избежать, стоит использовать тег «skin texture» (текстура кожи) или «visible pores» (видимые поры).
Отдельно стоит упомянуть стиль исполнения. Можно запросить фото в стиле конкретного фотографа, например, Annie Leibovitz или Steve McCurry. Нейросеть попытается сымитировать их манеру работы с цветом и композицией. Это отличный способ получить художественный результат, не ломая голову над сложными настройками света. А если хочется чего-то более брутального и мрачного, стиль «noir» (нуар) станет отличным решением.
Примеры готовых промтов: Классический мужской портрет
Разберём конкретные сценарии. Допустим, нам нужен уверенный в себе мужчина средних лет, бизнесмен или архитектор. Задача — получить фотореалистичное изображение, пригодное для обложки журнала. Начать нужно с описания внешности, добавить одежду, затем выставить свет и камеру.
Промт может выглядеть следующим образом:
“Portrait of a confident 45-year-old man with salt and pepper hair and a neatly trimmed beard, wearing a tailored charcoal grey wool suit and a crisp white shirt, standing in a modern office with glass walls, soft natural daylight coming from the window, cinematic lighting, shallow depth of field, focus on eyes, highly detailed skin texture, visible pores, realistic eyes, shot on Sony A7R IV, 85mm lens, f/1.8, hyperrealistic, 8k –ar 2:3 –v 6.0”
В этом запросе каждое слово стоит на своем месте. «Salt and pepper hair» (волосы с проседью) добавляет возраста и солидности. «Tailored charcoal grey wool suit» (пошитый на заказ темно-серый шерстяной костюм) дает нейросети понять фактуру ткани. Технические параметры камеры (Sony A7R IV, 85mm) закрепляют результат, гарантируя высокое разрешение и правильную перспективу.
Примеры готовых промтов: Брутальный образ
А что, если нам нужен совсем другой типаж? Например, уставший рабочий или путешественник, лицо которого отражает тяготы пути. Здесь гламурная ретушь будет совершенно неуместна. Нам нужны грязь, пот, морщины и суровый взгляд.
Пример запроса для такого образа:
“Close-up portrait of a rugged lumberjack with a thick beard and a weathered face, dirt and grease on skin, wearing a worn-out flannel plaid shirt, intense gaze looking directly at camera, deep wrinkles, forest background with mist, moody lighting, volumetric fog, dramatic shadows, raw photo, film grain, Fujifilm Velvia 50, realistic imperfections, sharp focus –ar 3:4 –style raw”
Обратите внимание на модификаторы «weathered face» (обветренное лицо) и «dirt and grease» (грязь и жир). Именно они убивают «пластиковость». Тег «raw photo» (сырое фото) дает команду алгоритму не применять автоматическую «бьютификацию», оставляя кадр максимально честным и жёстким. А упоминание плёнки Fujifilm добавляет специфическую цветокоррекцию с насыщенными тенями.
Примеры готовых промтов: Киберпанк и футуризм
Иногда реализм должен соседствовать с фантастикой. Создание образа мужчины в стиле киберпанк требует особого подхода к освещению. Здесь правят бал неон и контрасты. Но чтобы лицо оставалось человеческим, важно сохранить текстуру кожи, даже если вокруг сверкают лазеры.
Промт для футуристического образа:
“Cyberpunk style portrait of a young man with cybernetic implants on his cheekbone, wearing a high-tech tactical jacket with glowing led strips, standing on a rainy neon-lit street of Tokyo at night, blue and pink rim lighting, wet skin, reflection of neon signs in eyes, bokeh background, rain droplets, atmospheric, highly detailed, photorealistic render, octane render, ray tracing –ar 16:9 –v 6.0”
Ключевым моментом здесь является «rim lighting» (контурный свет). В цветных сценах он помогает отделить тёмный силуэт от тёмного фона. «Wet skin» (влажная кожа) и «rain droplets» (капли дождя) добавляют невероятное количество деталей, за которые цепляется взгляд. Это создает эффект присутствия, словно вы смотрите кадр из дорогого блокбастера.
Сложно ли избежать ошибок?
Да, и довольно часто. Самая распространенная проблема — противоречивые команды. Нельзя одновременно требовать «sunny day» (солнечный день) и «night atmosphere» (ночная атмосфера). Нейросеть сойдет с ума и выдаст нечто среднее и невразумительное. Также не стоит перегружать промт сотней прилагательных. Лучше меньше, но точнее. Фраза «handsome man» (красивый мужчина) слишком субъективна. Для ИИ красота — понятие растяжимое. Лучше описать конкретные черты: «strong jawline» (сильная линия челюсти), «high cheekbones» (высокие скулы) или «piercing blue eyes» (пронзительные голубые глаза).
Ещё один нюанс — руки. Это настоящая ахиллесова пята генеративных моделей. Если есть возможность, лучше строить кадр так, чтобы руки не попадали в фокус или были спрятаны в карманы. Но если они необходимы, стоит добавить в негативный промт (параметр –no) такие слова, как «bad hands», «missing fingers», «extra fingers». Это не панацея, но спасательный круг, который часто выручает.
Работа с ракурсами
Удивительно, но изменение ракурса меняет восприятие персонажа кардинально. Съёмка снизу («low angle») делает мужчину более монументальным, доминирующим, даже угрожающим. Это отличный прием для создания образов злодеев или могущественных лидеров. Съёмка сверху («high angle»), наоборот, может принизить героя или показать его уязвимость.
Стандартный же портрет на уровне глаз («eye-level shot») создает эффект диалога на равных. Он наиболее честен и привычен для зрителя. Использование промта «profile view» (вид в профиль) позволит подчеркнуть форму носа и волевой подбородок, что часто используется в фешн-съёмке. Не бойтесь экспериментировать с положением камеры, ведь статичная поза «паспортного фото» — это скучно. Динамику можно задать фразой «walking towards camera» (идет на камеру) или «looking back over shoulder» (оглядывается через плечо).
Эмоциональный спектр
Каменное лицо — бич искусственного интеллекта. По умолчанию нейросеть генерирует нейтральное, слегка отсутствующее выражение. Чтобы вдохнуть жизнь, нужно прописать эмоцию. Но просто «happy» (счастливый) даст вам рекламную улыбку от уха до уха. Куда интереснее работают сложные эмоции: «smirk» (ухмылка), «frowning» (хмурится), «suspicious look» (подозрительный взгляд), «laughing out loud» (громко смеётся).
Микровыражения лица творят чудеса. Приподнятая бровь, закушенная губа или прищуренные глаза рассказывают историю лучше, чем любые декорации. Например, промт «tired but happy expression» (усталое, но счастливое выражение) создаст сложный, многогранный образ, который заставит зрителя додумывать контекст: может быть, он только что закончил марафон или вернулся домой к семье после долгой командировки.
Важность негативного промта
Мы много говорили о том, что нужно писать. Но что писать не нужно? В некоторых интерфейсах (как в Stable Diffusion) есть отдельное поле для Negative Prompt. В Midjourney это параметр «–no». Это фильтр, отсекающий мусор. Для мужских портретов стандартный набор исключений просто необходим.
В него стоит включить: «cartoon, drawing, illustration, plastic, doll, blurred, low quality, makeup, lipstick, feminine features». Последнее особенно важно, так как модели часто стремятся феминизировать черты лица, делая их слишком мягкими. Тег «makeup» и «lipstick» убережет от случайного появления косметики на суровом лице лесоруба. А исключение «plastic» и «doll» — это, пожалуй, главное требование для достижения фотореализма.
Финальная обработка и апскейл
Получить картинку — это полдела. Зачастую исходное разрешение генерации оставляет желать лучшего. Детали могут казаться мыльными при ближайшем рассмотрении. Здесь на помощь приходят апскейлеры (инструменты увеличения разрешения). Но и с ними нужно быть щепетильным. Слишком агрессивный апскейл может добавить ненужный шум или исказить текстуру кожи.
Удачный портрет — это совокупность факторов. Это баланс между техническим описанием камеры и художественным видением образа. Не стоит расстраиваться, если первая генерация похожа на монстра. Промт-инжиниринг — это процесс перебора и уточнения. Меняйте одно слово за раз, следите за тем, как меняется свет и настроение. И рано или поздно из цифрового шума на вас посмотрит человек, в реальность существования которого будет невозможно не поверить. Удачных вам экспериментов и пусть каждая генерация станет маленьким шедевром!