Промт для улучшения лица (с примерами готовых промтов)

Ни одна цифровая генерация, будь то величественный пейзаж или футуристический концепт-арт, не вызывает у зрителя такого пристального, почти инстинктивного внимания, как человеческое лицо. Эволюция за миллионы лет научила нас считывать малейшую асимметрию, неестественный блеск в глазах или странную текстуру кожи как сигнал опасности или болезни. Именно поэтому даже технически совершенная картинка с «поплывшим» лицом мгновенно отправляется в корзину, вызывая у автора лишь досаду и чувство потраченного впустую времени. Ирония же заключается в том, что нейросети, обладая мощностью тысяч видеокарт, до сих пор спотыкаются о, казалось бы, простые анатомические истины, превращая портреты в сюрреалистическое месиво. Но чтобы не ошибиться и получить достойный результат, нужно всего лишь подобрать правильный ключ — грамотно составленный текстовый запрос.

Почему нейросети ошибаются?

Специально ли алгоритм искажает черты? Вовсе нет. Проблема кроется в обучающих датасетах. Махина из миллиардов изображений содержит не только профессиональные портреты, но и размытые снимки, карикатуры, абстракции, где лица намеренно искажены. Когда вы просите нарисовать «девушку», ИИ пытается усреднить все эти знания, и иногда результат выглядит удручающе. К тому же, нейросеть не понимает анатомию как биологическую структуру. Для неё глаз — это просто набор пикселей определённого цвета, который обычно находится рядом с носом. А если ещё вспомнить про сложность симметрии, становится понятно, почему «пластиковые» лица и косые взгляды преследуют новичков довольно часто. Спасательный круг здесь — конкретика. Чем точнее вы опишете, чего именно ждете от текстуры, света и пропорций, тем меньше свободы для ошибки оставите машине.

Текстура кожи: как избежать «пластика»?

Глянцевая, идеально ровная кожа без единой поры — это маркер дешёвой генерации, который сразу бросается в глаза. В погоне за красотой многие используют слова вроде perfect face или beautiful skin, но получают в итоге куклу Барби. Секрет живого портрета — в несовершенствах. Ведь именно они делают нас людьми.

Для достижения реализма в промт стоит внедрять слова, отвечающие за микродетализацию. Отличным решением станет использование связки highly detailed skin texture (высокодетализированная текстура кожи) и visible pores (видимые поры). Дополняет этот антураж упоминание мелких дефектов, например, moles (родинки) или freckles (веснушки), которые придают лицу характер и объём. Не стоит забывать и про пушок на лице, который можно вызвать словосочетанием peach fuzz, — это высший пилотаж в генерации макро-портретов. А чтобы закрепить результат, опытные промпт-инженеры добавляют технические характеристики, такие как 8k resolution или raw photo, намекая нейросети на то, что перед ней не рисунок, а снимок с дорогой камеры.

Глаза — зеркало генерации

Испортить всё впечатление могут «мёртвые» или косые глаза. Это. Пожалуй. Самая частая проблема. Зрителю довольно сложно установить контакт с персонажем, если его взгляд расфокусирован или зрачки напоминают растёкшуюся кляксу.

Здесь на помощь приходят уточнения, касающиеся строения глаза. В первую очередь стоит прописать detailed iris (детализированная радужка), чтобы получить сложный рисунок, а не просто цветное пятно. Глубину взгляду придаст perfect eyes (идеальные глаза) — клише, которое, однако, в данном контексте работает на исправление геометрии. Живости добавляют блики, за которые отвечают токены light reflections in eyes или catchlight. Ну и, наконец, для избежания эффекта косоглазия полезно указывать направление взгляда, например, looking at camera (смотрит в камеру) или sharp focus on eyes (резкий фокус на глазах). Без этих уточнений нейросеть может решить, что глаза — деталь второстепенная, и уделить им минимум вычислительного внимания.

Освещение как инструмент скульптора

Плоский свет убивает даже самую лучшую анатомию. Лицо превращается в блин, теряя объём и выразительность. А ведь именно светотеневой рисунок лепит форму, подчёркивает скулы и прячет недостатки.

Классикой портретного жанра считается Rembrandt lighting (рембрандтовское освещение), создающее драматичный треугольник света на щеке. Для более мягких, женственных образов идеально подойдет soft lighting (мягкое освещение) или volumetric lighting (объёмный свет), который буквально обволакивает модель. Если же цель — показать брутальность и каждую морщинку, то ваш выбор — hard light (жёсткий свет) или side lighting (боковое освещение). Кинематографичность кадру придаст cinematic lighting в сочетании с global illumination. И всё же, главное — не перебарщивать. Слишком сложная схема света может запутать нейросеть, создав тени там, где их быть не должно.

Готовые формулы: Фотореализм

Создать промт с нуля — задача не из лёгких. Особенно для новичка. Поэтому разберем структуру надёжного запроса на примере классического портрета.

Представьте, что нам нужно получить фото молодой женщины с естественной красотой. Начать нужно с главного объекта: Portrait of a young woman with natural makeup. Далее следует блок технических уточнений, который и творит чудеса: extreme close-up, highly detailed skin texture, visible pores, subtle freckles, peach fuzz. Затем мы задаем атмосферу и свет: soft cinematic lighting, bokeh background, shot on 85mm lens, f/1.8, sharp focus on eyes. И, наконец, финальные штрихи качества: 8k, ultra-realistic, raw photo.

Такой подход, разбитый на смысловые блоки, позволяет контролировать каждый аспект изображения. Результат, как правило, получается добротным и требует минимальной доработки.

Стилизация и художественные образы

А что делать, если цель — не фото, а иллюстрация или цифровая живопись? Здесь правила игры немного меняются. Гиперреализм кожи уступает место выразительности мазка и цветовой гамме.

Для создания, скажем, фэнтезийного портрета эльфийки, структура запроса трансформируется. Мы начинаем с описания персонажа: Ethereal elf princess with glowing eyes. Но вместо пор и текстуры кожи вводим художественные токены: digital painting, artstation style, intricate details, smooth strokes. Важно задать стиль освещения, который подчеркнет магию: bioluminescent lighting, dreamy atmosphere. В этом случае «пластиковость» кожи может быть даже уместна, если она оправдана стилистикой, например, porcelain skin (фарфоровая кожа). Тем более, что художественные модели (вроде Niji для Midjourney) сами тяготеют к более идеализированным лицам, и бороться с этим не всегда стоит.

Негативный промт: что исключить?

Бывает так: вы написали идеальный запрос, но нейросеть упорно рисует три глаза или сросшиеся брови. Ложка дёгтя в бочке мёда. В этот момент на сцену выходит негативный промт (Negative Prompt) — список того, чего на изображении быть категорически не должно.

В этот «чёрный список» обязательно стоит внести анатомические ошибки: deformed, bad anatomy, disfigured, mutated. Отдельно стоит упомянуть проблемы с лицом: poorly drawn face, cross-eyed, long neck, asymmetry. Если вы стремитесь к реализму, добавьте в исключения стилистические маркеры, которые могут удешевить картинку: cartoon, 3d, illustration, blur, low quality. Для текстуры кожи полезно исключить smooth skin, airbrushed и plastic. Используя этот инструмент, вы словно ставите барьеры, за которые нейросети запрещено заступать, что значительно повышает шанс на успех.

Технические нюансы: Веса и скобки

Иногда нейросеть просто не слышит вас, игнорируя важные детали. Вы просите веснушки, а их нет. В такой ситуации выручит синтаксис акцентов. В большинстве нейросетей (Stable Diffusion, Midjourney) использование круглых скобок усиливает вес слова.

Запись вида (freckles:1.3) говорит алгоритму, что этот токен на 30% важнее остальных. Если же нужно, наоборот, ослабить влияние какого-то элемента, вес можно понизить, написав (wrinkles:0.8). Это позволяет очень тонко настраивать баланс черт лица. Например, чтобы подчеркнуть глаза, можно написать (detailed eyes:1.2), а чтобы сделать макияж менее вызывающим — (heavy makeup:0.5). Такая скрупулёзная работа напоминает настройку эквалайзера, где каждый ползунок отвечает за свою частоту восприятия.

Влияние ракурса на восприятие лица

От того, как камера смотрит на модель, зависит геометрия лица. Широкоугольный объектив при съёмке в упор неизбежно исказит пропорции, сделав нос огромным, а уши маленькими. Это физика оптики, которую нейросети, к слову, усвоили отлично.

Чтобы лицо выглядело благородно и пропорционально, лучше отказаться от короткофокусных линз в промте. Оптимальным выбором станут портретные фокусные расстояния. Указание shot on 85mm или 100mm lens даст правильную компрессию перспективы, лицо станет более плоским в хорошем смысле этого слова, а задний план красиво размоется. Если же нужен эффект присутствия и динамики, можно попробовать 35mm, но тогда стоит быть готовым к лёгким перспективным искажениям. А вот fish eye (рыбий глаз) гарантированно превратит портрет в шарж, если только это не является вашей художественной задумкой.

Как быть с «эффектом зловещей долины»?

Натыкаешься иногда на генерацию: вроде всё правильно, текстура есть, свет стоит, но смотреть на лицо неприятно. Оно вызывает подсознательную тревогу. Это и есть эффект «зловещей долины» — когда объект выглядит почти как человек, но мелкие несоответствия выдают в нём искусственность.

Часто причина кроется в излишней симметрии. Живые лица никогда не бывают идеально симметричными. Одна бровь чуть выше другой, уголок рта приподнят… Нейросети же тяготеют к зеркальной идеальности. Чтобы разбить эту искусственность, можно добавить в промт эмоции или действия: slight smirk (легкая ухмылка), raised eyebrow (приподнятая бровь), wind blowing hair (ветер раздувает волосы). Асимметрия, вызванная мимикой или окружением, делает лицо живым. Также помогает добавление несовершенств вроде scar (шрам) или asymmetrical features, хотя с последним нужно быть осторожным, чтобы не получить монстра.

Стоит ли использовать имена знаменитостей?

Существует приём, к которому прибегают многие: смешивание имен известных актеров или моделей для получения красивого лица. Mix of Angelina Jolie and Brad Pitt — звучит дико, но результат может быть интересным.

Действительно, нейросеть отлично знает лица звёзд. Их фотографий в датасете — кладезь. Использование имен помогает зафиксировать черты лица, сделать их более стабильными и узнаваемыми. Однако здесь есть подводные камни. Во-первых, вы рискуете получить узнаваемого клона, что не всегда хорошо с точки зрения авторских прав и уникальности. Во-вторых, нейросеть может перетянуть из фото знаменитости не только лицо, но и стиль, макияж или даже типичное освещение. Поэтому, если вы решите использовать этот метод, лучше смешивать два-три имени, добавляя к ним описание типажа, например, face structure of Margot Robbie blended with Ana de Armas. Это позволит создать новый, уникальный образ, взяв лучшее от исходников, но не скатываясь в прямое копирование.

Роль разрешения и апскейлинга

Часто бывает так, что на превью лицо выглядит плохо, но стоит сделать апскейл (увеличение разрешения), как детали проступают, и глаза встают на место. Дело в том, что при генерации низкого разрешения нейросети просто не хватает пикселей, чтобы прорисовать зрачок или ресницы.

Многие современные инструменты имеют функцию Hires.fix или встроенные апскейлеры, которые перерисовывают изображение с большей детализацией. Не скупитесь на ресурсы видеокарты. Генерация сразу в высоком разрешении или последующая доработка через Inpaint (когда перерисовывается только область лица) — это, пожалуй, самый действенный метод исправления ошибок. В промт для этого этапа можно добавить intricate details и hyperrealistic, чтобы при увеличении нейросеть знала, чем заполнять новые пиксели. Бьёт по бюджету времени это, конечно, ощутимо, но результат окупает все затраты.

Промты для возрастных портретов

Красота не ограничивается молодостью. Генерация пожилых людей — отличный тест для нейросети и проверка навыков промптера. Здесь задача усложняется необходимостью прорисовать сетку морщин, пигментацию и текстуру седых волос.

Добротный промт для такого портрета должен включать слова, подчёркивающие возрастные изменения, но не превращающие человека в дряхлую развалину. Хорошо работают связки dignified elderly man (полный достоинства пожилой мужчина), deep wrinkles (глубокие морщины), weathered skin (обветренная кожа), wise eyes (мудрые глаза). Текстура здесь играет первую скрипку. Слова detailed skin pores и age spots (пигментные пятна) добавят реализма. Освещение лучше выбирать контрастное, например dramatic side lighting, чтобы каждая морщинка читалась как история жизни. Такие портреты часто выглядят гораздо более впечатляюще и художественно, чем очередное лицо юной модели, ведь в них есть характер и биография.

Неочевидные слова-улучшайзеры

Есть ряд слов, которые напрямую не описывают лицо, но магическим образом влияют на общее качество генерации. Это своего рода «приправы», которые усиливают вкус основного блюда.

К таким словам относятся термины из мира профессиональной фотографии и кино. Например, studio lighting (студийный свет) обычно делает кожу более чистой и ухоженной. Токен award winning photography (фотография, получившая награду) заставляет нейросеть подтягивать композицию и цвета к лучшим образцам из обучающей выборки. Слово trending on ArtStation больше подходит для арта, но и в реализме может добавить выразительности. А вот Unreal Engine 5 render часто придаёт изображению невероятную чёткость и объём, хотя и может увести стилистику немного в сторону 3D-графики. Экспериментируйте с этими добавками, но помните: соль хороша в меру. Перегруженный такими тегами промт может стать неуправляемым.

Улучшение лиц в нейросетевой генерации — процесс не сложный, но кропотливый, требующий внимания к мелочам и понимания логики машины. Нет единой волшебной кнопки «сделать красиво», однако набор правильных слов, знание основ фотографии и умение работать с негативными подсказками способны творить настоящие чудеса. Не бойтесь экспериментировать, смешивать стили и ошибаться, ведь каждая неудачная генерация — это лишь шаг к тому самому идеальному портрету, который запомнится надолго. Перевоплощение завершено.