Промт для красивого портрета (с примерами готовых промтов)

Создание идеального изображения с помощью нейросети порой напоминает лотерею, где вместо ожидаемого шедевра на экране появляется нечто с тремя руками или пугающим взглядом. В сети представлено множество руководств, обещающих «волшебную кнопку», но на практике генерация качественного портрета — это не магия, а скорее точная наука, замешанная на лингвистике и визуальном вкусе. Обыватель часто думает, что достаточно написать «красивая девушка», и искусственный интеллект всё сделает сам, однако алгоритм воспринимает наши слова слишком буквально, игнорируя контекст, который кажется нам очевидным. И разочарование здесь неизбежно. Но чтобы не ошибиться и получить результат, достойный обложки журнала, нужно научиться говорить с машиной на её языке, используя правильные структуры и ключевые слова.

С чего начинается выбор?

С определения главного объекта и его характеристик, разумеется. Казалось бы, всё довольно просто. Но именно на этом этапе совершается львиная доля ошибок. Ведь нейросеть — это всего лишь исполнитель, лишенный воображения в человеческом понимании. Если вы не укажете детали, она заполнит пустоты случайным шумом. Первым делом стоит обозначить не только пол и возраст, но и этническую принадлежность, цвет волос, форму прически и даже эмоцию. Скупое описание «мужчина в костюме» даст вам усреднённый, скучный образ. А вот «пожилой джентльмен с глубокими морщинами, мудрым взглядом, в твидовом пиджаке» — это уже заявка на характерный портрет.

Кстати, важный нюанс касается глаз. Это зеркало души (даже цифровой). Чтобы взгляд не был стеклянным или расфокусированным, стоит добавить уточнения вроде «detailed eyes» (детализированные глаза) или «expressive look» (выразительный взгляд). Использование таких маркеров помогает алгоритму сконцентрировать вычислительные ресурсы на лице, прорабатывая текстуру кожи и радужку. Да и самому портрету это придает живость. Тем более, что современные модели отлично понимают анатомические термины.

Освещение

Свет. Задача не из лёгких. Именно он лепит форму и создает атмосферу. Без правильного освещения даже самая детальная модель будет выглядеть плоской. Обязательно ли быть профессиональным фотографом, чтобы расставить виртуальные источники света? Вовсе нет. Достаточно знать несколько базовых схем. Один из самых популярных видов — это «cinematic lighting» (кинематографичное освещение). Оно придает кадру драматизм и глубину, создавая интересные тени.

Далее следует упомянуть «Rembrandt lighting» (рембрандтовское освещение). Это классика. Характеризуется оно тем самым знаменитым треугольником света на щеке, который так любили старые мастера и современные портретисты. Если же ваша цель — мягкий, комплиментарный портрет без резких теней, то выручит «softbox lighting» или «natural light» (естественный свет). Ну и, наконец, для любителей киберпанка и неона незаменимым станет «volumetric lighting» (объёмный свет), который добавляет в воздух частички пыли или тумана, делая лучи видимыми. К слову, игра с цветовой температурой тоже творит чудеса: «warm lighting» (тёплый свет) сделает образ уютным, а «cool blue tone» (холодный синий тон) добавит отстраненности и загадочности.

Стилизация и художественные приемы

Какой стиль выбрать? Здесь поле для экспериментов поистине безгранично. Можно пойти по пути гиперреализма, требуя от нейросети фотографической точности. В этом случае в промте должны фигурировать такие слова, как «photorealistic», «8k», «ultra detailed», «RAW photo». Это довольно надёжный способ получить изображение, которое сложно отличить от снимка. Антураж в таком случае должен соответствовать реальности, чтобы не возникало диссонанса.

С другой стороны, существует огромный пласт художественных стилизаций. Например, имитация масляной живописи («oil painting») с густыми мазками и богатой фактурой. Или же нежная, воздушная акварель («watercolor sketch»), где границы размыты, а цвета перетекают друг в друга. Отдельно стоит упомянуть цифровое искусство («digital art»), которое тяготеет к эстетике компьютерных игр и концепт-артов. Здесь уместны такие маркеры, как «Octane render» или «Unreal Engine 5», намекающие алгоритму на необходимость создания сложной, трёхмерной картинки с идеальным просчетом отражений. А если ещё вспомнить про стили конкретных художников (например, «style of Alphonse Mucha»), то можно получить поистине уникальный, изысканный результат.

Технические параметры

Влияет ли «железо» на результат? В контексте генерации — да, но речь идет о виртуальном оборудовании. Упоминание конкретных моделей камер и объективов — это своего рода лайфхак, позволяющий управлять геометрией кадра. Ведь оптика имеет свои физические свойства, и нейросети об этом знают. Для портретов золотым стандартом считается фокусное расстояние 85mm или 100mm. Оно позволяет избежать искажений пропорций лица, которые неизбежны при использовании широкого угла.

Кроме того, стоит поиграть с диафрагмой. Указание «f/1.8» или «f/2.8» даст вам красивое размытие фона (боке), которое отделит модель от заднего плана и акцентирует внимание на глазах. Это довольно эффективный приём, придающий кадру профессиональный лоск. Также не стоит забывать о типе плёнки, если вы стремитесь к винтажной эстетике. Маркеры вроде «Kodak Portra 400» или «Fujifilm» добавят характерное зерно и специфическую цветопередачу, которую так ценят фотографы. Это, безусловно, вкусовщина, но именно такие мелочи делают картинку «вкусной» и живой.

Примеры готовых решений

Теперь перейдем к практике. Теория — это хорошо, но наглядность лучше. Ниже приведены варианты, которые можно использовать как базу, адаптируя под свои нужды. Главное — понимать структуру.

Для получения классического, добротного фотопортрета девушки в городском окружении, стоит попробовать такую конструкцию:

Промт: «Portrait of a beautiful young woman with freckles and chaotic red hair, standing on a rainy New York street at night. She is wearing a beige trench coat. Cinematic lighting, neon reflections in puddles, shot on 85mm lens, f/1.8, bokeh background, hyperrealistic, 8k, high detail skin texture».

Обратите внимание, как здесь наслаиваются детали: сначала объект, потом окружение, затем свет и технические параметры.

Если же душа просит чего-то сказочного, фэнтезийного, то подход меняется. Здесь мы делаем упор на художественность и атмосферу. Примерный запрос может выглядеть так:

Промт: «Ethereal elven princess with silver long hair and glowing blue eyes, wearing intricate organic armor made of roots and crystals. Magic forest background with fireflies. Soft moonlight, mystical atmosphere, digital painting, artstation style, sharp focus, intricate details, fantasy art».

Тут уже нет технических параметров камеры, зато есть слова, задающие настроение и стиль.

А вот для любителей сурового мужского портрета в студийном стиле подойдет следующий вариант:

Промт: «Close-up portrait of a bearded brutal man with a scar on his cheek, intense gaze directly into camera. Dark studio background. Rim lighting, dramatic shadows, high contrast, black and white photography, detailed pores, rugged texture, masculine features, masterpiece».

Такой промт, к слову, отлично работает для создания характерных, эмоционально заряженных образов.

Распространённые ошибки

Чего делать не стоит? В погоне за качеством многие пользователи совершают одну и ту же ошибку — перегружают промт. Кажется, что чем больше слов, тем лучше. Но на самом деле нейросеть может «запутаться» в обилии противоречивых инструкций. Не стоит писать «beautiful» десять раз в разных вариациях. Лучше использовать один точный синоним, например, «gorgeous» или «stunning». Также следует избегать слишком абстрактных понятий, которые машина может трактовать двояко.

Ещё один подводный камень — конфликт стилей. Если вы напишете «photorealistic oil painting» (фотореалистичная масляная живопись), результат может быть непредсказуемым и странным. Алгоритм попытается совместить несовместимое: текстуру холста и цифровую четкость. Разумеется, иногда из этого рождаются шедевры, но чаще — визуальный шум. Лучше придерживаться одной генеральной линии. Ну и, конечно же, не забывайте про негативные промты (negative prompt). Это ваш спасательный круг. Туда стоит вписать всё то, чего вы не хотите видеть: «deformed hands», «extra fingers», «bad anatomy», «blur», «watermark». Это отсечёт львиную долю брака.

Как улучшить результат?

Можно ли довести картинку до идеала с первого раза? Честно говоря, довольно редко. Генерация — это процесс итеративный. Приходится пробовать, менять слова местами, играть с весами (коэффициентами значимости слов). Иногда простая перестановка слова в начало предложения меняет суть изображения кардинально. Ведь нейросеть придает больший вес тем токенам, которые стоят первыми. Поэтому самое важное выносим вперед.

Также полезно использовать референсы. Многие модели позволяют загружать исходное изображение, на которое должен опираться искусственный интеллект. Это помогает задать композицию и цветовую гамму гораздо точнее, чем словами. Однако не стоит ожидать точной копии. Нейросеть — это творец, а не ксерокс. Она всегда внесет свою лепту, добавит своё «видение». И в этом, пожалуй, есть своя изюминка. Впрочем, иногда полезно использовать функцию «upscale» (увеличение разрешения) не только для размера, но и для добавления деталей. При апскейле алгоритм часто дорисовывает мелкие текстуры кожи или ткани, делая портрет завершенным.

Сложная, но увлекательная задача — найти свой собственный стиль общения с нейросетью. Это требует времени и терпения. Бьёт ли это по бюджету времени? Безусловно. Но результат того стоит. Когда из цифрового хаоса вдруг проступает лицо, смотрящее на вас с пугающей реалистичностью, понимаешь всю мощь современных технологий.

Экспериментируйте смелее, меняйте стили, смешивайте эпохи и техники. Пусть ваши запросы будут неожиданными и дерзкими. Ведь именно в процессе поиска рождаются самые впечатляющие образы, которые потом разлетаются по сети. Удачного творчества, и пусть каждый сгенерированный портрет станет маленьким произведением искусства, которым захочется гордиться.