Промт для создания портрета (с примерами готовых промтов)

Создание человеческого лица из цифрового шума сродни древней алхимии, где вместо ртути и серы используются слова, а философским камнем выступает мощная видеокарта или удаленный сервер. Глядя на бесконечный поток одинаковых, словно пластиковых лиц в ленте социальных сетей, невольно задаёшься вопросом: почему у одних получаются шедевры, достойные музейных залов, а у других — лишь безжизненные манекены с пустым взглядом? Проблема зачастую кроется не в выборе нейросети, будь то Midjourney или Stable Diffusion, а в неумении сформулировать запрос так, чтобы алгоритм понял не только букву, но и дух задания. Ведь искусственный интеллект — это исполнительный, но совершенно лишённый фантазии джинн: он сделает ровно то, о чём его попросили, и ни пикселем больше. Но чтобы результат заставил зрителя замереть от восторга, нужно овладеть искусством промпт-инжиниринга.

С чего начинается работа?

Разумеется, с главного героя. Ошибочно полагать, что слово «женщина» или «мужчина» даст вам конкретный образ. Нейросеть, скорее всего, выдаст усреднённый стандарт красоты, который набил оскомину ещё пару лет назад. Начинать стоит с деталей, определяющих харизму. Возраст, этническая принадлежность, особенности внешности — всё это строительные блоки будущего портрета. К слову, довольно эффективно работают уточнения вроде «weather-beaten face» (обветренное лицо) или «freckles» (веснушки). Они придают коже текстуру, лишая её той самой пластиковой гладкости. А если добавить описание эмоции, например, «melancholic look» (меланхоличный взгляд) или «triumphant smile» (торжествующая улыбка), портрет мгновенно оживает.

Важен ли свет?

Безусловно, ведь именно освещение лепит форму. Без грамотно выставленного света даже самая детальная модель превратится в плоское пятно. Львиная доля успеха зависит от того, как именно вы «посветите» на своего персонажа. Кинематографичное освещение (cinematic lighting) создает драматизм и глубину, идеально подходя для сюжетных портретов. Рембрандтовский свет (Rembrandt lighting), характеризующийся узнаваемым треугольником света на щеке, добавляет классической, музейной тяжеловесности и серьёзности. А вот для создания нежных, воздушных женских образов лучше использовать мягкий свет (soft lighting) или естественное освещение (natural light). Отдельно стоит упомянуть объёмный свет (volumetric lighting), который наполняет пространство дымкой и лучами, создавая атмосферу таинственности.

Технические параметры

Для нейросети, как и для живого фотографа, крайне важны настройки «камеры». Вы можете не разбираться в диафрагмах и фокусных расстояниях в реальной жизни, но в промте эти слова творят чудеса. Портретная классика — это объектив 85mm. Указав этот параметр, вы заставите алгоритм соблюсти правильные пропорции лица, избежав комичных искажений, свойственных широкому углу. Дополняет этот технический набор значение диафрагмы, например, f/1.8 или f/2.8. Это обеспечит красивое боке (bokeh) — размытый фон, который отделяет модель от заднего плана и приковывает внимание к глазам. Высокая детализация также задается словами: 4k, 8k, high quality, ultra realistic. Эти маркеры работают как сигнал для системы: «не экономить ресурсы на прорисовку мелких морщинок и ресниц».

Стилизация изображения

Здесь поле для экспериментов поистине безгранично. Выбор стиля определяет общее настроение и восприятие картинки. Фотореализм (photorealistic) заставляет зрителя гадать, человек перед ним или цифра. Киберпанк (cyberpunk) окунает в неоновые огни и мир высоких технологий, добавляя на лица хромированные детали и светящиеся импланты. Эфирная фэнтези-стилистика (ethereal fantasy) подойдёт для создания эльфов, дриад и прочих мифических существ, окружая их мягким свечением и магическими атрибутами. И, конечно же, нельзя не упомянуть имитацию традиционных техник: oil painting (масляная живопись), pencil sketch (карандашный набросок) или watercolor (акварель). Каждое из этих направлений имеет свои нюансы, которые стоит учитывать при составлении текстового описания.

Сложно ли собрать всё воедино?

Да, но только на первых порах. Главное — соблюдать структуру. Сначала объект, затем действие или поза, после — окружение, освещение, стиль и, наконец, технические параметры. Такой «слоёный пирог» информации позволяет нейросети последовательно обрабатывать данные, не путаясь в приоритетах. Хаос в запросе почти всегда приводит к хаосу на изображении. А вот чёткая иерархия гарантирует предсказуемый и качественный результат. Впрочем, иногда случайная перестановка слов может выдать неожиданно гениальный результат, так что место для здорового хаоса всё-таки стоит оставить.

Реалистичный женский портрет

Рассмотрим конкретный пример запроса для создания живого, дышащего образа. Допустим, нам нужна молодая девушка с рыжими волосами в лучах закатного солнца. Промт может выглядеть следующим образом:

«Portrait of a young woman with messy red hair and green eyes, freckles on cheeks, looking directly at camera, subtle smile, golden hour lighting, sun rays hitting face, detailed skin texture, 85mm lens, f/1.8, bokeh background, photorealistic, 8k, cinematic composition».

Здесь мы видим чёткую логику: от общего описания внешности мы перешли к деталям кожи, задали свет (золотой час), настроили виртуальную камеру и утвердили качество. Результат, скорее всего, порадует естественностью и тёплой атмосферой.

Мужской образ в стиле нуар

Сменим пластинку и попробуем создать что-то мрачное и брутальное. Для этого идеально подойдёт стилистика старого кино или нуарного детектива. Запрос будет строиться на контрастах и тенях. Пример:

«Close-up portrait of an elderly detective wearing a fedora hat, smoking a cigarette, smoke swirls around face, rain in the background, night city street with neon signs reflection, noir style, black and white photography, high contrast, dramatic shadows, sharp focus on eyes, grainy film texture, 35mm photograph».

В данном случае мы специально добавили «grainy film texture» (зернистость плёнки), чтобы уйти от цифровой стерильности и добавить кадру винтажного шарма. А упоминание 35-миллиметровой плёнки подсказывает нейросети, какую именно эстетику мы ищем.

Этнический колорит

Нейросети — настоящий кладезь возможностей для изучения культурных кодов. Попробуем создать портрет пожилой женщины из племени с традиционными украшениями. Такой запрос потребует более скрупулезного подбора слов, описывающих одежду и атрибутику. Вариант промта:

«Portrait of an old tribal african woman, wearing traditional colorful beads and massive earrings, deep wrinkles on face, wise look, traditional patterns on clothes, natural soft lighting, blurred village background, national geographic style, documentary photography, highly detailed, realistic texture».

Упоминание стиля «National Geographic» — это мощный триггер для ИИ, который сразу же подтягивает ассоциативный ряд: документальность, насыщенные цвета, глубокий психологизм и акцент на человеке в его естественной среде обитания.

Фэнтезийный персонаж

А что, если нам нужно уйти от реальности? Создание эльфа или мага требует иной лексики. Здесь в ход идут эпитеты, связанные с магией и неземной красотой. Пример для вдохновения:

«Ethereal portrait of a high elf male, long silver hair, glowing blue eyes, intricate silver armor with magical runes, mystical forest background, fireflies, moonlight, fantasy art style, digital painting, similar to World of Warcraft art, Greg Rutkowski style, smooth finish, volumetric fog».

Обратите внимание на упоминание конкретного художника (Greg Rutkowski). Хотя этическая сторона вопроса использования имен художников вызывает споры, технически это один из самых простых способов задать нужную стилистику мазка и работы со светом.

Как избежать ошибок?

Довольно часто новички пытаются впихнуть в один промт все известные им красивые слова. Получается винегрет. «Cyberpunk, oil painting, realistic, cartoon» — такая смесь приведет алгоритм в замешательство. Он выдаст нечто среднее и, скорее всего, уродливое. Не стоит перебарщивать. Лучше выбрать один доминирующий стиль и пару вспомогательных. Ещё один нюанс — негативные промты (negative prompts). Это то, чего вы НЕ хотите видеть на картинке. В интерфейсах многих нейросетей для этого есть отдельное поле. Туда стоит вписать: «ugly, deformed, extra fingers, blurry, low quality, watermark, text, bad anatomy». Это своего рода страховка от брака. Не пренебрегайте этим инструментом, он экономит время и нервы.

Влияние соотношения сторон

Многие забывают, что формат кадра тоже является частью промта (в виде параметров --ar в Midjourney или настроек в SD). Вертикальный формат (2:3 или 9:16) идеален для ростовых портретов или погрудных планов, так как оставляет пространство для «воздуха» над головой и телом. Квадрат (1:1) — классика для социальных сетей, акцентирующая внимание на центре композиции. А вот широкий формат (16:9) дает возможность вписать портрет в контекст окружения, создавая кинематографичную историю. Выбор соотношения сторон должен диктоваться не только тем, куда вы запостите картинку, но и самой композиционной задумкой. Ведь широкий кадр с одинокой фигурой сбоку создает ощущение одиночества, а тесный вертикальный кроп — чувство интимности или, наоборот, клаустрофобии.

Психология взгляда

Куда смотрит ваш герой? Это деталь, которая меняет всё восприятие. «Looking at camera» (смотрит в камеру) создает прямой контакт со зрителем, порой даже вызывающий или пронизывающий. Это сильный прием для волевых портретов. «Looking away» (смотрит в сторону) добавляет задумчивости, отстраненности, словно человек погружен в свои мысли. «Looking up» (взгляд вверх) часто ассоциируется с надеждой, мольбой или мечтательностью. Управляя взглядом через промт, вы управляете эмоцией зрителя. И это мощный инструмент. Не забывайте уточнять и состояние глаз: «teary eyes» (глаза с поволокой, в слезах) или «closed eyes» (закрытые глаза) кардинально меняют нарратив.

Роль цвета в портрете

Цветовая палитра задает тон ещё до того, как мы разглядим черты лица. Использование конкретных цветовых схем в промте — признак мастерства. Можно использовать термины вроде «monochromatic blue» (монохромный синий) для создания холодной, депрессивной или технологичной атмосферы. Или же «warm earth tones» (теплые земляные тона) для уюта и надёжности. Сложные сочетания, такие как «teal and orange» (бирюзовый и оранжевый), мгновенно отсылают нас к современному голливудскому блокбастеру. А пастельные тона (pastel colors) сделают изображение мягким и легким. Не бойтесь экспериментировать с неожиданными сочетаниями, ведь иногда розовый неон отлично ложится на суровый мужской портрет, создавая интересный смысловой контраст.

Эксперименты с материалами

Нейросети позволяют создавать портреты не только из плоти и крови. Почему бы не попробовать сделать лицо из дыма, воды или цветов? Промты вроде «portrait made of swirling smoke» или «face formed by flowers and leaves» открывают дверь в сюрреализм. Это уже не просто портрет, а метафора. «Statue of marble» (мраморная статуя) с добавлением «cracked» (треснувшая) и «gold filling cracks» (золото, заполняющее трещины — отсылка к кинцуги) может рассказать историю о пережитой боли, которая сделала человека ценнее. Такая работа с фактурами требует фантазии, но результат оправдывает самые смелые ожидания. Ведь в цифровом мире материя подчиняется только вашей воле.

Финальные штрихи

Не стоит забывать и про пост-обработку, но фундамент закладывается именно в текстовом поле генератора. Хороший промт — это не просто набор тегов, это небольшая история, рассказанная языком машины. Это мост между вашим воображением и возможностями кремниевого мозга. И чем точнее вы настроите этот мост, тем быстрее перейдёте на сторону искусства. Пробуйте, смешивайте несовместимое, ошибайтесь и начинайте заново. В конце концов, каждый неудачный кадр приближает вас к тому самому шедевру, который заставит вас гордиться проделанной работой. Удачи в творческих поисках, и пусть ваши генерации всегда вызывают только восхищение!