Промт для портрета (с примерами готовых промтов)

Сложно ли получить шедевр с первой попытки, просто написав в строке генерации слово «красивая девушка»? Довольно сложно, ведь вместо ожидаемого фотореализма на экране довольно часто появляется пластиковая кукла с безжизненным взглядом или анатомическими странностями. В сети представлено множество руководств, обещающих «волшебную кнопку», но опытный пользователь знает: нейросеть — это не телепат, а исполнительный, но порой слишком буквальный художник, которому требуется чёткое техническое задание. Разочарование от потраченных кредитов или времени генерации знакомо каждому, кто пытался наскоком взять бастион AI-арта. Но чтобы не полагаться на волю случая и рандомайзера, стоит разобраться в анатомии правильного запроса, который превратит хаос пикселей в произведение искусства.

С чего начинается выбор?

С определения главного героя начинается любой качественный промт. Обыватель часто ограничивается парой слов, описывающих пол и возраст, но для нейросети этого катастрофически мало. Ведь алгоритму нужно за что-то зацепиться. Поэтому описание внешности должно быть скрупулезным, но не перегруженным. Стоит указать этническую принадлежность, цвет глаз, форму прически и даже эмоциональное состояние. К слову, именно эмоция часто оживляет картинку, спасая её от эффекта «зловещей долины». Львиная доля успеха зависит от деталей кожи: веснушки, морщинки, поры или легкий румянец делают лицо живым. Фразы вроде «highly detailed skin texture», «pores», «freckles» или «imperfect skin» творят чудеса. А вот идеальная симметрия, к которой тяготеет ИИ, часто выглядит искусственно, так что лёгкая асимметрия в запросе порой идёт только на пользу.

Свет и стиль: важные детали

Освещение в портрете играет роль даже более значимую, чем в пейзаже. Грезят новички о «хорошем свете», но забывают уточнить, каком именно. А ведь вариантов масса. Кинематографичное освещение (cinematic lighting) придаст кадру драматизм и объём, в то время как мягкий свет (soft lighting) сгладит недостатки и создаст романтичный антураж. Особый интерес вызывает рембрандтовский свет (Rembrandt lighting), создающий характерный треугольник света на щеке — это классика, которая делает портрет выразительным и глубоким. Если же хочется чего-то современного и дерзкого, стоит попробовать неоновое освещение (neon lighting) или драматичные тени (dramatic shadows). Без указания света нейросеть выберет усредненный, плоский вариант, который вряд ли прикует внимание зрителя. Ну и, конечно же, нельзя забывать про цветовую палитру (color grading), которая задает общее настроение снимка.

Технические параметры

Казалось бы, зачем указывать характеристики камеры, если никакой камеры нет? Дело в том, что нейросети обучались на миллионах реальных фотографий, и теги с техническими параметрами служат для них отличным ориентиром. Портреты традиционно снимают на длиннофокусные объективы. Поэтому указание «85mm lens» или «100mm lens» подскажет алгоритму, что нужно размыть фон и сжать перспективу, чтобы лицо выглядело пропорциональным. А вот широкий угол (например, 35mm) может исказить черты лица, сделав нос непропорционально большим, хотя для ростовых портретов это вполне допустимо. Значение диафрагмы, скажем, «f/1.8» или «f/2.8», обеспечит то самое красивое боке (bokeh), которое так любят фотографы. Дополняет образ упоминание конкретных моделей камер, например, «shot on Sony A7R IV» или «Kodak Portra 400» для имитации пленочного зерна. Это же правило касается и разрешения: теги «8k», «ultra realistic», «UHD» дают сигнал генерировать изображение с высокой детализацией.

Реалистичный женский портрет

Попробуем собрать всё воедино и рассмотреть конкретный пример запроса для создания фотореалистичного женского образа. Задача не из лёгких. Но решаемая. Нам нужно получить живое лицо, естественный свет и качественный фон. Промт может выглядеть следующим образом:

Close-up portrait of a 25-year-old Scandinavian woman with platinum blonde hair, blue eyes looking at the camera, light freckles on cheeks, natural makeup. Soft morning window light, cinematic lighting, volumetric atmosphere. Shot on Canon EOS R5, 85mm lens, f/1.8, depth of field, sharp focus on eyes, hyper-realistic, 8k resolution

Здесь каждое слово стоит на своем месте. Сначала мы задали объект, уточнили детали внешности (веснушки, макияж), затем выставили свет (утренний, от окна) и закрепили результат техническими тегами. Такой подход гарантирует добротный результат, который не стыдно показать даже профессиональному фотографу.

Мужской характерный портрет

Мужские портреты часто требуют иной стилистики — более жёсткой, фактурной и контрастной. Здесь уместно сделать акцент на возрасте и жизненном опыте, отраженном на лице. Рассмотрим такой вариант:

Portrait of an elderly fisherman with a white beard and deep wrinkles, wearing a yellow raincoat and a wool beanie. Raindrops on face, stormy sea background, gloomy weather. Dramatic lighting, harsh shadows, high contrast. Rough skin texture, intense gaze. Photorealistic, shot on 35mm film, grainy texture, noir style, highly detailed

В данном случае мы использовали погодные условия и одежду для создания истории. «Raindrops on face» (капли дождя на лице) и «rough skin texture» (грубая текстура кожи) добавляют невероятный уровень реализма. Это впечатляет. Ведь зритель буквально чувствует холод и сырость через экран.

Фантастические образы

Однако спектр объектов не ограничивается только людьми из нашего мира. Нейросети — это настоящий кладезь для любителей фэнтези и научной фантастики. При создании, например, эльфийки или киборга, важно сохранять баланс между вымыслом и реализмом текстур. Пример промта для киберпанк-стилистики:

Portrait of a cyborg girl with neon glowing implants on face, pink synthetic hair, futuristic metal skin parts. Night cyberpunk city background with bokeh lights, neon blue and pink lighting. Unreal Engine 5 render, octane render, ray tracing, futuristic fashion, intricate details, cinematic composition

Теги «Unreal Engine 5» и «octane render» здесь работают как маркеры для создания 3D-графики высочайшего уровня, а не просто фотографии. Результат получается сочным, ярким и технологичным. Само собой, можно экспериментировать с расами, добавляя «elven ears» (эльфийские уши) или «alien skin» (кожа пришельца), но не стоит забывать про качество рендера.

Стилизация под живопись

Иногда хочется уйти от фотореализма и окунуться в мир высокого искусства. Имитация живописи требует указания конкретных техник или имен художников. Просто написать «art» — значит получить нечто среднее и невыразительное. Лучше действовать тоньше. Пример:

Oil painting portrait of a Victorian lady in a red velvet dress, lace collar. Style of John Singer Sargent and Greg Rutkowski. Visible brush strokes, rich colors, heavy texture, canvas texture. Dramatic lighting, classical art, masterpiece

Упоминание «visible brush strokes» (видимые мазки кисти) и «canvas texture» (текстура холста) заставит ИИ имитировать физические свойства картины. А имена художников зададут направление стиля. Грег Рутковски, кстати, является одним из самых популярных референсов для нейросетей благодаря своему узнаваемому стилю, сочетающему классику и фэнтези.

Что насчёт ошибок?

Даже идеальный промт может быть испорчен, если не учитывать так называемые негативные промты (negative prompt) — то, чего на картинке быть не должно. В интерфейсах вроде Stable Diffusion для этого есть отдельное поле, а в Midjourney используется параметр «–no». В список исключений стоит обязательно внести: «ugly, deformed, disfigured, extra fingers, bad anatomy, blurry, watermark, text, low quality, pixelated». Это своего рода спасательный круг, который отсекает откровенный брак. Тем более, что нейросети часто «грешат» созданием лишних конечностей или размытых участков. Отдельно стоит упомянуть проблему перегруженности запроса. Не стоит пытаться впихнуть в один промт все известные вам красивые слова. Наляпистость тегов может сбить алгоритм с толку, и он просто проигнорирует половину написанного. Лучше меньше, да точнее.

Вредно ли копировать чужие промты?

Многие новички начинают с того, что полностью копируют чужие успешные запросы. С одной стороны, это отличный способ обучения — разобрать «по косточкам», как автор добился такого эффекта. Но с другой стороны, слепое копирование убивает креативность. Да и результат, скорее всего, будет отличаться, ведь генерация всегда содержит элемент случайности (seed). Гораздо полезнее использовать чужие наработки как каркас, добавляя в них свою изюминку. Замените локацию, поменяйте время суток или стиль одежды — и вот уже перед вами совершенно новая, уникальная работа. Махинации с параметрами веса (когда одному слову придается большее значение, чем другому) тоже приходят с опытом и позволяют тонко настраивать результат.

Нюансы разных нейросетей

Нельзя не упомянуть, что разные модели «понимают» язык по-разному. Midjourney, например, тяготеет к более художественным и образным описаниям, прощая неточности в синтаксисе. Ей можно «скармливать» даже стихи или абстрактные понятия, и она выдаст нечто грандиозное. Stable Diffusion же, напротив, любит точность, конкретные теги и порядок слов. Здесь слово, стоящее в начале промта, имеет гораздо больший вес, чем слово в конце. Поэтому самое важное — объект и стиль — всегда выносим вперед. А второстепенные детали оставляем «на закуску». DALL-E 3 от OpenAI вообще понимает естественный язык лучше всех и с ним можно общаться как с собеседником, просто описывая сцену обычными предложениями без нагромождения технических терминов.

Генерация портрета — это увлекательный процесс поиска и эксперимента, где каждая замена слова может кардинально изменить итог. Не бойтесь ошибаться, ведь именно на неудачных генерациях мы учимся понимать логику искусственного интеллекта. Пробуйте смешивать несочетаемое, играйте со светом и стилями, и рано или поздно на экране появится тот самый образ, который вы представляли в голове. Ваша идеальная галерея цифрового искусства уже ждёт своего создания, а каждый новый запрос станет отличным решением на пути к мастерству. Удачи в творческих поисках!