Создание человеческого лица, которого никогда не существовало в реальности, ещё пару лет назад казалось чем-то из области научной фантастики, доступной лишь избранным студиям спецэффектов. Сегодня же любой желающий может сгенерировать портрет, неотличимый от работы профессионального фотографа, буквально за несколько секунд. Однако на практике новички довольно часто сталкиваются с разочарованием: вместо глубокого, живого взгляда нейросеть выдает «пластиковую» кожу, стеклянные глаза или вовсе анатомические курьезы с лишними пальцами. Казалось бы, ввел запрос «красивая девушка» — и готово. Но алгоритм мыслит иначе. Он не понимает абстрактной красоты, он оперирует токенами, весами и математическими векторами. А значит, чтобы получить действительно добротный результат, нужно научиться говорить с машиной на её языке, избегая двусмысленностей и общих фраз.
Что такое хороший промт?
Многие считают, что чем длиннее описание, тем лучше результат. На самом деле это довольно распространённое заблуждение. Ведь нейросеть, будь то Midjourney или Stable Diffusion, имеет ограничение по количеству токенов, которые она может «осознать». Перегруженный запрос часто приводит к тому, что алгоритм просто игнорирует половину слов, смешивая остальное в непредсказуемую кашу. Эффективный промт — это не сочинение на тему, а чёткая инструкция, где каждое слово имеет вес. Структура здесь играет решающую роль. Сначала идет главный объект (субъект), затем — детали окружения, следом — технические характеристики (камера, свет) и, наконец, стилизация. Важно ли соблюдать этот порядок? Безусловно. Чем ближе слово к началу запроса, тем большее влияние оно оказывает на финальную картинку.
Свет и атмосфера
Освещение. Именно оно задает настроение всему портрету. Без указания типа света вы рискуете получить плоское, скучное изображение, похожее на фото на паспорт.
Первый вариант, который стоит рассмотреть, — это «Cinematic lighting» (кинематографичное освещение). Оно придает кадру драматизм и глубину. Если же хочется чего-то более мягкого и естественного, отлично подойдет «Golden hour» (золотой час) — время перед закатом, когда свет становится тёплым и обволакивающим. Для студийных портретов профессионалы часто используют «Rembrandt lighting» (рембрандтовский свет), который создает характерный треугольник света на щеке модели и глубокие тени. А вот если ваша цель — футуристичный или киберпанк образ, то без «Neon lights» (неоновый свет) или «Volumetric lighting» (объёмный свет) тут не обойтись. И всё же, не стоит перебарщивать. Слишком много источников света могут превратить лицо в новогоднюю ёлку.
Выбор техники и ракурса
Нейросеть знает все существующие объективы и камеры. И этим грех не воспользоваться. Обыватель часто забывает про этот нюанс, но именно технические параметры делают картинку фотореалистичной.
Снимают ли портреты на широкий угол? Редко, если только не нужна специфическая дисторсия. Классикой жанра считается фокусное расстояние 85mm или 100mm. Указав в промте «85mm lens», вы дадите понять алгоритму, что пропорции лица должны быть правильными, а фон — слегка размытым. Кстати, о размытии. Добавить глубины поможет термин «Bokeh» (боке) или «Depth of field» (глубина резкости). Если же вы хотите получить макроснимок глаза или текстуры кожи, смело пишите «Macro photography» или «Close-up». Львиная доля успеха зависит именно от правильного позиционирования виртуальной камеры. К слову, детализацию можно усилить, добавив название конкретной высококлассной камеры, например, «Sony A7R IV» или «Kodak Portra 400» (если нужна имитация пленки).
Реализм: примеры и разбор
Добиться фотореализма — задача не из лёгких. Главный враг здесь — идеальная кожа. Живые люди имеют поры, морщинки, родинки и несовершенства. Поэтому в промтах для реалистичных портретов обязательно стоит использовать слова «highly detailed skin», «skin texture», «pores», «imperfections».
Рассмотрим готовый пример. Допустим, нам нужен портрет пожилого рыбака. Промт может выглядеть так:
“Portrait of an old weathered fisherman, deep wrinkles, grey beard, wearing a yellow raincoat, rainy weather, storm in background, hyperrealistic, shot on 35mm lens, sharp focus, cinematic lighting, raw photo, 8k.”
Здесь мы видим четкую структуру. Субъект (старый рыбак), детали внешности (морщины, борода), одежда и окружение (дождевик, шторм), и, наконец, технические параметры.
А вот пример для женского портрета с упором на естественность:
“Close-up portrait of a young scandinavian woman, freckles, blue eyes, messy blonde hair, natural makeup, soft morning light, window reflection, shot on Canon EOS R5, 85mm f/1.2, detailed skin texture, realistic.”
Заметьте, уточнение диафрагмы «f/1.2» подсказывает нейросети, что фон должен быть сильно размыт, акцентируя внимание только на глазах и лице.
Стилизация: от масла до киберпанка
Но не реализмом единым жив мир генеративного искусства. Иногда хочется создать что-то сказочное или, наоборот, техногенное. Здесь в игру вступают имена художников и названия стилей.
Хотите получить портрет в стиле классической живописи? Используйте имена мастеров. «Painted by John Singer Sargent» или «Oil painting style».
Пример промта для живописного портрета:
“Oil painting of a victorian noblewoman, elegant dress, lace details, intricate jewelry, moody atmosphere, brush strokes visible, classic art style, dark background, soft lighting.”
А вот для любителей научной фантастики подойдет совершенно иной набор лексем. Здесь правят бал неон, хром и синтетика.
Пример киберпанк-портрета:
“Cyberpunk girl with cybernetic implants, neon hair, futuristic city background, night, rain, wet skin reflection, volumetric fog, purple and blue color palette, intricate details, octane render, unreal engine 5.”
Слова «octane render» и «unreal engine 5» — это своего рода маркеры для нейросети, указывающие на то, что картинка должна выглядеть как современная 3D-графика высочайшего качества.
Отрицательные промты (Negative Prompt)
Обойти стороной эту тему было бы преступлением. Негативный промт — это тот самый спасательный круг, который не дает вашей генерации утонуть в ошибках. Это список того, чего на картинке быть НЕ должно.
Обязательно ли его заполнять? В 90% случаев — да. Иначе вы рискуете получить размытые лица на заднем плане, лишние конечности или странные логотипы.
Стандартный, но действенный набор для портретов выглядит примерно так:
“Ugly, deformed, noisy, blurry, low contrast, text, watermark, bad anatomy, extra fingers, missing fingers, cross-eyed, plastic skin, cartoon, illustration.”
Использование этих слов отсекает все «мусорные» варианты, заставляя нейросеть фокусироваться на качестве. Особенно это касается пункта «plastic skin» (пластиковая кожа), который является настоящим бичом цифровых портретов.
Нюансы работы с версиями
Технологии не стоят на месте. То, что работало в Midjourney v4, может давать иной результат в v6 или в модели FLUX. Новые версии нейросетей стали гораздо лучше понимать естественный язык.
Если раньше приходилось писать рублеными фразами через запятую, то сейчас вполне допустимо использовать предлоги и связки. Например, вместо «girl, red dress, forest» можно написать «A girl wearing a red dress standing in a dark forest».
Однако не стоит забывать, что логика построения кадра остается прежней. Субъект всегда солирует. К слову, в последних версиях стоит быть аккуратнее с весами (коэффициентами значимости слов). Не стоит перегружать промт десятком скобок и двоеточий, если вы не до конца понимаете, как это работает. Простота и конкретика зачастую дают более внушительный результат, чем сложная математическая формула.
Дополнительные модификаторы
Есть слова, которые буквально творят чудеса, добавляя изображению лоска. Их называют модификаторами качества. К таким относятся: «Masterpiece» (шедевр), «Trending on Artstation» (популярное на Artstation — работает для артов), «Award winning photography» (фотография, получившая награду).
Но есть и подводные камни. Использование слишком большого количества таких «усилителей» может сделать картинку пережаренной, слишком контрастной и неестественной. Грань здесь довольно тонкая. Лучше использовать один-два мощных эпитета, чем перечислять весь словарь синонимов слова «красивый».
Интересный эффект дает использование материалов. Попробуйте добавить в описание одежды или окружения такие слова, как «silk» (шёлк), «velvet» (бархат), «rusty metal» (ржавый металл) или «translucent» (полупрозрачный). Нейросети отлично умеют имитировать текстуры, и это добавляет портрету тактильности. Зритель буквально чувствует ткань или холод металла.
Промты для мужских портретов
Мужские портреты имеют свою специфику. Здесь часто делается упор на фактуру, жёсткость света и характер. Излишняя «сглаженность», которая иногда прощается женским портретам, здесь выглядит удручающе.
Попробуем создать образ харизматичного лидера или воина.
“Portrait of a battle-hardened warrior, scars on face, intense gaze, wearing metal armor, intricate engravings, dust and dirt, epic lighting, dark mood, sharp focus, 8k resolution, detailed beard texture.”
Слово «intense gaze» (напряженный взгляд) помогает сделать глаза живыми, выражающими эмоцию, а не просто смотрящими в пустоту. А «dust and dirt» (пыль и грязь) добавляют ту самую изюминку реализма, о которой мы говорили ранее.
А если нужен современный деловой портрет?
“Handsome businessman in a tailored navy suit, standing in a modern office with glass walls, city skyline in background, natural daylight, confident smile, shot on 50mm lens, professional photography.”
Здесь мы уходим от драматизма в сторону чистоты и профессионализма, используя «natural daylight» и «modern office».
Промты для детских портретов
С детьми всё несколько сложнее. Нейросети иногда норовят пририсовать детям взрослые черты лица или нарушить пропорции тела. Поэтому здесь особенно важны уточнения возраста.
Не пишите просто «child». Лучше укажите «5-year-old girl» или «toddler».
Пример сказочного детского портрета:
“Cute 6-year-old girl holding a glowing lantern, magical forest background, fireflies, curious expression, soft curly hair, fantasy style, warm lighting, storybook illustration feel, highly detailed.”
Выражение «curious expression» (любопытное выражение) помогает избежать отсутствующего взгляда, делая ребёнка эмоционально вовлечённым в сцену.
Частые ошибки
Почему же, имея на руках все инструменты, мы порой получаем откровенный брак? Всё дело в противоречиях. Если вы попросите «солнечный день» и «ночное небо» одновременно, нейросеть, скорее всего, выдаст нечто сюрреалистичное в худшем смысле этого слова. Также не стоит смешивать несовместимые стили, например, «фотореализм» и «пиксель-арт», если только вы не добиваетесь специфического коллажного эффекта.
Ещё одна ловушка — отсутствие конкретики. Запрос «beautiful portrait» слишком субъективен. Для кого-то красота — это классические черты, для кого-то — пирсинг и татуировки. Машина берёт среднее арифметическое из своей базы данных, и результат получается усреднённо-скучным. Всегда уточняйте: цвет глаз, волос, эмоцию, время суток.
Стоит ли использовать референсы?
Безусловно. Функция image-to-image (генерация по картинке) — это мощнейший инструмент. Но и здесь нужен текстовый промт. Картинка задает композицию и цветовую гамму, а текст направляет детализацию. Не скупитесь на описания даже при использовании референса. Ведь именно слово остается главным инструментом управления ИИ. К тому же, комбинирование собственного фото с промтом позволяет создавать удивительные аватарки, сохраняя узнаваемые черты лица, но меняя стиль и антураж.
Минимализм против детализации
Иногда меньше — значит больше. В погоне за деталями мы часто перегружаем кадр. А ведь минималистичные портреты могут выглядеть не менее впечатляюще.
Попробуйте такой вариант:
“Minimalist portrait of a woman, profile view, white background, high key lighting, monochromatic, sharp lines, fashion photography style.”
Здесь нет ничего лишнего. Только форма, свет и линия. Слово «high key» (высокий ключ) указывает на светлую тональность изображения, практически без теней. Это отличный способ создать стильный, журнальный образ.
Впрочем, выбор всегда остается за вами. Главное — не бояться экспериментировать, менять значения, переставлять слова местами и искать свой уникальный стиль общения с искусственным интеллектом. Удачи в творческих поисках, и пусть каждая генерация станет маленьким шедевром, который запомнится надолго!