Промт для сохранения черт лица (с примерами готовых промтов)

Устали от бесконечной «рулетки», когда каждая новая генерация выдает совершенно незнакомца вместо полюбившегося персонажа? С этой проблемой сталкивается буквально каждый цифровой художник, начинающий свой путь в мире нейросетей. Казалось бы, запрос составлен идеально, освещение выставлено, стиль подобран, но герой на картинке меняется до неузнаваемости, стоит лишь немного скорректировать позу или фон. Обидно. Ведь создание стабильного образа — это тот самый «Святой Грааль», за которым охотятся все, от иллюстраторов комиксов до создателей виртуальных инфлюенсеров. И если раньше это считалось задачей исключительно для программистов, то сейчас ситуация изменилась. Однако чтобы не ошибиться и получить предсказуемый результат, стоит погрузиться в механику составления промтов чуть глубже, чем предлагает стандартная инструкция.

Почему лицо вообще меняется?

Сложно ли понять логику машины? Довольно сложно, если не знать о принципе случайного шума. Дело в том, что нейросеть не «видит» персонажа так, как видим его мы. Для алгоритма лицо — это просто набор пикселей, вероятностей и весов, которые каждый раз собираются заново из цифрового хаоса. Без жёсткой фиксации система пытается проявить креативность, добавляя детали там, где вы этого не просили. Это же касается и микро-черт: формы ноздрей, посадки глаз или линии скул. Избежать этого полностью при генерации только по тексту — задача не из лёгких. Но выполнимая. Главное — создать для искусственного интеллекта настолько узкий коридор возможностей, чтобы свернуть «не туда» у него просто не получилось.

Метод «словесного слепка»

Один из самых надёжных способов, не требующих установки сложного софта, — это создание избыточно подробного текстового портрета. Здесь работает принцип полицейской ориентировки. Недостаточно написать «красивая девушка». Нужно отметить абсолютно все нюансы, формирующие индивидуальность. Скрупулезный подход здесь творит чудеса. Начать стоит с формы лица (овальное, квадратное, сердцевидное), затем перейти к глазам (миндалевидные, глубоко посаженные, цвет радужки), описать нос (с горбинкой, курносый, прямой) и обязательно упомянуть особые приметы. Именно родинка над губой, шрам на брови или веснушки становятся теми «якорями», за которые цепляется нейросеть. А вот размытых эпитетов лучше избегать.

Техника смешивания знаменитостей

Работает ли этот метод? Безусловно, и порой даже лучше, чем детальное описание. Нейросети обучались на миллионах фотографий звёзд, поэтому имена актёров или моделей для них — это понятный и чёткий код. Но использовать одно имя рискованно: вы получите просто портрет знаменитости, что может вызвать вопросы с авторскими правами, да и выглядит это вторично. Спасательный круг — это гибридизация. Вы берете два или три имени и смешиваете их в пропорциях. Например, комбинация:

face mixture of Ana de Armas and Emma Watson

Она даст совершенно новое, но стабильное лицо, если использовать эту связку в каждом промте. К слову, порядок имён имеет значение: первое имя в списке обычно солирует и задает основную геометрию черепа.

Работа с весами и синтаксисом

Для тех, кто хочет контролировать процесс ещё точнее, существует система весов. В разных нейросетях (будь то Midjourney или Stable Diffusion) синтаксис отличается, но суть одна. Вы можете усилить влияние конкретной черты лица, выделив её скобками или цифрами. Если вы хотите сохранить специфический нос, его описание стоит выделить особо. Например, конструкция (aquiline nose:1.3) скажет алгоритму, что этот параметр важнее фона или одежды. Тем более что игнорирование весов часто приводит к «усреднению» внешности. А ведь нам нужна именно уникальная изюминка, а не стандартная кукольная красота.

Поможет ли Reference Image?

Разумеется, текстовый запрос — это мощно, но визуальная опора надёжнее. Функция Image Prompt (или img2img) позволяет загрузить эталонное изображение и попросить нейросеть опираться на него. Это довольно эффективный прием. Секрет кроется в параметре Image Weight (вес изображения). Если выставить его слишком низким, лицо изменится; слишком высоким — вы получите копию исходника без возможности поменять позу. Львиная доля успеха здесь зависит от баланса. Оптимально начинать со средних значений, позволяя нейросети брать черты лица с референса, но перерисовывать окружение по текстовому описанию. Кроме того, стоит использовать один и тот же Seed (зерно генерации), если вы нашли удачный вариант и хотите лишь слегка изменить детали.

Как составить промт для реализма?

Давайте разберём структуру рабочего запроса на примере. Допустим, нам нужен суровый мужчина средних лет. Промт не должен быть хаотичным набором слов. Логика построения выглядит так: сначала идёт «якорь» внешности, затем детализация кожи, и только потом стиль. Вот как это может выглядеть на практике.

Начинаем с основы: close-up portrait of a 45 year old man, mixture of Mads Mikkelsen and Viggo Mortensen. Это база. Далее следует уточнение деталей, которое зацементирует образ: rough skin texture, scar specifically on left cheek, steel grey eyes, sharp jawline, stubble beard. Ну и, наконец, технические параметры, обеспечивающие фотореализм: 8k resolution, raw photo, realistic lighting, shot on 35mm lens. Полный пример выглядит так:

close-up portrait of a 45 year old man, mixture of Mads Mikkelsen and Viggo Mortensen, rough skin texture, scar specifically on left cheek, steel grey eyes, sharp jawline, stubble beard, 8k resolution, raw photo, realistic lighting, shot on 35mm lens

Такой подход даёт довольно стабильный результат.

Специфика рисованных стилей

А что если нам нужен не реализм, а аниме или иллюстрация? Здесь правила немного меняются. Всплывут нюансы, связанные с упрощением черт лица самой стилистикой. Чтобы сохранить узнаваемость нарисованного персонажа, акцент нужно делать на причёске, цвете глаз и ключевых аксессуарах. Одежда и цвет волос в аниме-стилистике часто являются главными маркерами идентичности. Примерный промт для сохранения персонажа в 2D может звучать так:

anime style character design, girl with distinctive purple twin-tails hair, green eyes, wearing red scarf, mole under right eye, flat color, clean lines

Повторение фразы distinctive purple twin-tails и red scarf из раза в раз поможет зрителю идентифицировать героя, даже если черты лица будут слегка «гулять».

Роль отрицательных подсказок

Не стоит забывать про Negative Prompt. Это то место, куда мы сгружаем всё, что может исказить лицо. Часто новички пишут туда просто ugly или bad anatomy. Этого мало. Чтобы черты лица не «плыли», в негативный промт стоит добавить такие слова, как:

asymmetry, crossed eyes, distorted face, changing facial features, morphing

Это отсечёт варианты, где нейросеть пытается экспериментировать с геометрией. Впрочем, перегружать «негатив» тоже не стоит, иначе модель может начать выдавать артефакты.

Пример сложного комбинированного промта

Рассмотрим ситуацию, когда нужно сохранить лицо девушки-эльфа в разных локациях. Задача не из лёгких. Вот готовая формула, которую можно адаптировать.

Основа (используем во всех генерациях неизменно): portrait of a female elf, face mix of Liv Tyler and Elizabeth Debicki, platinum blonde long straight hair, emerald eyes, high cheekbones, elegant ethereal face.

Переменная часть (меняем в зависимости от сюжета): sitting in a magical forest library, reading an ancient scroll.

Техническая «обвязка»: cinematic lighting, fantasy art style, highly detailed.

Главное — никогда не менять первую часть промта, даже на запятую. Любое изменение в «базе» повлечёт за собой смену внешности. Это железное правило.

Использование LoRA и тренировка модели

Стоит ли идти дальше промтов? Если вы планируете создать целый графический роман или вести блог от лица виртуального персонажа, обычного промтинга может не хватить. Здесь на сцену выходят LoRA (Low-Rank Adaptation). Это небольшие надстройки над моделью, обученные на конкретном лице. Процесс создания своей LoRA — тема отдельная и довольно техническая, но упомянуть её необходимо. Это, по сути, единственный способ получить 100% сходство в любых ракурсах без танцев с бубном. Однако для разовых задач тратить время на тренировку модели не всегда целесообразно. Промтинг с именами и описаниями остается самым быстрым и бюджетным решением.

Распространённые ошибки

Чего делать категорически нельзя? Во-первых, не меняйте порядок слов в описании внешности от генерации к генерации. Для нейросети слова в начале предложения имеют больший вес. Если сегодня вы написали «голубые глаза, светлые волосы», а завтра «светлые волосы, голубые глаза» — вы можете получить двух разных людей. Во-вторых, не перегружайте промт лишними деталями одежды, если они не важны. Чем больше внимания нейросеть уделяет кружевам на платье, тем меньше ресурсов у нее остается на прорисовку правильной геометрии лица. Ну и, конечно же, не ожидайте идеала с первого клика. Генерация — это всегда перебор вариантов.

Влияние Seed на результат

Многие считают, что Seed (зерно) — это просто случайное число. На самом деле, это отправная точка всего процесса. Если вы зафиксируете Seed и будете менять только одежду или фон в промте, лицо останется максимально похожим на исходник. Это работает довольно предсказуемо. Вы находите идеальную генерацию, копируете её номер Seed и вставляете в параметры следующего запроса. Да, поза может остаться прежней, но черты лица сохранятся с ювелирной точностью. Это отличный метод для создания серии портретов в одном ракурсе, но с разными эмоциями или освещением.

Нюансы работы с эмоциями

Кстати, эмоции могут сильно искажать лицо. Широкая улыбка меняет форму щёк и глаз, из-за чего персонаж может стать неузнаваемым. Чтобы минимизировать этот эффект, стоит описывать эмоции сдержанно. Вместо laughing hysterically лучше использовать soft smile или happy expression. Сильные мимические деформации — это подводные камни, о которые разбилось немало хороших промтов. Если нужно сохранить идентичность, лучше пожертвовать экспрессией в пользу узнаваемости.

Постоянство — залог успеха

В конечном итоге, сохранение черт лица — это битва между хаосом случайных чисел и вашим упорством. Универсальной кнопки «сделать то же самое лицо» не существует, но комбинация описательного метода, смешивания имён знаменитостей и использования референсов даёт добротный результат. Не бойтесь экспериментировать с весами слов и порядком фраз. Ваш идеальный персонаж уже ждет своего воплощения, нужно лишь подобрать к нему правильный ключ. Удачи в творческих поисках, и пусть ваши генерации всегда радуют стабильностью!