Промты для генерации персонажей (с примерами готовых промтов)

Создание цифрового двойника или вымышленного героя сродни магии, доступной теперь каждому обладателю мощной видеокарты или облачного аккаунта, однако результат далеко не всегда совпадает с ожиданиями. Сотни тысяч пользователей ежедневно штурмуют нейросети, пытаясь получить идеальный портрет, но вместо шедевра часто видят размытые лица, лишние пальцы или абсолютно пустые глаза. Обыватель может подумать, что дело в «глупости» искусственного интеллекта, хотя на самом деле проблема кроется в неумении формулировать запрос. Ведь нейросеть — это не художник-телепат, а, скорее, исполнительный, но очень буквальный джинн. Поэтому перед тем, как нажать кнопку «Generate», стоит разобраться в лингвистических ключах, открывающих дверь к действительно качественному арту.

Как работает текстовый запрос?

Сложно ли понять логику машины? Да, но только на первых порах. Весь секрет кроется в иерархии слов. В начале предложения всегда должен стоять главный объект. Это база. Если вы напишете «красивый закат на фоне девушки», нейросеть с большой вероятностью нарисует именно закат, а девушка окажется где-то на задворках, маленькая и кривая. Правильная структура выглядит иначе. Сначала мы обозначаем кто, затем что делает, потом где находится и, наконец, как выглядит. Вес слов убывает слева направо. Токенам в начале промта система уделяет львиную долю внимания, а хвост запроса использует для стилизации.

Анатомия идеального героя

Начинать нужно с конкретики. Абстрактные понятия вроде «красавица» или «воин» интерпретируются слишком широко. Лучше сразу задать параметры. Например, вместо простого man мы пишем «rugged old man, viking, scarred face, braided beard». Здесь мы сразу даём якоря: возраст, этническая принадлежность, особые приметы. К слову, детализация кожи — это тот самый нюанс, который отличает пластиковую куклу от живого портрета. Профессионалы часто используют связки «highly detailed skin texture», «pores», «subsurface scattering». Последний термин, кстати, пришёл из 3D-графики и отвечает за то, как свет проходит сквозь кожу (например, просвечивающие уши). Без этого лицо будет выглядеть как маска.

Обязательно ли указывать одежду? Вовсе нет, если вам нужен стандартный портрет. Но если цель — уникальный образ, то гардероб придётся прописать до пуговицы. И тут в игру вступают материалы. Нейросети отлично понимают разницу между «silk» (шёлк), «leather» (кожа) и «rusted metal» (ржавый металл). Указание фактуры добавляет изображению тактильности. Зритель должен буквально чувствовать вес доспехов или лёгкость ткани.

Стилизация и художественные приёмы

Следующий пласт работы — это стиль. Без него генерация превратится в лотерею. Вы можете получить фотореализм, а можете — детский рисунок карандашом. Чтобы задать направление, используются имена художников или названия течений. Грег Рутковски (Greg Rutkowski) стал уже мемом в сообществе, так как его имя добавляют везде, где нужно получить эпичное фэнтези с масляными мазками. А если хочется киберпанка и неоновой грязи, то тут солирует ссылка на стиль Сида Мида (Syd Mead) или отсылки к фильму «Blade Runner».

Но есть и другой путь — имитация фототехники. Это настоящий кладезь для любителей реализма. Не стоит забывать указывать параметры камеры. Фраза «shot on Sony A7R IV, 85mm lens, f/1.8» творит чудеса. Она заставляет нейросеть размывать фон (боке), фокусироваться на глазах и выстраивать композицию так, как это сделал бы портретный фотограф. Угол съёмки тоже важен. «Low angle» придаст герою величия и мощи, а «high angle» сделает его более уязвимым или милым.

Освещение

Свет — это, пожалуй, самый недооценённый инструмент. Многие считают, что достаточно описать персонажа, но на самом деле именно свет лепит форму. Плоское освещение убивает объём. А вот «volumetric lighting» (объёмный свет) или «rim light» (контровой свет) мгновенно выделяют силуэт из фона. Для драматичных сцен отлично подходит «chiaroscuro» (кьяроскуро) — резкий контраст света и тени, любимый приём Караваджо. Если же хочется мягкости и нежности, то на помощь придёт «cinematic soft lighting» или «golden hour» (золотой час). Эксперименты со светом могут кардинально изменить настроение одного и того же персонажа.

Примеры промтов: Фэнтези

Разберём конкретные примеры. Допустим, нам нужен классический эльфийский лучник, но не мультяшный, а кинематографичный. Запрос может выглядеть так:

Portrait of a female elven archer, platinum hair with intricate braids, emerald eyes looking at viewer, wearing ornate silver armor with celtic patterns, forest background with ancient trees, fireflies, magical atmosphere, cinematic lighting, 8k, highly detailed, photorealistic, style by Peter Jackson movies.

Здесь мы видим чёткую структуру. Сначала объект (эльфийка), потом детали внешности (волосы, глаза), одежда (броня), окружение (лес) и технические параметры (8k, стиль фильма).

А вот вариант для любителей тёмного фэнтези и нежити. Задача посложнее — сделать страшно, но красиво:

Dark necromancer lord, skeletal face half covered by a hood, glowing blue eyes, rotten robes with runes, holding a staff with a skull, sitting on a throne of bones, dark dungeon atmosphere, volumetric fog, ominous lighting, sharp focus, intricate details, concept art style, masterpiece.

В этом случае акцент смещён на атмосферу (fog, ominous) и текстуры (rotten, bones).

Киберпанк и фантастика

Смена жанра требует смены лексикона. В научной фантастике и киберпанке правят бал хром, неон и синтетика. Попробуем сгенерировать девушку-хакера в футуристическом городе:

Cyberpunk girl hacker, neon dreadlocks, cyborg jaw, wearing transparent plastic raincoat over shiny latex suit, night city street with rain and neon signs reflection, wet asphalt, bokeh, chromatic aberration, futuristic vibe, ray tracing, unreal engine 5 render, hyperrealistic.

Обратите внимание на «chromatic aberration» — этот эффект добавляет лёгкое искажение цветов по краям, что характерно для цифровых камер и часто используется в sci-fi артах для придания «технологичности».

А если нужен суровый космический десантник? Тут важна массивность:

Space marine commander, battle scarred face, heavy futuristic power armor with scratches and battle damage, standing on mars surface, red dust storm, dramatic sunset lighting, intricate mechanical details, heavy metal texture, wide shot, epic scale, 8k resolution.

Слова «scratches» и «battle damage» добавляют истории. Персонаж сразу выглядит бывалым, а не только что сошедшим с конвейера.

Фотореализм и портреты

Самый сложный жанр, где любые ошибки всплывут мгновенно. Здесь мы отказываемся от «artstation» и «concept art» в пользу терминов фотографии. Пример запроса для создания портрета девушки, который сложно отличить от фото:

Close-up portrait of a young woman with freckles, messy red hair, green eyes, natural makeup, soft skin texture, looking away, standing near a window, natural lighting, shot on 35mm film, Kodak Portra 400, grain, realistic shadows, depth of field.

Упоминание плёнки «Kodak Portra 400» и «grain» (зерно) даёт тот самый аналоговый эффект, который так ценят фотографы. Это убирает пластиковый блеск, свойственный многим нейросетям.

Мужской портрет в деловом стиле требует другой подход. Строгость и фактура ткани:

Middle-aged businessman, wearing expensive dark blue suit, white shirt, silk tie, glasses, confident smile, office interior background with blurred city view through panoramic window, studio lighting, sharp details, 4k, professional photography.

Здесь «studio lighting» обеспечивает ровный, качественный свет без лишних теней на лице.

Технические модификаторы и параметры

Кстати, промт — это не только слова, но и параметры. В Midjourney, например, крайне важно использовать соотношение сторон. Добавление –ar 16:9 сделает картинку кинематографичной, широкой. А –ar 9:16 идеально подойдёт для портретов на экран смартфона. Ещё один важный параметр — стилизация (–s или –stylize). Высокие значения дают нейросети больше творческой свободы, низкие заставляют её строго следовать тексту. Стоит поэкспериментировать с весом слов. В некоторых интерфейсах (как в Stable Diffusion) можно выделить слово скобками, например «(red hair:1.2)», чтобы усилить акцент именно на цвете волос.

Чего лучше избегать?

Ошибки новичков часто связаны с желанием впихнуть невпихуемое. Не стоит писать в одном промте противоречащие друг другу стили, например «picasso style» и «photorealistic». Нейросеть выдаст кашу. Также лучше отказаться от длинных, литературных описаний эмоций. Фраза «она смотрит на него с любовью, вспоминая их прошлые встречи у реки» для машины слишком сложна. Проще написать «loving gaze» или «nostalgic mood».

Отрицательные промты (Negative Prompt)

Это отдельная тема, заслуживающая внимания. Часто результат портится не из-за того, что вы написали, а из-за того, что не исключили. В поле Negative Prompt (если оно есть) стоит вносить всё, что вы не хотите видеть. Стандартный набор выглядит так: «ugly, deformed, extra fingers, missing limbs, blurry, low quality, watermark, text, bad anatomy». Это своего рода фильтр грубой очистки. Он отсекает мусорные варианты генерации ещё на подлёте. Особенно это касается рук — бича всех генеративных сетей. Добавление «bad hands» и «mutated hands» в негативный промт значительно повышает шансы получить нормальную конечность с пятью пальцами.

Секретные ингредиенты

Есть слова, которые работают как усилители вкуса. Их можно добавлять практически в любой запрос для повышения качества. К таким словам относятся: «masterpiece» (шедевр), «trending on artstation» (популярное на ArtStation), «sharp focus» (резкий фокус), «intricate details» (сложные детали). Однако не стоит перебарщивать. Если перегрузить промт усилителями, нейросеть может уйти в абстракцию и детали ради деталей, потеряв суть образа.

Фантазия или техника?

Что важнее — технически верный промт или креативная идея? Разумеется, идея первична. Самый идеальный технический код не спасёт скучную задумку. Но знание синтаксиса позволяет эту идею донести без искажений. Ведь обидно, когда в голове у вас эпичная битва драконов, а на экране — смазанное пятно. Процесс написания промта — это всегда диалог. Вы говорите слово, смотрите на результат, корректируете, добавляете уточнение. И так до тех пор, пока с монитора на вас не посмотрит именно тот персонаж, которого вы представляли.

Сюрреализм и абстракция

Иногда хочется уйти от реальности полностью. В этом случае логика построения промта меняется. Мы отпускаем физику и анатомию. Пример сюрреалистичного персонажа:

Double exposure portrait of a man and a forest, trees growing from head, birds flying, silhouette, misty atmosphere, dreamlike, surrealism, style by Salvador Dali and Magritte, pastel colors, mystery.

Техника двойной экспозиции («double exposure») позволяет создавать удивительные метафорические образы, где человек сливается с природой или архитектурой. Это отличный способ для создания обложек книг или музыкальных альбомов.

Стимпанк

Нельзя не упомянуть и этот колоритный жанр. Медь, пар и шестерёнки требуют своего словаря.

Steampunk inventor, wearing brass goggles, leather apron with tools, holding a glowing mechanical device, workshop background with steam pipes and gears, warm vintage lighting, detailed mechanics, victorian era fashion, oil painting style.

Здесь ключевую роль играют материалы (brass, leather) и освещение (warm vintage).

Вместо послесловия

Генерация персонажей — это бесконечный процесс поиска. Не существует единой «золотой кнопки», которая сделает красиво всегда. Одни и те же промты в разных моделях (Midjourney v6, Stable Diffusion XL, DALL-E 3) дадут абсолютно разный результат. Но понимание структуры, умение работать со светом, камерой и стилями — это тот фундамент, на котором строится всё цифровое искусство. Пробуйте, смешивайте несовместимое, ошибайтесь и находите свои уникальные сочетания слов. Пусть ваши виртуальные миры наполнятся живыми, дышащими героями, а каждый новый запрос становится маленьким открытием. Удачных генераций и поменьше артефактов на пальцах!