Промты для поз (с примерами готовых промтов)

Сколько раз, глядя на свежую генерацию, вы ловили себя на мысли, что персонаж выглядит словно сломанная кукла? Руки вывернуты под неестественным углом, позвоночник напоминает вопросительный знак, а ноги живут своей, абсолютно автономной жизнью. Эта проблема знакома каждому, кто хоть раз пытался создать сюжетную иллюстрацию в Midjourney или Stable Diffusion. Ведь нейросеть, по своей сути, не знает анатомии — она лишь оперирует набором пятен и паттернов, которые «видела» в процессе обучения. И если портреты по плечи алгоритмы рисуют уже довольно сносно, то стоит камере отъехать чуть дальше, как начинаются настоящие чудеса эквилибристики. Однако спасти ситуацию всё-таки можно, если правильно подобрать слова-триггеры и чётко описать желаемое положение тела.

Зачем вообще нужны специальные токены позы?

Казалось бы, зачем усложнять промт, если можно просто написать «человек бежит» или «девушка сидит»? Дело в том, что простые глаголы часто интерпретируются алгоритмом слишком буквально или, наоборот, чересчур хаотично. Без уточнения «бег» может превратиться в странное парение над землей, а «сидение» — в проваливание сквозь текстуры дивана. Специализированная лексика, пришедшая из фотографии, академического рисунка и кинематографа, служит теми самыми рельсами, по которым движется «воображение» искусственного интеллекта. Это довольно мощный инструмент. Ведь он задает не просто действие, а вектор напряжения мышц, распределение веса и общую динамику кадра. К тому же, правильное описание позы часто помогает скрыть традиционные недостатки генерации, вроде лишних пальцев или неестественных суставов.

Динамика в кадре: Как передать движение?

Создание ощущения скорости и энергии — задача не из лёгких. Статичный «man running» обычно выдает скучную картинку, напоминающую плохую стоковую фотографию. Чтобы вдохнуть жизнь, стоит использовать более агрессивную и кинематографичную лексику. Один из самых действенных приёмов здесь — использование слов, описывающих не само действие, а его характер. Например, отличным дополнением станет словосочетание «dynamic pose» (динамичная поза) или «action shot» (кадр действия). Они заставляют нейросеть искривлять линии композиции, добавлять размытие фона и делать фигуру более экспрессивной.

Но есть и нюансы. Если вы хотите получить конкретный вид движения, придется углубиться в детали. Для боевых сцен прекрасно подходит конструкция «fighting stance» (боевая стойка) или более специфическое «mid-air kick» (удар в прыжке). Разумеется, результат будет лучше, если добавить описание ракурса, но об этом чуть позже. А вот для изображения полёта или падения стоит попробовать «falling backwards» (падение назад) или «floating in zero gravity» (парение в невесомости). Эти токены меняют гравитацию в кадре, заставляя одежду и волосы вести себя соответственно. И всё же, не стоит перебарщивать с количеством глаголов, иначе нейросеть попросту запутается в конечностях.

Спокойствие и статика: Особенности позирования

С динамикой разобрались, а что насчёт спокойных сцен? Здесь подводных камней ничуть не меньше. Самая частая ошибка новичков — использование слова «standing» без уточнений. В девяти случаях из десяти вы получите «солдата в строю» с опущенными по швам руками. Выглядит это удручающе. Чтобы персонаж казался живым, ему нужна опора или взаимодействие с окружением. Отлично работает уточнение «leaning against wall» (прислонившись к стене) или «arms crossed» (скрестив руки на груди). Это сразу добавляет характеру уверенности или, наоборот, расслабленности.

Особый интерес вызывает поза сидя. Просто «sitting» — это лотерея. Уточняйте, как именно сидит герой: «sitting cross-legged» (сидя, скрестив ноги), «sitting on knees» (сидя на коленях) или вальяжное «lounging on a sofa» (развалившись на диване). К слову, довольно часто нейросети хорошо понимают термин из классического искусства «contrapposto» (контрапост). Это положение, при котором вес тела перенесен на одну ногу, а плечи и бедра находятся под углом друг к другу. Использование этого термина мгновенно делает стоящую фигуру более естественной и грациозной. Ну и, конечно же, не забывайте про руки — если не знаете, куда их деть, используйте «hands in pockets» (руки в карманах). Это настоящий спасательный круг для тех, кто устал бороться с шестипалыми кистями.

Как ракурс влияет на восприятие позы?

Поза — это лишь половина дела. То, как мы на неё смотрим, меняет восприятие кардинально. Один и тот же бегущий человек может выглядеть жалкой жертвой или неумолимым охотником в зависимости от положения виртуальной камеры. Снизу вверх — и перед нами грандиозный герой. Сверху вниз — и персонаж кажется маленьким и беззащитным. Для эпичных поз стоит использовать «low angle shot» (съёмка с нижнего ракурса) или даже экстремальное «worm’s-eye view» (вид с точки зрения червя). Это визуально удлиняет ноги и делает фигуру монументальной.

Впрочем, иногда требуется показать интимность момента или уязвимость. Тут на помощь придет «high angle shot» (съёмка сверху) или «overhead view» (вид строго сверху). А если нужно добавить драмы и искажения перспективы, попробуйте «fisheye lens» (объектив рыбий глаз) в сочетании с позой, где рука или нога тянется к камере («reaching towards camera»). Такой прием называется «foreshortening» (перспективное сокращение), и хотя нейросети с ним справляются с переменным успехом, удачные генерации выглядят просто впечатляюще. Также не стоит забывать про «profile view» (вид в профиль) и «back view» (вид со спины), которые часто игнорируются, хотя и способны создать очень атмосферные и загадочные образы.

Примеры готовых промтов: Экшен и сражение

Перейдём от теории к практике. Допустим, нам нужно создать сцену сражения в киберпанк-стилистике. Просто написать «cyborg fighting» — значит получить кашу. Попробуем собрать конструктор. Начнём с главного действия. Пусть это будет удар ногой в полёте. Добавляем описание окружения и стиля.

Пример промта может выглядеть так:

«Cyberpunk warrior woman, dynamic pose, performing a high mid-air kick, fighting stance, foreshortening, low angle shot, motion blur, neon city background, detailed armor, intense action scene».

Здесь мы видим сразу несколько “слоев”: само действие (kick), общая поза (fighting stance) и технические параметры камеры (foreshortening, low angle).

А если нам нужен маг, колдующий заклинание? Статично стоящий волшебник — это скучно. Попробуем такой вариант:

«Wizard casting a fire spell, arms raised high, intense energy swirling around, floating in the air, dynamic fabric motion, glowing eyes, dramatic lighting, wide angle shot, masterpiece».

Фраза «arms raised high» (руки подняты высоко) задает четкую геометрию верхней части тела, а «floating» (парение) отрывает персонажа от земли, добавляя мистики.

Для любителей супергероики подойдёт классическое приземление. Вписываем в строку:

«Superhero landing pose, one fist touching the ground, crouched position, debris flying around, impact crater, epic composition, cinematic lighting, sharp focus».

Ключевое здесь — «one fist touching the ground» (один кулак касается земли) и «crouched position» (поза на корточках). Нейросеть прекрасно знает этот штамп из фильмов Marvel и воспроизводит его довольно точно.

Примеры готовых промтов: Повседневность и фэшн

Но не войной единой. Часто требуются спокойные, модельные или бытовые позы. Представим, что нам нужна девушка в кафе. Вариант промта:

«Young woman sitting in a cafe, looking out the window, chin resting on hand, thoughtful expression, soft natural lighting, depth of field, cozy atmosphere».

Конструкция «chin resting on hand» (подбородок опирается на руку) — это сложный, но очень эффектный элемент. Он связывает голову и руку, создавая замкнутую композицию. Правда, тут могут возникнуть проблемы с пальцами, поэтому генерировать придется несколько раз.

Для фэшн-съемки в полный рост отлично подойдёт проходка. Пишем:

«Fashion model walking on a runway, confident stride, looking straight at camera, long flowing dress, full body shot, fashion photography, studio lighting».

Словосочетание «confident stride» (уверенный шаг) подсказывает ИИ, что ноги должны быть в фазе движения, а не приклеены к полу. А «looking straight at camera» обеспечивает тот самый пронзительный взгляд.

Ещё один интересный, довольно расслабленный вариант — чтение книги. Попробуем:

«Girl reading a book, lying on stomach, legs kicked up in the air, cozy sweater, home library background, warm lighting, relaxed pose».

Фраза «lying on stomach» (лежа на животе) и уточнение про ноги «legs kicked up» (ноги болтаются в воздухе) создают очень уютный и естественный образ, который сложно получить случайным перебором.

Технические помощники: Когда слов недостаточно

Бывает и так, что даже самый изощренный промт не дает нужного результата. Нейросеть упорно рисует персонажа спиной, когда вы просите анфас, или путает правую руку с левой. В таких случаях стоит вспомнить, что текст — не единственный способ управления. Существует технология ControlNet (в экосистеме Stable Diffusion), которая позволяет скопировать позу с любой референсной фотографии и «натянуть» её на вашу генерацию. Это уже высший пилотаж, требующий установки дополнительного софта, но знать о такой возможности стоит. Для пользователей Midjourney аналогом может служить функция Image Prompt, где вы скармливаете боту картинку-пример, хотя точность там будет ниже.

Тем не менее, умение описывать позу словами остается базовым навыком. Ведь ControlNet есть не везде, а хороший словарный запас всегда при вас. К тому же, текстовое описание часто добавляет нюансы, которых нет на референсе — например, настроение или микро-движения.

Ошибки, которых лучше избегать

В погоне за идеальной позой легко увлечься и перегрузить промт. Первая и самая распространенная ошибка — противоречивые команды. Нельзя одновременно требовать «sitting» и «running». Нейросеть, конечно, попытается скрестить ежа с ужом, но результат будет напоминать кадры из фильмов ужасов. Лучше отказаться от использования слишком большого количества уточняющих прилагательных для одной конечности. Фраза «left leg bent 90 degrees, right leg straight, left arm up, right arm holding cup» может просто сломать логику генерации. Проще описать общее действие, например, «dancing», и добавить пару деталей.

Ещё один нюанс касается анатомических терминов. ИИ неплохо знает слова «torso», «hips», «shoulders», но попытки описать конкретные мышцы (если это не бодибилдинг) или сложные костные структуры часто приводят к появлению «мясного костюма» вместо кожи. Не стоит перебарщивать и с негативными промтами. Бесконечный список того, чего НЕ должно быть на картинке (bad anatomy, extra fingers, missing limbs), порой работает хуже, чем одно качественное позитивное описание.

Секрет успеха — в насмотренности

Формулирование промтов для поз — это, по сути, режиссура. Вы должны четко представлять в голове, как именно стоит актер, куда падает свет и где находится камера. Наткнулись на красивую фотографию? Попробуйте разобрать её на составляющие. Как стоят ноги? Куда повернута голова? Какие глаголы лучше всего описывают это состояние? Записывайте удачные связки слов. Со временем у вас сформируется собственная библиотека «золотых» промтов, которые работают безотказно.

И всё же, главный совет — не бойтесь экспериментировать. Иногда самая безумная комбинация слов, вроде «liquid dance pose» (поза жидкого танца) или «exploding motion» (взрывное движение), выдает шедевры, до которых невозможно дойти логическим путём. Нейросеть — это чёрный ящик, и порой стоит просто потрясти его посильнее, чтобы оттуда выпало что-то драгоценное. Дерзайте, пробуйте новые ракурсы, смешивайте стили и заставляйте своих персонажей двигаться так, как вам того хочется. Удачных вам генераций и пусть ваши герои всегда твёрдо стоят на ногах (если, конечно, вы не задумали обратное)!