Промты для двух девушек (с примерами готовых промтов)

Создание качественного одиночного портрета в нейросети — задача, с которой сегодня справится даже новичок. Но стоит добавить в кадр второго персонажа, как искусственный интеллект начинает сходить с ума, смешивая конечности, цвета волос и стили одежды в невообразимое месиво. Генерируя изображение пары, алгоритм часто пытается усреднить черты лиц или вовсе превратить героинь в сиамских близнецов. Поэтому, прежде чем нажимать кнопку «Generate», стоит разобраться в механике взаимодействия объектов внутри одного запроса и хитростях, помогающих разделить персонажей.

В чём сложность задачи?

Почему же нейросети так любят всё смешивать? Дело в том, что внимание модели (attention mechanism) рассеивается, когда в промте появляется слишком много существительных, относящихся к разным субъектам. Сложно ли это обойти? Довольно сложно, но вполне реально, если знать правильный синтаксис. Самая частая ошибка — это написание запроса сплошным текстом, где описания идут одно за другим через запятую. В таком случае рыжие волосы первой девушки обязательно перекочуют на вторую, а синее платье одной станет пятнистым костюмом для обеих. Логика подсказывает, что разделять героинь нужно не только визуально, но и грамматически.

Синтаксис и разделение

Для стабильной диффузии (Stable Diffusion) или Midjourney существуют разные подходы, но принцип остается общим. Эффективный метод — использование разрыва концепций. В то время как обыватель пишет «две девушки, одна блондинка в красном, другая брюнетка в синем», опытный промпт-инженер разбивает запрос на логические блоки. Это выглядит как жесткое указание: [описание первой] AND [описание второй]. Или же использование специальных брейков (BREAK). А вот если вы пользуетесь Midjourney, то здесь спасательным кругом станет использование мульти-промтов через двойное двоеточие (::), хотя и простое описание сцены с четким позиционированием часто срабатывает.

Портретная съёмка

Начнем с классики. Эстетичный крупный план двух героинь — это, пожалуй, самый популярный запрос. Главное здесь — задать освещение и настроение. Ведь именно свет лепит форму и отделяет один силуэт от другого.

Вот пример добротного, проработанного промта для фотореалистичного стиля:

Two beautiful young women, close up portrait, sisters, distinct facial features, 1girl with long platinum blonde hair and blue eyes, wearing a silk white blouse, 1girl with short curly dark hair and green eyes, wearing a black leather jacket, standing shoulder to shoulder, soft studio lighting, bokeh background, 8k, highly detailed, realistic skin texture, fashion photography.

Обратите внимание на конструкцию. Сначала мы задаем общую сцену (две женщины, сестры), затем конкретизируем первую (1girl…), потом вторую (1girl…) и завершаем техническими параметрами. Стоит отметить, что упоминание «sisters» часто помогает нейросети понять, почему персонажи находятся так близко друг к другу, даже если внешне они не похожи. Это довольно простой трюк, но он работает безотказно.

Стиль и атмосфера

А что, если хочется чего-то более художественного? Например, имитации живописи или сложной кинематографичной сцены. Здесь уже недостаточно просто описать одежду. Нужно задать антураж. Исконно выигрышный вариант — контраст.

Попробуйте использовать следующий сценарий для драматичной сцены:

Cinematic shot of two warriors resting, detailed environment, 1girl elf archer with braided silver hair, holding a wooden bow, wearing green tunic, 1girl human mage with flowing red hair, glowing magic runes around hands, wearing blue robes, sitting near a campfire in a dark forest, night, moonlight, sparks, volumetric fog, fantasy art style, masterpiece, intricate details.

В этом примере акцент сделан на действии и окружении. Одна держит лук, у другой светятся руны. Такой подход не дает нейросети заскучать и склеить тела, так как у каждой модели есть свой «якорь» — предмет или эффект. Результат обычно выглядит впечатляюще.

Взаимодействие персонажей

Просто поставить фигурки рядом — скучно. Живое фото отличается эмоцией и действием. Смотрят ли они друг на друга? Смеются? Шепчутся? Указание конкретного действия — это тот самый нюанс, который превращает пластиковых кукол в живых людей.

Для создания динамичной сцены в городской среде отлично подойдет такой вариант:

Full body shot, two best friends walking down a busy Tokyo street at night, neon signs reflection, laughing and talking, 1girl wearing oversized hoodie and denim shorts, holding bubble tea, 1girl wearing floral summer dress and cardigan, pointing at a shop window, candid photography, street style, vibrant colors, shallow depth of field.

Здесь мы задали не только одежду, но и занятие (смеются, указывают на витрину, держат напиток). Это усложняет задачу для ИИ, но результат получается куда более естественным. Правда, здесь могут всплыть подводные камни с пальцами рук, поэтому негативный промт (о котором речь пойдет ниже) просто необходим.

Контраст противоположностей

Один из самых интересных художественных приемов — игра на полном противопоставлении. Ангел и демон, огонь и лёд, киберпанк и ретро. Визуально это выглядит всегда выигрышно, так как цветовые палитры не смешиваются, а дополняют друг друга.

Вот идея для концепт-арта в стиле Sci-Fi:

Two cyborg girls in a futuristic lab, cyberpunk aesthetic, 1girl with transparent mechanical limbs and neon blue circuits, sleek silver hair, 1girl with heavy industrial armor and red warning lights, black dreadlocks, cables and wires background, dramatic lighting, high contrast, digital painting, artstation trends.

Такой промт буквально заставляет нейросеть разводить цвета по разным углам ринга. Синий неон против красных сигнальных огней. Львиная доля успеха здесь зависит от указания «high contrast» и четкого цветового кодирования для каждого персонажа.

Проблемы анатомии

Конечно, куда же без них. Лишние руки, три ноги на двоих или сросшиеся плечи — это классика жанра. Можно ли этого избежать? Полностью — нет, но минимизировать риски стоит. Для этого существует Negative Prompt (негативный запрос). В него мы вписываем всё то, что видеть не хотим.

Стандартный набор для парных портретов выглядит так:

(fused bodies, joined bodies, mutations, missing limbs, extra limbs, extra fingers, deformed hands, two heads on one body, clone, monochrome, blurry, low quality).

Не скупитесь на перечисление дефектов. Тем более, что для большинства моделей (особенно на базе SDXL или Pony) чистота генерации напрямую зависит от того, насколько подробно вы описали «запрещенку». А если результат всё равно далёк от идеала, на помощь приходит Inpainting — функция перерисовки отдельных участков изображения. Но это уже совсем другая история.

Ретро и винтаж

Иногда хочется окунуться в прошлое. Винтажная стилистика прощает многие огрехи детализации, так как зернистость плёнки и мягкий фокус скрывают недостатки кожи или мелкие детали глаз. Это своего рода лайфхак.

Атмосферный промт для любителей ностальгии:

Vintage photo from 1980s, two girls sitting on the hood of an old car, sunset, lens flare, 1girl with perm hair wearing denim jacket, 1girl with bandana wearing striped t-shirt, film grain, polaroid style, faded colors, nostalgic mood.

Здесь мы специально используем слова «faded colors» (выцветшие цвета) и «film grain» (зерно плёнки). Это придает изображению тот самый тёплый, ламповый шарм. Да и самим героиням такой стиль часто к лицу.

Композиционные решения

Не стоит забывать и о ракурсе. Фронтальная съёмка — это надёжно. Но скучно. Попробуйте вид сверху, вид со спины или «взгляд муравья» (low angle).

Экспериментальный вариант с видом со спины:

Back view of two girls looking at a massive waterfall, epic landscape, 1girl with long flowy dress, 1girl with hiking gear and backpack, grand scale, nature photography, breathtaking view, detailed water texture.

Такой ракурс решает сразу две проблемы: не нужно мучиться с прорисовкой лиц (что для нейросети всегда стресс), и создается ощущение грандиозного масштаба. Это отличное решение для тревел-тематики или фэнтези-артов.

Цветовая гармония

Главное — угадать с палитрой. Если вы не указываете цвета одежды, ИИ выберет их рандомно, и часто это выглядит как попугай на ярмарке. Лучше заранее продумать схему. Например, пастельные тона для нежности или total black для готики.

Нежный вариант для свадебной или романтической тематики:

Two bridesmaids getting ready, soft morning light, pastel colors, 1girl adjusting veil, 1girl holding a bouquet of pink peonies, lace robes, elegant interior, feminine aesthetic, soft focus, romantic atmosphere.

Свет здесь играет роль «клея», который объединяет персонажей в единую композицию, не давая им распадаться на отдельные фрагменты.

Технические моменты

А что насчёт разрешения? Для двух персонажей лучше использовать горизонтальный формат (например, 16:9 или 3:2). В вертикальном кадре (9:16) нейросети тесно, и она часто пытается поставить девушек друг за другом или сплести их, чтобы они поместились в узкое пространство. Широкий формат дает воздух. К тому же, это позволяет добавить детальный фон, который тоже работает на атмосферу.

Также не стоит перебарщивать с весом (весами) токенов. Если вы поставите слишком сильный акцент на одной девушке (например, (1girl in red:1.5)), вторая может просто исчезнуть или превратиться в бледную тень. Баланс — вот ключ к успеху.

Финальный штрих

В конечном итоге, работа с промтами для двух персонажей — это постоянный поиск компромисса между контролем и хаосом. Иногда случайная ошибка генерации рождает шедевр, а иногда выверенный до запятой запрос выдает трёхрукого мутанта. Но не стоит отчаиваться. Используйте представленные шаблоны как базу, меняйте описания одежды и локаций, играйте со стилями. Ведь именно в экспериментах рождается ваш уникальный авторский почерк. Нейросеть — это мощный инструмент, но дирижером оркестра остаетесь именно вы. Удачи в генерациях, и пусть ваши дуэты всегда получаются гармоничными и эстетичными!