Сгенерировать качественный портрет одного человека в нейросетях сегодня — задача довольно тривиальная, а вот создание парного снимка часто превращается в настоящий квест с непредсказуемым результатом. Нейросети, будь то Midjourney или Stable Diffusion, периодически норовят слить два тела в одно, добавить лишние конечности или вовсе проигнорировать запрос на взаимодействие персонажей, оставляя их стоять истуканами. Многие пользователи, столкнувшись с первыми неудачами, бросают попытки, считая, что ИИ пока не способен передать «химию» между людьми. В сети представлено множество красивых картинок, но за каждой из них стоит кропотливый подбор слов и десятки неудачных дублей. Однако секрет успеха кроется не в слепой удаче, а в понимании логики машины и использовании проверенных синтаксических конструкций.
Анатомия запроса
С чего начинается построение грамотного промта? С чёткого разделения субъектов. Это база. Ведь если просто написать «пара», нейросеть усреднит их черты, выдав брата и сестру или клонов. Чтобы этого избежать, стоит описывать каждого персонажа отдельно, используя связки. Первый шаг — определение действующих лиц. Сначала мы прописываем «a man and a woman», а затем добавляем детализацию через уточнения. Например, «a tall bearded man in a coat hugging a petite woman with red hair». Такой подход позволяет алгоритму «развести» персонажей по разным углам смыслового поля. Важный нюанс — порядок слов. То, что стоит в начале предложения, имеет для ИИ, безусловно, больший вес. Поэтому описание взаимодействия должно идти сразу после упоминания героев.
Как описать взаимодействие?
Сложно ли заставить нейросеть создать живую сцену? Да, если использовать абстрактные глаголы. Слова вроде «loving» или «romantic» слишком размыты. Машине нужна конкретика. Лучше отказаться от эмоций в пользу действий. Вместо «они любят друг друга» напишите «looking into each other’s eyes», «holding hands tightly» или «forehead to forehead touching». Это же правило касается и динамичных сцен. Если вам нужен танец, уточните стиль и позу.
dynamic shot of a couple dancing tango, dramatic pose, legs intertwined
Такой промт даст куда более впечатляющий результат, чем простое «couple dancing». А ведь именно в мелочах кроется львиная доля успеха. К слову, довольно часто помогает добавление описания взгляда. Фраза «intense eye contact» буквально творит чудеса, заставляя зрителя поверить в искренность чувств на картинке.
Повседневный реализм
Особый интерес вызывает стилистика случайных кадров, словно снятых на плёнку или телефон. Это сейчас в тренде. Чтобы получить такой эффект, нужно добавить технические параметры и описание атмосферы. Хорошим примером послужит такой вариант:
candid shot of a young couple laughing in a cozy kitchen, messy hair, morning light, cooking breakfast together, film grain, Kodak Portra 400
Здесь мы видим сразу несколько слоёв: действие (смеются, готовят), обстановку (уютная кухня) и стиль (плёночное зерно). Результат получается живым и тёплым. Другой вариант для уличной фотографии: «couple walking in the rain under one umbrella, night city street, neon lights reflection, wet asphalt, shot from behind, realistic texture». Такой запрос создаёт кинематографичную, но при этом приземлённую сцену. Не стоит забывать и про одежду. Если не указать гардероб, нейросеть оденет героев в стандартные футболки и джинсы. Поэтому лучше уточнить: «oversized sweaters» или «vintage coats».
Романтика и студийная эстетика
Нужно ли всегда стремиться к реализму? Вовсе нет. Иногда хочется получить глянцевую картинку, достойную обложки журнала. В этом случае лексикон должен измениться. Мы убираем «candid» и добавляем «studio lighting», «professional photography», «high fashion». Для создания нежного, воздушного образа отлично подойдёт такой промт:
close-up portrait of a couple, soft pastel colors, blooming flowers background, dreamy atmosphere, soft focus, cinematic lighting, 8k resolution
Обратите внимание на свет. Фраза «rembrandt lighting» добавит драматизма и объёма лицам, а «backlight» создаст красивый контурный свет (ореол вокруг волос). А если ещё вспомнить про чёрно-белую классику, то можно использовать: «black and white photography, noir style, high contrast, couple kissing in the rain, dramatic shadows, emotional atmosphere». Такая фотография всегда выглядит дорого и стильно.
Фантастические сюжеты
Где искать вдохновение, если реальность наскучила? Разумеется, в фантастике и фэнтези. Нейросети великолепно справляются с созданием неземных пар. Здесь можно дать волю воображению. Представим киберпанк-свидание. Промт будет выглядеть так:
cyberpunk style, couple sitting on a roof of a skyscraper, futuristic city background, neon blue and pink lights, cybernetic implants, rainy night, highly detailed, Blade Runner vibes
Антураж здесь играет ключевую роль. Или возьмём фэнтези. «Elf woman and human warrior standing back to back, holding swords, dark forest background, magical glowing particles, epic composition, digital art style». Важно указать стиль отрисовки, например, «digital art» или «oil painting», чтобы уйти от фотореализма. Тем более, что в арт-стилях ИИ реже ошибается с анатомией. Изюминка таких изображений — в детализации окружения, которое подчёркивает историю персонажей.
Ошибки генерации
Бьёт ли по качеству сложность запроса? К сожалению, да. Чем больше деталей вы пытаетесь впихнуть в один промт, тем выше шанс, что нейросеть запутается. Самая частая проблема — «каша» из тел. Когда руки одного партнёра растут из спины другого. Чтобы минимизировать этот риск, стоит использовать Negative Prompts (негативные подсказки). В соответствующее поле обязательно вписывайте:
fused bodies, extra limbs, mutated hands, missing fingers, bad anatomy, two heads, blurry faces
Это своего рода спасательный круг. Ещё один нюанс — дистанция. Если ИИ упорно склеивает людей, попробуйте добавить в основной промт слова, задающие расстояние, например «standing apart» или «walking side by side». Однако и это не панацея. Иногда проще сгенерировать несколько вариантов и выбрать лучший, чем пытаться исправить безнадёжный сид бесконечными уточнениями.
Свет и локация
Отдельно стоит упомянуть влияние освещения на восприятие парного снимка. Свет — это инструмент рассказчика. Плоский свет убивает объём, делая фигуры картонными. Поэтому не скупитесь на описания световых схем. «Golden hour» (золотой час) подарит тёплые, мягкие оттенка и длинные тени — идеально для романтики на природе. «Blue hour» (сумерки) добавит загадочности и холода. Пример промта для заката:
silhouette of a couple kissing against a giant setting sun, beach horizon, warm orange and purple tones, reflection in water, wide angle shot
Здесь силуэтное решение скрывает возможные огрехи в лицах, но при этом создаёт мощный эмоциональный посыл. А для интерьерной съёмки подойдёт: «volumetric lighting pouring through the window, dust particles, cozy couple reading a book together on a sofa, warm atmosphere». Именно объёмный свет делает картинку «вкусной» и глубокой.
Стилизация под эпоху
Эстетичны ли ретро-фотографии? Безусловно. И нейросети умеют их имитировать с пугающей точностью. Чтобы отправить вашу пару в прошлое, достаточно указать год и тип плёнки или камеры. Например, для эстетики 90-х используйте:
flash photography, 1990s aesthetic, couple at a party, polaroid style, vintage outfit, direct flash, hard shadows
Жёсткие тени и вспышка в лоб — характерные черты той эпохи. Для более ранних периодов, скажем, 50-х, подойдёт: «vintage 1950s photo, couple in retro car, rockabilly style, grain, sepia tone, classic american diner background». Это позволяет создать целую серию снимков с единым настроением. Главное достояние таких промтов — они прощают мелкие несовершенства, списывая их на «винтажность» и дефекты старой плёнки.
Технические параметры
На что ещё обратить внимание? На параметры камеры. Даже если вы не фотограф, стоит запомнить пару терминов. «Bokeh» или «shallow depth of field» размоет фон, акцентируя внимание на паре. Это особенно полезно, если нейросеть рисует на заднем плане какой-то хаос. «Wide angle» (широкий угол) добавит динамики и покажет больше окружения, но может исказить пропорции лиц. А «telephoto lens» (телеобъектив), напротив, сожмёт перспективу и сделает портрет более лестным. Пример технически насыщенного промта:
full body shot of a stylish couple walking in Tokyo, shot on Sony A7R IV, 85mm lens, f/1.8, sharp focus on faces, cinematic color grading, hyperrealistic
Упоминание конкретной камеры и объектива служит для ИИ маркером высокого качества и определённой эстетики.
Финальные штрихи
Процесс создания идеального промта — это всегда эксперимент. Не стоит бояться комбинировать разные стили. Попробуйте смешать «cyberpunk» и «baroque», или «street photography» и «oil painting». Иногда самые неожиданные сочетания дают потрясающий результат. Главное — помнить о структуре: сначала кто (с деталями), потом что делают (конкретные действия), где находятся, и, наконец, как это снято (свет, камера, стиль). А если результат кажется скучным, добавьте ветра («wind blowing hair») или летящих лепестков. Эти динамичные элементы оживят застывшую сцену. И, конечно, не забывайте про настроение. Ведь именно эмоция цепляет зрителя, заставляя его задержать взгляд. Удачи вам в генерациях и пусть каждый ваш запрос превращается в маленький шедевр цифрового искусства.