Промт для генерации изображений пары (с примерами готовых промтов)

Виртуальное искусство, казалось бы, достигло небывалых высот, но почему же тогда при попытке создать трогательное изображение влюблённых мы так часто натыкаемся на стеклянные взгляды или анатомические странности? Многим знакома ситуация: вы вводите запрос, ожидая увидеть страсть и химию, а нейросеть выдаёт двух случайных прохожих, которых просто поставили рядом. Проблема здесь кроется не в самой технологии, а в том, как именно мы формулируем свои мысли для бездушного алгоритма, ведь он воспринимает слова буквально, игнорируя контекст чувств. Но чтобы магия всё-таки случилась, а цифровая картина обрела душу, стоит погрузиться в нюансы составления правильного описания.

С чего начинается работа?

Сложно ли объяснить машине, что такое любовь? Довольно сложно, если использовать абстрактные понятия. Самая распространённая ошибка — это надежда на слово «романтика». Для ИИ это пустой звук. Ему нужна конкретика действий и физических проявлений. Первым делом стоит определить дистанцию и характер взаимодействия. Ведь «пара» может стоять в метре друг от друга, а может сплетаться в объятиях. Начать описание лучше с главных действующих лиц, но не перегружать их деталями сразу. Достаточно указать типаж: «молодая пара», «пожилые супруги» или «эльф и воительница». А вот уже после этого следует переходить к глаголам, описывающим их связь.

Анатомия взаимодействия

Секрет живого кадра — в микродействиях. Просто «держатся за руки» — это скучно и довольно банально. А вот «он нежно поправляет прядь волос за её ухо» или «она положила голову ему на плечо, закрыв глаза» — это уже история. Огромную роль играет направление взгляда. Смотрят ли они в камеру? Это рушит интимность момента. Куда лучше работает конструкция, где герои смотрят друг на друга или в одном направлении, устремив взор вдаль. Стоит отметить, что глаголы вроде «смеются», «шепчут», «танцуют» задают динамику, которой так часто не хватает статичным генерациям. К тому же, нельзя забывать про язык тела: наклон головы, положение рук, расслабленность или напряжение в позах. Всё это считывается зрителем мгновенно.

Атмосфера и освещение

Свет творит чудеса. Он может превратить обычную сцену в шедевр кинематографа. Не стоит скупиться на описания времени суток и источников освещения. «Золотой час» (golden hour) подарит тёплые, медовые оттенки кожи и мягкие длинные тени. «Синий час» (blue hour) добавит меланхолии и таинственности. Если же хочется драмы, то выручит «контрастный свет» (chiaroscuro) или «неоновое свечение» (neon lighting). Антураж тоже имеет значение. Это может быть уютная кофейня с запотевшими окнами, шумная улица под проливным дождём или фантастический лес. Главное — связать окружение с настроением пары. Дождь, например, часто сближает персонажей, заставляя их теснее прижиматься друг к другу под одним зонтом.

Детализация внешности

Нужно ли описывать каждую пуговицу? Вовсе нет. Излишняя детализация может сбить алгоритм с толку, и он начнёт смешивать цвета одежды, превращая наряд в пёстрое месиво. Лучше выделить по одной яркой детали для каждого: «на ней красное шёлковое платье», «на нём твидовый пиджак». Этого вполне достаточно, чтобы создать контраст. Важный нюанс касается волос и текстур кожи. Слова «detailed skin texture», «freckles» (веснушки), «messy hair» (растрёпанные волосы) добавляют реализма. Идеально уложенные причёски часто выглядят искусственно, а вот лёгкая небрежность делает образ живым.

Стилистика изображения

Как выбрать визуальный язык? Здесь всё зависит от вашей цели. Если вы грезите о фотореализме, то стоит использовать технические маркеры камер и плёнок. Фразы «shot on Kodak Portra 400», «35mm film», «bokeh» (размытие фона) мгновенно меняют восприятие картинки, делая её похожей на дорогой аналоговый снимок. Для любителей живописи подойдут отсылки к стилям: «oil painting», «watercolor», «impressionism». А если хочется чего-то современного и цифрового, то помогут «Unreal Engine 5», «Octane render», «Cyberpunk style». Но смешивать всё в кучу не стоит — выберите одно направление и придерживайтесь его.

Технические команды

Нельзя не упомянуть и параметры, которые пишутся в конце промта (особенно актуально для Midjourney). Соотношение сторон задаётся параметром --ar. Для парных портретов отлично подходят форматы 3:2 (горизонтальный, кинематографичный) или 2:3 (вертикальный, более интимный). Квадрат 1:1 часто режет композицию, оставляя слишком мало воздуха по бокам. Также полезно использовать параметр стилизации --s (stylize), который отвечает за художественную свободу нейросети. Высокие значения (например, 750) дадут более красивую, но менее точную картинку, а низкие — строгое следование вашим словам.

Кинематографичная романтика

Представьте сцену из мелодрамы. Дождь, вечерний город, двое под зонтом. Такой сюжет требует акцента на освещении и каплях воды. Для реализации этой задумки конструкцию можно выстроить следующим образом:

“Cinematic shot of a young couple standing in the rain on a busy New York street at night, looking into each other’s eyes, passionate atmosphere, wet hair, holding a transparent umbrella, reflections of neon signs in puddles, shot on 35mm lens, f/1.8, bokeh background, hyper-realistic, 8k, –ar 16:9”

Здесь мы задали и место, и действие, и технические характеристики камеры, что гарантирует добротный результат.

Уютное домашнее утро

А если хочется тепла и спокойствия? Сцена на кухне, солнечные лучи, запах кофе (который, конечно, не передать картинкой, но можно визуализировать через пар). Промт может выглядеть так:

“Cozy morning atmosphere, a happy couple sitting on a kitchen counter, drinking coffee, wearing oversized knitted sweaters, laughing, sunlight streaming through the window, dust particles dancing in the light, soft pastel colors, detailed skin texture, candid photography style, –ar 3:2”

Слово «candid» здесь играет ключевую роль — оно подсказывает ИИ, что кадр должен выглядеть как случайный, непостановочный снимок.

Фэнтезийная эпичность

Любителям сказок и эпоса стоит сделать упор на костюмы и магическое окружение. Допустим, нам нужны эльф и человек. Промт будет звучать довольно масштабно:

“Fantasy digital art, an elf female and a human male warrior standing back to back, ready for battle, dark enchanted forest background, glowing magical weapons, intricate armor details, dramatic lighting, fog, mysterious atmosphere, concept art by ArtStation trends, sharp focus, –ar 16:9”

В данном случае мы уходим от фотореализма в сторону цифрового искусства, что позволяет скрыть мелкие огрехи анатомии, свойственные сложным позам.

Стиль «Старые фотографии»

Ностальгия всегда в моде. Чтобы получить эффект снимка из 90-х или даже 70-х, нужно добавить «шум» и специфическую цветокоррекцию. Пример запроса:

“Vintage polaroid photo of a teenage couple at a rock concert in the 90s, grunge style, denim jackets, messy hair, night time, flash photography, film grain, slightly blurred motion, authentic look, nostalgic vibe, –ar 4:5”

Вспышка в лоб (flash photography) — это тот самый приём, который делает картинку максимально похожей на любительское фото из прошлого.

Свадебная эстетика

Белое платье, строгий костюм, цветы. Казалось бы, просто. Но без правильного света всё превратится в каталог одежды. Попробуйте такой вариант:

“Elegant wedding photography, bride and groom walking in a blooming garden, sunset light, backlight, veil flying in the wind, holding hands, soft romantic focus, creamy colors, intricate lace details on the dress, professional color grading, award-winning photography, –ar 2:3”

Свет сзади (backlight) создаст красивый ореол вокруг фигур, отделив их от фона и добавив воздушности.

Подводные камни и ошибки

Чего лучше избегать? Львиная доля неудач связана с противоречивыми командами. Если вы напишете «солнечный день» и «нуарный стиль», нейросеть выдаст нечто среднее и невнятное. Также не стоит писать слишком длинные предложения со сложной грамматикой. ИИ лучше понимает короткие фразы, разделённые запятыми. Ещё один момент — количество пальцев и конечностей. К сожалению, это всё ещё слабая сторона генераторов. Но здесь на помощь приходят «Negative Prompts» (негативные промты). В специальное поле (или через параметр --no в Midjourney) стоит вписать всё то, что вы не хотите видеть:

“–no bad anatomy, extra fingers, missing limbs, distorted faces, text, watermark, blur, mutation”

Это своего рода фильтр, отсекающий брак.

Работа с референсами

Иногда слов бывает недостаточно. Если у вас есть картинка, стиль или поза которой вам нравятся, смело скармливайте её нейросети. Функция Image-to-Image позволяет использовать исходное изображение как базу. Это спасательный круг для тех случаев, когда нужно сохранить конкретную композицию, но поменять героев или окружение. Однако не стоит ждать 100% копии. Нейросеть всегда вносит свою лепту, интерпретируя исходник по-своему. Разумеется, вес референса можно регулировать, но это уже тема для отдельного глубокого погружения.

Тонкая настройка эмоций

Эмоции — это не только улыбка или слёзы. Это микродвижения мышц лица. Попробуйте использовать такие слова, как «smirk» (ухмылка), «gazing with admiration» (смотрит с восхищением), «nervous bite of the lip» (нервно кусает губу). Такие уточнения делают лица персонажей невероятно выразительными. Ведь именно в несовершенстве и мимолётности кроется жизнь. Статичные, симметричные лица красивы, но мертвы. А вот лёгкая асимметрия, вызванная эмоцией, заставляет зрителя верить в происходящее.

В завершение хочется сказать, что создание идеального промта — это всегда эксперимент. Не бойтесь менять слова местами, добавлять странные эпитеты или смешивать несочетаемые стили. Порой именно ошибка или случайность рождает самый гениальный образ. Пусть ваши виртуальные пары будут живыми, истории — искренними, а процесс творчества приносит только радость и вдохновение.