Промты для совместных фото ии (с примерами готовых промтов)

Видели ли вы когда-нибудь, как нейросеть пытается изобразить влюбленную пару, а на выходе получается трёхрукий мутант с перепутанными ногами и одним глазом на двоих? Это зрелище удручающее, способное отбить всякое желание заниматься генеративным искусством. Проблема создания качественных совместных изображений — настоящая головная боль даже для опытных энтузиастов. ИИ, будь то Midjourney или Stable Diffusion, часто смешивает атрибуты персонажей, превращая сцену в хаотичную кашу, где цвет платья девушки перетекает на рубашку парня, а их лица становятся подозрительно похожими. Но чтобы не ошибиться и получить достойный результат, нужно овладеть искусством точного формулирования запроса.

Сложно ли управлять нейросетью?

Управлять «коллективным разумом» машины — задача не из лёгких. Ведь алгоритм не понимает физику тел так, как понимаем её мы. Для него люди — это просто набор пикселей и паттернов, которые нужно смешать. Главный нюанс здесь кроется в разделении персонажей. Если вы напишете «парень в синем и девушка в красном», нейросеть с большой вероятностью выдаст парня в красно-синем и девушку в фиолетовом. Смешивание цветов и стилей — классическая ошибка новичка. Чтобы этого избежать, стоит использовать синтаксические разделители и чётко структурировать описание каждого объекта. В Stable Diffusion, например, помогают операторы BREAK или AND, а в Midjourney спасает порядок слов и весовые коэффициенты (::). К слову, именно правильная расстановка акцентов творит чудеса.

Анатомия запроса

С чего начинается выбор правильного промта? С определения композиции. Скупой запрос «two people» обречён на провал. Вам придётся стать режиссёром. Необходимо задать расстояние, позу и взаимодействие. Начните с общего плана. Например, фраза «Full body shot of a couple» сразу дает понять, что нужны ноги, а не только головы. Далее следует описание внешности первого героя, затем — действие или взаимодействие, и только потом описание второго героя. Довольно часто помогает упоминание имен знаменитостей (как референс внешности), чтобы зафиксировать черты лица и избежать эффекта «близнецов». Но не стоит перебарщивать с деталями одежды, если вы не готовы использовать Inpainting для исправления ошибок.

Классический портрет

Для создания эстетичного, спокойного изображения пары, где акцент сделан на лицах и эмоциях, потребуется мягкий свет и чёткое позиционирование. Попробуйте использовать следующую конструкцию. Начинаем с субъекта: «Cinematic shot of a loving couple looking at each other». Это задает тон. Затем добавляем детали освещения: «soft volumetric lighting, golden hour, bokeh background». Это создаст тот самый романтический антураж, о котором грезят многие заказчики. Завершаем техническими параметрами: «highly detailed, 8k, photorealistic, shot on 35mm lens».

Вариант готового промта для крупного плана может выглядеть так:

«Close-up portrait of a young man and woman, forehead to forehead, closed eyes, smiling gently, intimate atmosphere, warm sunlight hitting faces, highly detailed skin texture, pores, realistic eyes, cinematic lighting, depth of field –ar 16:9 –v 6.0»

Обратите внимание, что здесь нет перегруженности цветами одежды. Это сделано намеренно. Ведь на крупном плане одежда уходит на второй план, а солирует эмоция.

Динамика и движение

А как насчет действия? Статичные позы часто выглядят искусственно. Живое фото — это движение. Снять идущих или бегущих людей сложнее, но результат того стоит. Здесь ключевым словом станет «candid» (непостановочный, случайный). Оно заставляет ИИ делать кадры, похожие на репортажную съёмку или случайный снимок папарацци.

Пример промта для прогулки:

«Full body shot of a stylish couple walking down a busy New York street, laughing, holding hands, dynamic pose, wind blowing hair, street photography style, blurred motion background, overcast lighting, urban fashion, detailed fabric texture, high contrast –ar 3:2 –stylize 250»

Этот запрос создает ощущение жизни. Кстати, параметр –stylize в Midjourney добавляет художественности, но высокие значения могут исказить анатомию, поэтому держите его в пределах 100-250 для реализма.

Свадебная тематика

Ни одна церемония не обходится без памятных снимков, и нейросети здесь стали настоящим спасательным кругом для генерации мудбордов. Свадебные фото требуют особой торжественности и внимания к деталям платья и костюма. Однако тут нас подстерегают подводные камни: ИИ обожает добавлять лишние пальцы на руки, держащие букеты, или путать слои фаты. Поэтому описание должно быть предельно конкретным.

Вот добротный вариант для свадебного кадра:

«Wide angle shot of a bride and groom standing on a cliff edge, ocean background, sunset, bride wearing a long lace wedding dress with a long veil blowing in the wind, groom in a black tuxedo, epic composition, dramatic sky, cinematic color grading, romantic mood, masterpiece –ar 16:9»

Слово «masterpiece» здесь не для красного словца, оно действительно улучшает общее качество генерации в некоторых моделях. А «wide angle shot» гарантирует, что в кадр войдет и пейзаж, и шлейф платья.

Стилизация под плёнку

Сейчас огромной популярностью пользуется ретро-эстетика. Зернистость, лёгкая размытость, несовершенные цвета — всё это придаёт кадру душу. Чтобы добиться такого эффекта, нужно забыть про слова «4k» и «sharp focus». Напротив, мы будем просить ИИ добавить «шум» и имитировать старые камеры.

Попробуйте такой вариант для атмосферного фото в стиле 90-х:

«Flash photography style, a polaroid photo of a couple sitting on a car hood at night, eating pizza, messy hair, casual clothes, vintage aesthetic, film grain, harsh flash lighting, vignette, Kodak Portra 400 aesthetic, candid moment, slightly out of focus background –ar 4:5»

Такой промт переносит зрителя в эпоху плёночных мыльниц. Наляпистость здесь даже приветствуется, ведь она добавляет реализма.

Фантастика и косплей

Грезят ли андроиды об электроовцах? Не знаем, но пользователи точно мечтают увидеть себя в образах киберпанка или фэнтези. Совместные фото в фантастических сеттингах требуют описания не только персонажей, но и окружения. Здесь важно следить, чтобы неоновый свет не «съел» лица.

Пример для киберпанк-пары:

«Two cyberpunk rebels back to back, holding futuristic glowing weapons, neon rainy city background, cybernetic implants on faces, leather jackets with LED lights, blue and pink lighting, wet asphalt reflections, Ridley Scott atmosphere, intricate details, octane render –ar 16:9»

Фраза «back to back» (спина к спине) — отличный способ композиционно разделить героев, чтобы нейросеть не пыталась их слить воедино.

Дружеские компании

Сгенерировать двух человек сложно. А трёх или четырёх? Это задача для искушённых. Чем больше людей, тем выше шанс получить деформированные лица на заднем плане. Львиная доля успеха здесь зависит от того, насколько вы готовы мириться с мелкими огрехами. Лучше всего работают промты, описывающие общее настроение вечеринки или пикника, где лица не являются главным фокусом.

Пример для группы друзей:

«Group of 4 friends sitting around a campfire on the beach at night, roasting marshmallows, laughing, playing acoustic guitar, warm firelight illuminating faces, cozy atmosphere, sparks flying up, starry sky, wide shot, realistic textures –ar 16:9»

Свет от костра (firelight) помогает скрыть недостатки анатомии в тенях, создавая при этом уютный и тёплый кадр.

Ошибки и их исправление

Обязательно ли использовать Negative Prompts? В Midjourney они менее критичны, но в Stable Diffusion — это база. Без них вы рискуете получить двойные головы или лишние конечности. В поле негативного промта стоит внести: «deformed, bad anatomy, disfigured, poorly drawn face, mutation, mutated, extra limb, ugly, disgusting, poorly drawn hands, missing limb, floating limbs, disconnected limbs, malformed hands, blurry, ..». Это своего рода страховка. Впрочем, даже с ней иногда проскакивают артефакты. Если лицо вышло неудачным, не стоит выбрасывать весь кадр. Используйте функцию Inpainting (дорисовка), чтобы перегенерировать только конкретный участок.

Разделение цветом

Как заставить ИИ одеть девушку в белое, а парня в чёрное, не смешав это в серую массу? Используйте технику «Break» (в SD) или чёткое структурирование предложений.

Пример промта с разделением:

«A photo of [a woman in a white silk dress]::2 standing next to [a man in a black tactical suit]::2, contrast lighting, forest background, spy movie poster style, serious expressions, hyperrealistic –ar 2:3»

Скобки и весовые коэффициенты :: помогают нейросети понять, что эти понятия нужно обрабатывать изолированно, но в рамках одной композиции. Это довольно мощный инструмент для контроля.

Времена года и локации

Отдых в горах: Зимняя сказка.
Снег — отличный фон, который скрывает детали и позволяет сфокусироваться на героях.

Промт:

«Couple drinking hot cocoa on a balcony of a wooden chalet, snowy mountains background, falling snowflakes, wearing knitted sweaters and hats, steam from cups, cozy winter mood, soft daylight, high resolution»

Отдых в тропиках: Пляжный сезон.
Здесь важно передать жару и влажность.

Промт:

«Fit couple running on a tropical beach, splashing water, wet skin, bright sun, palm trees, turquoise ocean, lens flare, vibrant colors, summer vibe, action shot, GoPro aesthetic»

Технические секреты

Существует ряд слов-триггеров, которые значительно улучшают качество картинки, независимо от сюжета. К слову, использование названий конкретных камер и плёнок реально работает. «Shot on Sony A7R IV» добавит резкости. «Fujifilm Velvia» сделает цвета насыщенными и контрастными. «Unreal Engine 5» придаст изображению налёт компьютерной графики высокого класса. Не скупитесь на такие уточнения. Они задают нейросети «планку качества».

Midjourney или Stable Diffusion?

Что выбрать для парных фото? Midjourney версии 6 и выше отлично справляется с композицией «из коробки». Она понимает простые запросы и выдает художественный результат. Stable Diffusion требует настройки, установки ControlNet (для задания поз через “скелеты”), но дает тотальный контроль. Если вам нужно просто красиво — идите в Midjourney. Если нужно, чтобы рука лежала именно на плече под углом 45 градусов — добро пожаловать в Stable Diffusion.

Детализация лиц

Самая большая проблема на общих планах — лица превращаются в размытые пятна. Нейросеть экономит ресурсы на мелких деталях. Чтобы это исправить, добавляйте в промт слова «detailed eyes», «detailed face». Но на самом деле, лучший способ получить качественные лица на ростовом портрете — это сгенерировать изображение в высоком разрешении (Upscale) или использовать функцию «Hires. fix» в процессе генерации. Это серьёзное вложение вычислительных мощностей, но оно того стоит.

Чёрно-белое кино

Иногда цвет только мешает. Монохромные снимки выглядят драматично и скрывают ошибки цветокоррекции.

Промт для нуара:

«Noir style photography, couple standing under a street lamp in the rain, heavy shadows, silhouette, trench coats, fedora hat, cigarette smoke, mystery, high contrast black and white, dramatic lighting, cinematic composition»

Игра теней здесь создает историю без слов. Это же правило касается и силуэтных снимков на фоне заката — простой и беспроигрышный вариант.

Вместо послесловия

Работа с промтами для совместных фото — это постоянный эксперимент. Вы будете натыкаться на ошибки, смеяться над трёхногими людьми и восхищаться случайными шедеврами. Главное — не опускать руки после первой неудачной генерации. Меняйте порядок слов, играйте со светом, добавляйте стили. Нейросеть — это инструмент, который в умелых руках способен творить чудеса. Пусть ваши виртуальные фотоальбомы пополнятся кадрами, которые сложно отличить от реальности, и каждый новый запрос станет отличным решением для ваших творческих задач.