Сколько раз вы пытались сгенерировать идеальную пару, а получали сиамских близнецов, людей с перепутанными конечностями или вовсе абстрактную мешанину из тел? Проблема знакома каждому, кто хоть раз открывал Discord с Midjourney или запускал Stable Diffusion. Кажется, что нейросети, блестяще справляющиеся с одиночными портретами, впадают в ступор, когда в кадре появляется второе действующее лицо. Взгляды косят, руки живут своей жизнью, а стилистика «плывёт» от одного персонажа к другому. Это и неудивительно, ведь алгоритму довольно сложно разграничить, где заканчивается один объект и начинается другой, особенно при тесном взаимодействии. Но чтобы не ошибиться и получить добротный результат, нужно лишь понять логику машины и запастись проверенными формулировками.
Сложно ли управлять двумя персонажами?
Сложно, но возможно. Вся суть в том, что ИИ воспринимает текст не как строгую инструкцию, а как набор тегов с разным весом. Если вы напишете просто «мужчина и женщина», система начнёт импровизировать, и эта импровизация вам вряд ли понравится. Главное — чётко разделить субъекты или, наоборот, объединить их общим действием. Помогает ли здесь сложный синтаксис? Отчасти. Но чаще спасает конкретика. Стоит отметить, что львиная доля успеха зависит от правильного описания взаимодействия, а не только внешности.
Романтика и крупные планы
Начать стоит с классики. Портреты влюблённых — это самый популярный запрос. Здесь важно задать атмосферу и близость, но не переборщить с «обнимашками», иначе нейросеть может запутаться в руках. Довольно просто получить качественный результат, если использовать кинематографичные описания. К примеру, отличным стартом станет такой промт:
«Cinematic shot of a young couple looking at each other with love, golden hour lighting, soft bokeh background, highly detailed faces, 8k resolution»
Этот запрос хорош тем, что он фокусируется на взглядах, избегая сложной физики тел.
А если хочется больше тактильности? Тогда придётся уточнять позы. Попробуйте вариант, где герои стоят рядом, но не переплетены в сложный узел:
«A loving couple standing back to back, urban sunset background, street style clothing, warm color palette, photorealistic, intricate details»
Здесь мы разводим персонажей в пространстве (спина к спине), что упрощает задачу алгоритму. Результат обычно выглядит стильно и чисто. Ну и, конечно же, нельзя забывать про чёрно-белую эстетику, которая скрывает мелкие огрехи кожи и освещения. Запрос «Black and white photography of a couple hugging gently, rainy day, emotional atmosphere, sharp focus, vintage style» творит чудеса, создавая драматичный и глубокий кадр.
Прогулки и динамика: Промты для полного роста
Статичные портреты — это хорошо, но иногда нужен экшн. И вот тут всплывают главные проблемы: «плавающие» ноги и несоответствие роста. Чтобы избежать казусов, стоит задавать окружение, которое «якорит» персонажей. Представьте сцену прогулки. Запрос может выглядеть так:
«Full body shot of a couple walking in a park holding hands, autumn leaves falling, dynamic pose, casual fashion, natural lighting, wide angle lens»
Обратите внимание на уточнение «wide angle lens» — оно подсказывает ИИ, что нужно показать сцену целиком, а не обрезать головы.
Другой интересный вариант — это совместное занятие. Например, пикник или чтение. Весьма колоритный результат выдаёт промт:
«Top down view of a couple lying on grass, laughing, surrounded by flowers, summer vibes, bright colors, high quality»
Ракурс сверху (top down view) — это настоящий спасательный круг для тех случаев, когда фронтальные композиции выходят кривыми. Лица здесь не так важны, как общая геометрия и настроение. А вот если нужна городская история, то подойдёт такой вариант:
«Couple drinking coffee at a street cafe table, Paris atmosphere, morning light, detailed architecture in background, candid shot»
Слово «candid» (случайный, естественный кадр) добавляет живости, убирая эффект постановочной пластиковой куклы.
Семейные фото и разница в возрасте
Сложнее всего даются генерации, где персонажи сильно отличаются по габаритам, например, взрослый и ребёнок. Нейросеть часто пытается «усреднить» их рост или лицо. Изюминка правильного промта здесь в жёстком указании ролей. Не пишите просто «два человека». Пишите:
«A mother holding her little daughter in arms, happy expressions, sunlight streaming through window, cozy home interior, pastel colors, soft focus»
Указание действия «holding in arms» (держит на руках) создаёт единый блочный объект для нейросети, что проще для прорисовки.
Для изображения пожилой пары, гуляющей по пляжу, отлично сработает:
«Elderly couple walking along the ocean shore, holding hands, view from behind, sunset, calm waves, realistic texture of clothes, 4k»
Вид со спины (view from behind) — это вообще лайфхак. Он позволяет передать эмоцию и историю без риска получить искажённые лица, что с пожилыми персонажами случается довольно часто из-за обилия морщин, которые ИИ может интерпретировать как артефакты.
Стилизация: От киберпанка до масла
Реализм — это прекрасно, но иногда душа просит творчества. Совместные арты в определённой стилистике часто получаются даже лучше, чем фото, потому что рисованный стиль прощает анатомические вольности. Любителям фантастики стоит попробовать:
«Cyberpunk couple standing on a neon roof, futuristic armor, glowing swords, raining night city, vibrant blue and pink lights, anime style, highly detailed»
Здесь наляпистость и яркость играют на руку, скрывая возможные огрехи в деталях костюмов.
Тем, кто тяготеет к классическому искусству, подойдёт имитация масляной живописи. Это всегда выглядит внушительно и дорого. Попробуйте такой вариант:
«Oil painting of a royal couple in renaissance clothes, standing in a palace hall, intricate golden embroidery, dramatic lighting, Rembrandt style, visible brushstrokes»
Такой запрос создаёт величественный и добротный образ, где даже слегка неправильные пропорции будут выглядеть как авторское видение художника, а не ошибка машины.
Групповые снимки: Трое и больше
Это уже задача со звёздочкой. Чем больше лиц, тем выше шанс, что кто-то один получится с тремя глазами. Но и тут есть хитрости. Главное — выстроить композицию. Не давайте персонажам толпиться. Используйте промт:
«Three friends sitting on a sofa playing video games, emotional faces, messy room background, pizza boxes, modern cartoon style, vivid colors»
Мультяшный стиль (modern cartoon style) отлично справляется с групповой динамикой.
Если же нужен строгий офисный вариант, то формулировка должна быть сухой и чёткой:
«Corporate team of four people standing in a modern office, wearing suits, confident smiles, glass walls background, professional photography, studio lighting»
Здесь слово «uniform» или «suits» помогает ИИ унифицировать одежду, чтобы не было путаницы в стилях, когда пиджак одного плавно перетекает в рубашку другого.
Нюансы, о которых стоит помнить
Есть ряд слов-паразитов и, наоборот, слов-помощников. К примеру, крайне полезно использовать параметры соотношения сторон. В Midjourney это «–ar 16:9» или «–ar 3:2». Для совместных фото горизонтальный формат предпочтительнее, так как даёт больше «воздуха» вокруг фигур. Вертикальный кадр часто зажимает плечи, заставляя нейросеть сплющивать тела.
Кроме того, не стоит забывать про Negative Prompt (негативный промт), если вы используете Stable Diffusion. Вписывайте туда все, чего боитесь: «deformed, bad anatomy, extra limbs, fused bodies, ugly faces, blurry, low quality». Это не панацея, но своеобразный фильтр, отсекающий откровенный брак.
Как выбрать стиль одежды?
Одежда — это больная тема. Часто бывает так, что цвета смешиваются: платье девушки становится цвета рубашки парня. Чтобы этого избежать, разнесите описание одежды в разные части предложения или используйте технику «breaking» (разрыв). Например:
«Man wearing black tuxedo AND woman wearing red evening dress, dancing ballroom, elegance, spotlight, marble floor»
Союз AND (иногда выделенный капсом) или запятые помогают расставить акценты. Хотя и с этим бывают промашки.
Ещё один нюанс — детализация. Не перегружайте промт лишними подробностями вроде «пуговицы с перламутром» или «шнурки зелёного цвета», если это не критично для сюжета. ИИ уделит этому слишком много внимания в ущерб лицам. Лучше сосредоточиться на общем стиле: «vintage clothes», «casual look», «fantasy armor». Этого вполне достаточно для создания цельного образа.
Свадебная тематика
Ни одна церемония не обходится без фотосессии, пусть даже виртуальной. Свадебные промты — это отдельный жанр, где важна торжественность. Частая ошибка — попытка описать всё убранство зала сразу. Начните с пары. Вот проверенный рецепт:
«Bride and groom standing under a floral arch, kissing, white lace dress, black suit, sunny garden background, romantic atmosphere, soft pastel palette, professional wedding photography»
Заметьте, мы не описываем гостей. Они лишь создадут шум и испортят кадр лицами-призраками.
Если хочется показать именно наряд, используйте:
«Close-up of a bride and groom holding hands, focus on rings, blurred background, high detail texture of fabric, elegant style, natural light»
Такой подход позволяет получить идеальные руки (ну, почти идеальные, насколько это возможно сейчас) и акцент на важном событии без лишней визуальной мишуры.
Влияет ли версия модели?
Безусловно. Разница между, скажем, Midjourney v4, v5 и v6 колоссальная. Более старые версии тяготеют к артовости и часто ошибаются в анатомии при взаимодействии тел. Свежие модели (v6 и новее) гораздо лучше понимают физику объятий и касаний. Поэтому, если ваш промт не работает, возможно, дело не в словах, а в выбранном движке. В Niji (аниме-модели) совместные сцены вообще получаются наиболее органично, так как стилизация сглаживает углы.
Стоит ли использовать имена знаменитостей?
Это палка о двух концах. С одной стороны, добавление «Brad Pitt» или «Marilyn Monroe» даёт нейросети чёткий референс лица. С другой — если вы пытаетесь скрестить двух известных людей в одном кадре, результат может быть непредсказуемым. Их черты лица могут смешаться. Тем не менее, для тестов это хороший вариант. Пример:
«Batman and Superman shaking hands, dramatic city background, comic book style, highly detailed costumes, cinematic lighting»
Архетипичные образы считываются машиной на ура.
Фантазийные существа и люди
А что если ваш партнёр по фото — не человек? Дракон, робот или пришелец? Здесь вступает в силу правило масштаба. Махинации с перспективой неизбежны. Промт должен чётко задавать размеры:
«A small girl standing next to a giant friendly robot, forest background, sunlight beams, mossy metal texture, Ghibli style, heartwarming atmosphere»
Слова «small» и «giant» являются здесь ключевыми якорями. Без них робот будет ростом с человека, и магия исчезнет.
Итоги экспериментов
Создание совместных изображений — это процесс не быстрый, но увлекательный. Вы будете натыкаться на ошибки, видеть трёхногих людей и странные улыбки. Это нормально. Главное — не зацикливаться на одном варианте. Меняйте ракурсы, стили, освещение. Иногда замена «sunlight» на «moonlight» полностью меняет восприятие анатомии в кадре, скрывая недостатки тенями. Нейросеть — инструмент капризный, но мощный в умелых руках.
Генерируйте смело, пробуйте разные комбинации и не бойтесь удалять неудачные дубли. Ведь в конечном итоге среди десятка странных картинок обязательно найдётся тот самый шедевр, который займёт достойное место в вашей цифровой коллекции или станет основой для вдохновения. Удачи в творческих поисках!