Собрать четверых человек в одном кадре так, чтобы никто не моргнул, не скривил лицо и смотрел точно в объектив, — задача не из лёгких, с которой порой не справляются даже опытные фотографы-портретисты. В динамике групповой съёмки всегда присутствует элемент хаоса, который приходится контролировать буквально по секундам. С приходом генеративных нейросетей, казалось бы, проблема должна была исчезнуть, уступив место чистому творчеству, но тут пользователи столкнулись с новой бедой: искусственный интеллект то и дело норовит «склеить» персонажей, добавить лишнюю руку или превратить друзей в близнецов. Генерация группы людей требует особого подхода, ведь чем больше лиц в кадре, тем сложнее алгоритму удерживать композиционную целостность и уникальность каждого героя. А начать погружение в эту тему стоит с понимания базовой геометрии кадра, без которой хороший запрос просто не сработает.
Сложно ли управлять толпой?
Управлять цифровыми персонажами ничуть не проще, чем живыми моделями. Львиная доля успеха здесь зависит от того, насколько чётко вы зададите пространственные отношения между объектами. Если просто написать «4 человека стоят», нейросеть, скорее всего, выстроит их в скучную шеренгу, напоминающую полицейский отчёт или школьную линейку. Нужна динамика. К слову, довольно часто новички забывают указывать тип взаимодействия. Стоит отметить, что глаголы действия — это тот самый «клей», который делает картинку живой. Глаголы вроде talking, laughing, walking, dining задают тон всей сцене. Тем более, что современные версии Midjourney или Stable Diffusion отлично понимают контекст. Однако не стоит перегружать запрос лишними деталями одежды для каждого из четверых, иначе система запутается и смешает цвета рубашек в одну непонятную кашу. Главное — задать общий стиль и атмосферу.
Дружеская вечеринка
Один из самых востребованных сценариев — это изображение компании друзей, которые просто хорошо проводят время. Здесь важно поймать момент искренности, ту самую «химию», которая возникает между близкими людьми. Для создания атмосферного кадра в городском стиле можно использовать запрос, описывающий прогулку или посиделки на крыше. Представьте себе закатное солнце, тёплый свет и смеющихся молодых людей. Промт для такой сцены может звучать так:
group of 4 diverse friends laughing and talking on a rooftop terrace at sunset, holding drinks, casual urban fashion, golden hour lighting, cinematic composition, depth of field –ar 16:9
Обратите внимание на уточнение diverse friends — это помогает избежать генерации четырёх одинаковых клонов. А если хочется чего-то более динамичного, например, сцены в движении, то отличным решением станет имитация уличной фотографии. Запрос может выглядеть следующим образом:
full body shot of 4 stylish friends walking towards camera on a Tokyo street at night, neon lights reflections, cyberpunk vibe, streetwear, confident expressions, 35mm photography –ar 3:2
В этом случае мы задаем конкретную локацию и освещение, что сразу же создаёт нужный антураж.
Семейный портрет: Уют и тепло
Работать с семейными образами — занятие кропотливое, но благодарное. Здесь на первый план выходят эмоции и тактильность. Семья — это всегда про близость, поэтому персонажи должны находиться в контакте друг с другом, будь то объятия или просто касания плеч. Классический, но от этого не менее выигрышный вариант — это пикник на природе. Зелень, естественный свет и расслабленные позы творят чудеса. Для создания такой идиллии можно использовать промт:
happy family of 4, parents and two children, having a picnic in a sunny park, sitting on a plaid blanket, eating sandwiches, blurry green background, natural lighting, candid shot, 8k resolution –ar 4:3
Заметьте, мы уточнили состав группы (parents and two children), чтобы нейросеть понимала возрастную градацию. Это довольно просто, но критически важно. Ещё один добротный сценарий — домашний уют. Представьте вечер у камина или совместное чтение книги. Запрос для такой сцены будет выглядеть так:
cozy indoor shot, family of 4 sitting on a large beige sofa, reading a book together, warm fireplace light, scandinavian interior style, soft shadows, high detail texture –v 6.0
Такая детализация интерьера помогает «заземлить» персонажей, вписать их в пространство.
Деловой квартет
В бизнес-сфере требования к визуалу совершенно иные: здесь солирует строгость, собранность и профессионализм. Однако избегайте клише вроде «люди в костюмах жмут руки» — это выглядит вычурно и неестественно. Лучше показать процесс работы, мозговой штурм или обсуждение важного проекта. Офисная среда с её стеклом и бетоном создаёт отличный фон. Попробуйте сгенерировать сцену совещания с таким промтом:
4 business professionals standing around a table looking at blueprints, modern glass office meeting room, panoramic city view window, serious focused expressions, business attire, corporate photography style, bright daylight –ar 16:9
Здесь акцент сделан на действии (looking at blueprints), что придаёт кадру смысл. К тому же, стоит упомянуть и более неформальную деловую обстановку, например, кофе-брейк или встречу в лобби отеля. Промт может быть таким:
group of 4 colleagues chatting casually in a modern hotel lobby, drinking coffee, smart casual clothing, depth of field, soft bokeh, professional lighting, editorial shot
Такой подход делает изображение менее «стоковым» и более живым.
Фэнтези и приключения
Вот где можно дать волю фантазии и не бояться экспериментов. Генерация группы из четырёх приключенцев — это классика жанра RPG, и нейросети справляются с ней на удивление хорошо. Главное здесь — разнообразие классов и экипировки. Чтобы избежать ситуации, когда все герои выглядят как братья-близнецы в одинаковых доспехах, нужно хотя бы в общих чертах обозначить их роли. Классическая «партия» может быть описана так:
epic fantasy group of 4 adventurers walking through a mystical forest, a warrior in heavy armor, a mage with glowing staff, a rogue in hood, and an elven archer, dynamic poses, fog, god rays, unreal engine 5 render, highly detailed –ar 16:9
Перечисление архетипов (воин, маг, плут, лучник) даёт нейросети чёткие инструкции по визуальному разделению персонажей. А если вас тяготеет к научной фантастике, то стоит попробовать космическую тематику. Представьте команду звездолёта на мостике:
sci-fi crew of 4 people standing on the bridge of a spaceship, staring at a giant nebula in space window, futuristic uniforms, neon blue control panels, cinematic lighting, jj abrams lens flare style, hyperrealistic –ar 2:1
Такая картинка сразу приковывает внимание своей масштабностью и глубиной.
В чём секрет композиции?
Расположение людей в кадре играет решающую роль. Если не указать иное, нейросеть часто ставит людей в ряд. Это выглядит скучно. Чтобы добавить глубины, используйте слова-маркеры, описывающие планы. Например, low angle (нижний ракурс) придаёт героям величественности, а overhead shot (вид сверху) позволяет показать интересную геометрию расположения. Безусловно, можно играть и с расстоянием. Попробуйте добавить в промт конструкцию, где один человек находится ближе к камере, а остальные — чуть позади. Пример сложного композиционного запроса:
wide shot, 4 friends running on the beach towards the sea, view from behind, sunset reflection in water, dynamic motion blur, wide angle lens, emotional atmosphere
Здесь мы не видим лиц, но чувствуем движение и свободу. И всё же, не стоит забывать про формат кадра. Для групповых снимков горизонтальная ориентация (–ar 16:9 или 3:2) подходит гораздо лучше, чем вертикальная или квадратная, так как даёт больше «воздуха» по краям и предотвращает сплющивание фигур.
Технические нюансы и ошибки
При генерации четырёх человек самая частая проблема — это «каша» из конечностей или лиц на заднем плане. ИИ иногда сложно отрисовать восемь рук и сорок пальцев корректно. Спасательный круг в этой ситуации — это негативные промты (negative prompts), если ваша нейросеть их поддерживает, или уточнения высокого качества. Стоит добавить в конец запроса слова вроде symmetrical faces, anatomically correct, detailed eyes. Но есть и другой подводный камень: чрезмерная детализация. Если вы попытаетесь описать цвет глаз каждого из четырёх героев, нейросеть просто проигнорирует половину запроса или перемешает признаки. Лучше отказаться от микроменеджмента и довериться общему стилю. К слову, довольно часто проблемы возникают при попытке совместить несовместимое, например, фотореализм и мультяшные пропорции в одном запросе. Определитесь со стилем заранее: либо photorealistic, либо pixar style, но не всё сразу. А если лица на дальнем плане выглядят размытыми, это нормально для оптики, но если это мешает, добавьте deep focus или f/8 aperture, чтобы увеличить глубину резкости.
Музыкальный бенд
Ещё одна популярная тема — создание образов для музыкальной группы. Будь то обложка альбома или постер, здесь важен стиль и позерство в хорошем смысле слова. Рок-группа в гранжевом подвале или поп-квартет в неоновой студии — выбор за вами. Изюминка таких изображений часто кроется в инструментах. Однако будьте осторожны: нейросети всё ещё плохо рисуют гитары и барабанные установки, часто искажая их форму. Поэтому иногда лучше сделать акцент на лицах и настроении, оставив инструменты в расфокусе или за кадром. Пример удачного промта:
rock band photoshoot, group of 4 musicians posing in an abandoned warehouse, leather jackets, moody lighting, smoke machine effect, attitude, tattoos, dramatic shadows, 85mm lens portrait –ar 3:2
Здесь нет акцента на сложном оборудовании, зато есть атмосфера бунта и свободы. Ну и, конечно же, можно попробовать стилизацию под винтажные постеры 80-х, добавив synthwave style или retro grainy film aesthetic.
Стиль жизни и хобби
Групповые фото часто иллюстрируют какие-то увлечения. Это может быть совместная готовка, занятия йогой или игра в настолки. Такие сюжеты выглядят очень естественно и привлекательно для зрителя. Например, сцена на кухне требует внимания к деталям интерьера и освещению. Промт может звучать так:
4 friends cooking together in a modern white kitchen, lots of vegetables on table, flour in the air, laughing, bright morning sunlight, messy but happy atmosphere, candid lifestyle photography –ar 16:9
Деталь flour in the air (мука в воздухе) добавляет динамики и жизни. А если говорить о спорте, то тут важна синхронность или, наоборот, взаимодействие. Запрос для йоги:
group of 4 women doing yoga in a park at sunrise, tree pose, wearing sportswear, calm faces, harmony with nature, soft golden light, lens flare, peaceful vibe
Такие изображения излучают спокойствие и здоровье.
Генерация изображений с несколькими персонажами — это всегда увлекательный эксперимент, где результат порой превосходит самые смелые ожидания. Да, иногда придётся сделать десяток попыток, чтобы убрать лишнюю руку или поправить взгляд, но когда вы натыкаетесь на тот самый идеальный кадр, ощущение творческой победы того стоит. Не скупитесь на эпитеты, играйте со светом и стилями, ведь нейросеть — это всего лишь инструмент, а настоящим художником в этом процессе остаётесь именно вы. Пусть ваши виртуальные герои обретут свой уникальный характер, а каждая новая генерация станет отличным решением для ваших творческих задач.