Устав от суеты однотипных соло-генераций, многие авторы рано или поздно замахиваются на создание масштабных групповых сцен. Сделать портрет одного человека довольно просто, а вот усадить в кадр пять или семь родственников разных возрастов — задача, от которой у алгоритмов буквально плавятся электронные мозги. Лица сливаются в жуткие маски, анатомия даёт сбой, а вместо благородного семейства на выходе получается пугающее сборище мутантов. Но чтобы не ошибиться в тонких настройках весов и композиции, придётся изрядно попотеть над текстовым запросом.
Композиция кадра
Пятьдесят миллиметров — именно такое фокусное расстояние объектива спасает геометрию лиц при многофигурной рассадке. Сначала формируется общий задний план, заполненный мягким студийным светом, затем выстраивается средний план с сидящими старшими родственниками, обрамлённый стоящими позади молодыми людьми. К слову, довольно часто искусственный интеллект путает пропорции тел, если жёстко не задать структуру сцены в самом начале текста. А вот пример рабочего запроса, который разложит всё по полочкам:
A photorealistic portrait of a large multi-generational family, 7 people, seated and standing, grandparents in the center, parents and children around them, shot on 50mm lens, f/5.6, studio lighting, hyper-detailed faces, 8k resolution, cinematic composition
Сложно ли удержать фокус на всех персонажах? Да, но результат того стоит. Ведь именно грамотный композиционный скелет не позволит машине превратить добротный семейный портрет в абсолютную наляпистость.
Как выбрать стиль и освещение?
Задача не из лёгких. Ведь свет решает абсолютно всё. Не стоит перебарщивать с драматичными тенями, если вы планируете изобразить счастливое торжество. Лучше отказаться от жёсткого контрового света, убивающего детализацию мелких черт лица. Мягкий рассеянный свет из большого окна, дополненный тёплыми бликами торшеров, творит настоящие чудеса. Тем более, что винтажный антураж всегда приковывает внимание зрителя. Для создания такой атмосферы отлично подойдёт следующая текстовая комбинация:
Нереальный визуал и кинематографичное видео в пару кликов 🎬
Нужен крутой концепт-арт, реалистичная анимация или профессиональный апскейл? Теперь у вас есть единый доступ к лучшим визуальным нейросетям планеты: Midjourney, Runway, Kling и Sora. Улучшайте качество готовых роликов до максимума с помощью встроенных ИИ-инструментов. Никаких сложных настроек, мощного ПК или зарубежных карт. Всё работает прямо в браузере или в Telegram-боте!
Откройте новые горизонты для творчества. Жмите на ссылку, регистрируйтесь и создавайте шедевры 👉 https://clck.ru/3RNCRL
A large family gathering, vintage 1920s style clothing, sepia tone, soft natural window light, Rembrandt lighting, highly detailed, aristocratic atmosphere, Kodak Portra 400
Буквально пару лет назад нейросети выдавали жуткие артефакты при попытке наложить ретро-фильтр на группу, но сейчас мощные модели справляются с этим безупречно. Ну и, конечно же, не забываем про качественный фон, который венчает всю картину.
Инструментарий: Midjourney и Stable Diffusion
Выбор софта огромен. И всё же разница между популярными генераторами колоссальная. Midjourney тяготеет к глянцевой, слегка вычурной картинке, где каждый кадр выглядит как грандиозный постер голливудского фильма. А вот Stable Diffusion — это настоящий кладезь для скрупулёзного творца. Именно здесь региональные промты позволяют разделить холст на невидимые зоны. Нет смысла переплачивать за дорогие облачные сервисы, если в вашем системном блоке стоит внушительная видеокарта. В локальном интерфейсе можно прописать следующее:
Break // Left: an old man, 80 years old, sitting in a leather armchair // Center: a young couple hugging // Right: two kids playing on an ornate rug // Background: luxury living room, fireplace, masterpiece, best quality
Такая структура не сильно ударит по кошельку, если железо позволяет генерировать картинки дома, да и самим авторам комфортнее контролировать процесс. Естественно, придётся повозиться с настройками весов (иногда до сотых долей), чтобы границы зон не выглядели рваными.
Стоит ли детализировать лица?
Обязательно ли прописывать внешность каждого члена семьи поимённо? Вовсе нет. Это тяжёлый, но далеко не всегда эффективный способ. Дело в том, что перегруженный сотней прилагательных запрос сбивает с толку языковую модель. Львиная доля внимания алгоритма оседает на первых строчках, поэтому внешность лучше задавать крупными мазками. К первой группе относится старшее поколение, во-вторых, прописываются родители, ну и, наконец, дети. Вот изысканный и рабочий вариант:
Hyper-realistic family portrait, grandfather with deep wrinkles and white beard, grandmother with silver hair and warm smile, father in his 40s wearing glasses, teenage boy, little girl holding a teddy bear, distinct facial features, perfect eyes
Разумеется, на общих планах глаза могут смазаться. И тут на помощь приходят сложные махинации с локальной перерисовкой. Каждое лицо, выделенное маской, обработанное через Inpaint, доведённое до совершенства правильным апскейлером, приобретает невероятную живость.
Одежда и эпоха
Выбор гардероба диктует правила. Тщательно выстраивать кадр приходится авторам, желающим облачить своих персонажей в строгий классический костюм или пышные платья. С фактурами тканей дело обстоит сложнее, поскольку ИИ любит смешивать стили, выдавая кроссовки под кринолином. Стоит отметить, что цветовая гамма одежды должна гармонировать между собой. Один из самых популярных видов стилизации — английский твид, далее следует викторианская классика, последним в списке идёт современный минимализм. Попробуйте направить генератор в нужное русло:
Family wearing matching autumn outfits, wool sweaters, tweed jackets, beige and burgundy colors, highly detailed fabric textures, elegant poses
Обыватель редко обращает внимание на то, как падает свет на складки шерсти, однако именно этот нюанс делает изображение реалистичным. Не забудьте проверить логику нарядов, чтобы летом герои не стояли в шубах.
Чем генерация ретро-снимков лучше современных?
Наряд для избранных. Исторический сеттинг скрывает множество мелких огрехов машинного зрения. Вспомним технологию: первые семейные дагеротипы делались с выдержкой в пятнадцать минут, поэтому люди на них выглядят застывшими. Солирует в таких кадрах именно колоритный антураж и лёгкая размытость по краям. На современной футболке любая аномалия сразу бросается в глаза, тогда как в пышных кружевах девятнадцатого века лишняя деталь легко маскируется под элемент декора. Безусловно, стоит протестировать такой промт:
Victorian era family portrait, 1890s fashion, stern facial expressions, large wealthy family posing for a camera in a studio, antique photo texture, scratched film, sepia, highly detailed faces, sharp focus on the center
Конечно, современный кэжуал-стиль тоже имеет право на жизнь, однако исконно старинные портреты обладают какой-то магнетической привлекательностью. Местный бомонд прошлых столетий, воссозданный искусственным интеллектом, всегда заслуживает истинного уважения.
Рендеринг и постобработка
Хотя и кажется процесс прозрачным, но подводные камни обязательно всплывут на этапе сохранения высокого разрешения. Не стоит гнаться за максимальным размером картинки сразу в момент первой генерации. Начинать нужно с базовых пропорций шестнадцать на девять, постепенно увеличивая масштаб через специализированные нейронные сети для апскейла. Корпус изображения, усиленный текстурными картами, дополненный микроконтрастом, избавленный от цифрового шума, выглядит невероятно профессионально. Впрочем, огромная ложка дёгтя кроется в генерации рук. Пальцы, сплетённые вместе, нейросеть до сих пор воспринимает с огромным трудом. Выручит грамотный негативный запрос:
mutated hands, extra fingers, fused faces, blurry, deformed, bad anatomy, poorly drawn faces, low resolution, cloning, poorly drawn hands, missing limbs
Разумеется, внести свою лепту в финальный результат придётся и классическим графическим редакторам, где можно штампом убрать лишнюю конечность.
Терпение и правильные формулировки помогут создать по-настоящему самобытный цифровой шедевр. Стоит лишь немного поэкспериментировать с эпохами, светом и расстановкой фигур в кадре. Пусть ваш масштабный семейный холст, сотканный из пикселей и точно выверенных слов, порадует домочадцев и станет отличным решением для пополнения профессионального портфолио.

