Семейные фотоальбомы, хранящие историю рода, всегда обладали особой магией, заставляя нас часами всматриваться в черты лиц прабабушек и искать в них собственное отражение. В эпоху цифровых технологий и нейросетей желание запечатлеть преемственность поколений никуда не исчезло, а лишь трансформировалось, обретя новые инструменты для реализации. Обыватель может подумать, что создать портрет, где гармонично соседствуют четыре или даже пять поколений, — задача элементарная, ведь искусственный интеллект творит чудеса. Однако на практике попытка сгенерировать такой снимок часто оборачивается разочарованием: лица сливаются, возраст путается, а вместо трогательной картины получается нечто сюрреалистичное. Но чтобы не ошибиться и получить действительно добротный результат, нужно понимать логику машины и знать правильные слова-триггеры.
В чём сложность задачи?
Сгенерировать одного человека для нейросети — дело пары секунд. Но когда в кадре должны появиться сразу три, четыре или пять персонажей, да ещё и с жёсткой привязкой к возрасту и внешнему сходству, алгоритмы начинают буксовать. Основная проблема здесь — «перетекание» признаков. Нейросеть часто смешивает черты лица молодой девушки и старой бабушки, выдавая усреднённый и довольно пугающий результат. К тому же, удержать фокус на всех участниках одновременно машине сложно. Бьёт по бюджету времени и то, что пользователю приходится перебирать десятки вариантов, прежде чем «выстрелит» тот самый. Всплывут и проблемы с анатомией: лишние руки или пальцы на групповых портретах — это классика жанра. Да и композиционно выстроить кадр, где никто не перекрывает другого, — задача не из лёгких.
Анатомия правильного запроса
Любой качественный промт строится по определенной схеме, и нарушать её не стоит. Начинать нужно всегда с главного — с перечисления субъектов. Здесь важна предельная точность. Нельзя просто написать «семья из четырёх поколений». Нейросети нужна конкретика: «прабабушка 90 лет, бабушка 60 лет, мать 35 лет и дочь 7 лет». Именно указание возраста помогает алгоритму разграничить морщины, текстуру кожи и цвет волос. Далее следует описание действия и позиционирования. Как они стоят? Смотрят ли они друг на друга или в камеру? Без этих уточнений вы получите хаотичную толпу. Третий кит, на котором держится хороший кадр, — это окружение и свет. Ведь именно свет создает тот самый антураж и настроение. Ну и, наконец, технические параметры, отвечающие за стилистику (фотореализм, масляная живопись или ч/б).
Профиль: Классика жанра
Пожалуй, самый популярный и эффектный вариант — это композиция, где представительницы разных поколений выстроены в ряд в профиль. Это выглядит впечатляюще. Ведь такая постановка позволяет наглядно проследить изменение черт лица. Чтобы получить такой результат, стоит использовать конструкцию «side profile view» (вид сбоку в профиль) и «lined up» (выстроены в линию).
Попробуйте следующий вариант для Midjourney или Stable Diffusion. Он довольно объёмный, но результат того стоит:
«Side profile view, four women of different generations standing in a row, from oldest to youngest, great-grandmother 90 years old, grandmother 65 years old, mother 40 years old, daughter 10 years old, similar facial features, genetic resemblance, silhouettes, black background, dramatic rim lighting, cinematic photography, high detail, 8k, realistic skin texture –ar 16:9».
Здесь ключевую роль играет «rim lighting» (контровый свет), который очерчивает профили, не давая им слиться с тёмным фоном. А уточнение «genetic resemblance» (генетическое сходство) даёт нейросети команду искать общие черты. К слову, порядок перечисления от старшего к младшему помогает ИИ правильно расставить фигуры в пространстве.
Групповой портрет анфас
Сложнее ли сделать фронтальное фото? Безусловно. Тут машине приходится прорисовывать глаза всех участников, а взгляд — это то, на чём нейросети часто ошибаются. Однако тёплый, домашний портрет, где все смотрят в кадр, вызывает гораздо больше эмоций. Чтобы избежать каши из лиц, лучше усадить героев на диван или использовать классическую пирамидальную композицию.
Для создания уютной атмосферы подойдет такой промт:
«Group portrait of 4 generations of men, great-grandfather, grandfather, father and son, sitting on a vintage leather sofa, classic living room interior, warm fireplace lighting, smiling faces, looking at camera, detailed faces, cozy atmosphere, wool sweaters, shot on Canon R5, 85mm lens, depth of field –ar 3:2».
Обратите внимание на техническую деталь «85mm lens». Это портретный объектив, который даёт правильные пропорции лица без искажений, свойственных широкому углу. А «depth of field» (глубина резкости) поможет слегка размыть фон, акцентируя внимание на лицах. Такой подход спасает от наляпистости в деталях интерьера.
Руки как символ связи
Иногда лица не нужны вовсе. Ведь руки могут рассказать о возрасте и времени гораздо больше. Фотография, где ладонь младенца лежит в руке матери, та — в руке бабушки, и всё это поддерживает рука прабабушки, — настоящий шедевр эмоционального воздействия. Это скрупулезный запрос, требующий от нейросети понимания текстуры кожи.
Промт для такого сюжета может выглядеть так:
«Close-up top down shot, hands of four generations stacked together, wrinkled hand of great-grandmother at bottom, mature hand of grandmother, young woman’s hand, baby hand on top, contrast of skin textures, highly detailed, soft natural lighting, emotional concept, unity, beige tones, macro photography –ar 4:5».
Здесь слово-маркер — «texture contrast» (контраст текстур). Оно заставляет ИИ уделить особое внимание различию между пергаментной кожей старика и нежной кожей ребёнка. А ракурс «top down shot» (вид сверху) задает правильную геометрию кадра. Правда, с пальцами могут возникнуть проблемы (нейросети их любят дорисовывать), поэтому такой кадр, возможно, придется генерировать несколько раз.
Стилизация или реализм?
Всегда ли нужен фотореализм? Вовсе нет. Иногда стилизация под старую живопись или карандашный набросок спасает ситуацию, скрывая мелкие огрехи генерации. К тому же, живописный портрет выглядит как дорогое наследство, которое не стыдно повесить в гостиной. Масляные мазки добавляют работе солидности и художественной ценности.
Если вы хотите получить картину, а не фото, используйте этот шаблон:
«Oil painting style, portrait of 5 generations of women, victorian clothes, vintage interior, soft brushstrokes, Rembrandt lighting, rich colors, masterpiece, artstation trends, intricate details, classic art style –ar 2:3».
«Rembrandt lighting» (рембрандтовский свет) — это вообще палочка-выручалочка для портретов. Он создает объем и драматизм за счёт характерного треугольника света на теневой стороне лица. А упоминание «victorian clothes» (викторианская одежда) помогает унифицировать стиль, чтобы бабушка не оказалась в халате, а внучка — в худи, если это не предусмотрено задумкой.
Важные нюансы и ошибки
При работе с такими сложными запросами стоит помнить об одном важном правиле: чем больше деталей вы описываете, тем выше шанс сбоя. Не стоит перегружать промт описанием цвета глаз каждого участника или узора на их одежде. Нейросеть просто запутается, кому принадлежат голубые глаза, а кому — карие. Лучше оставить эти параметры на откуп случайности или задать общую цветовую гамму, например, «all wearing white shirts» (все в белых рубашках). Это, кстати, отличный приём для объединения композиции — одинаковая одежда визуально скрепляет группу.
Еще один подводный камень — это эмоции. Если написать просто «emotional», результат может быть непредсказуемым: от рыданий до истерического смеха. Надёжнее использовать конкретные определения: «calm smile» (спокойная улыбка), «serene expression» (безмятежное выражение) или «proud look» (гордый взгляд).
Тем более не стоит забывать о параметре хаоса или стилизации (в Midjourney это –s или –c). Для портретов поколений лучше держать эти значения низкими, чтобы ИИ не уходил в сюрреализм. Нам же нужна семья, а не герои фэнтези.
Работа с референсами
Если текстовый запрос упорно не даёт нужного результата, на помощь приходит функция Image-to-Image (генерация по картинке). Вы можете загрузить схематичный коллаж, сделанный хоть в Paint, где просто кружочками обозначено расположение голов. Для нейросети это станет жёстким каркасом. Или же можно скормить ей реальные фото ваших родственников. Правда, добиться стопроцентного сходства пока довольно сложно, но общий типаж сохранится. В этом случае в промт стоит добавить вес изображения (параметр –iw в Midjourney), чтобы нейросеть опиралась именно на референс, а не на свою фантазию.
Заключительные штрихи
Получив изображение, не спешите радоваться. Часто при ближайшем рассмотрении всплывают артефакты: странные уши, поехавший зрачок или пуговица, висящая в воздухе. Это нормально. Львиная доля работы приходится на пост-обработку (Inpainting), когда вы точечно просите нейросеть перерисовать конкретный кусок изображения. Процесс этот не сложный, но кропотливый, требующий усидчивости.
Создание портрета поколений — это увлекательный эксперимент, связывающий прошлое и будущее через цифровое настоящее. Пусть ваши виртуальные семейные саги получаются тёплыми, а нейросеть будет к вам благосклонна, выдавая шедевры с первой попытки. Удачи в творческих поисках!