В сети представлено множество красивых, но безликих генераций, где улыбающиеся цифровые люди застыли в идеальных позах. Многие пользователи, грезя о трогательном семейном портрете, натыкаются на одну и ту же стену: нейросеть упорно искажает лица, добавляет лишние конечности или просто не понимает, кто есть кто в семейной иерархии. Это разочаровывает. Однако не стоит винить технологию, ведь дьявол, как всегда, кроётся в деталях – а точнее, в скрупулёзной проработке текстового запроса. Но чтобы не превращать творческий процесс в утомительную лотерею, нужно разложить по полочкам всё составляющие удачного запроса.
Базовый скелет: От чего отталкиваться?
Начинать нужно всегда с простого. Фундамент любого промта — это чёткая структура, которую нейросеть поймёт без двусмысленностей. Забудьте о поэтических метафорах и сложных эпитетах на этом этапе. Сухая конкретика творит чудеса. Основа выглядит примерно так: кто, что делает, где находится. Например:
A happy family of four: father, mother, teenage son, and little daughter, sitting on a plaid blanket in a sunny autumn park, smiling at the camera
Казалось бы, просто? Да, но это лишь стартовая точка. Такой запрос даст вам общую сцену, но безликих персонажей. А нам ведь нужно передать дух и тепло конкретной семьи, а не абстрактной. Поэтому к этому костяку мы и будем добавлять «мясо» – детали, которые вдохнут в картинку жизнь.
Midjourney: Ставка на кинематографичность и стиль
Задача не из лёгких, если речь идёт о портретном сходстве, но Midjourney сильна в другом – в создании атмосферы. Эта нейросеть обожает всё, что связано с кинематографом, фотографией и искусством. Именно на этом и стоит играть. Если вы хотите не просто фото, а настоящий арт, стоит обогатить запрос именами режиссёров, фотографов или названиями плёнок. Например, промт в стиле Уэса Андерсона:
Нереальный визуал и кинематографичное видео в пару кликов 🎬
Нужен крутой концепт-арт, реалистичная анимация или профессиональный апскейл? Теперь у вас есть единый доступ к лучшим визуальным нейросетям планеты: Midjourney, Runway, Kling и Sora. Улучшайте качество готовых роликов до максимума с помощью встроенных ИИ-инструментов. Никаких сложных настроек, мощного ПК или зарубежных карт. Всё работает прямо в браузере или в Telegram-боте!
Откройте новые горизонты для творчества. Жмите на ссылку, регистрируйтесь и создавайте шедевры 👉 https://clck.ru/3RNCRL
Family portrait in the style of Wes Anderson, father, mother and two kids, symmetrical composition, pastel color palette, detailed whimsical background, cinematic still
Этот запрос даст вам фирменную симметрию и цветовую гамму, которые бросаются в глаза. А если добавить указание на плёнку и объектив, то изображение приобретёт тёплый, плёночный, «ламповый» оттенок.
shot on Kodak Portra 400, 50mm lens, soft natural light
С одной стороны, вы получаете потрясающий художественный образ, с другой – добиться фотореализма без дополнительных махинаций (вроде использования референсного фото через команду —cref) бывает довольно сложно.
Stable Diffusion: Как добиться портретного сходства?
А вот здесь начинается серьёзная работа, которая по плечу именно Stable Diffusion. Главное достояние этой модели – гибкость. Благодаря пользовательским чекпоинтам, LoRA-моделям и, конечно же, ControlNet, можно добиться поразительного сходства. Что насчёт промта? Лучший вариант — это детальное, почти техническое описание. В Stable Diffusion ключевую роль играют два поля: позитивный и негативный промт. Позитивный запрос должен быть насыщенным и точным.
masterpiece, best quality, ultra-detailed photorealistic portrait of a family: a man (ivan_lora:0.8) with short brown hair and a beard, a woman (maria_lora:0.9) with long blonde hair, hugging a little boy, sitting on a cozy sofa in a living room with a fireplace
Здесь (ivan_lora:0.8) – это вызов предварительно обученной LoRA-модели на конкретного человека с весом 0.8. Это уже не просто описание, а прямая команда.
К слову, не стоит пренебрегать негативным промтом. Он – ваш спасательный круг. Львиная доля уродливых генераций возникает как раз из-за его отсутствия. Добротный негативный промт отсекает всё лишнее.
(deformed, distorted, disfigured:1.3), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, (mutated hands and fingers:1.4), disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation
Усиление веса отдельных слов в скобках, как (mutated hands and fingers:1.4), заставляет нейросеть обращать на эти запреты особое внимание. Это, конечно, не панацея, но процент удачных кадров вырастает в разы.
Стилизация и антураж
Когда с технической базой всё понятно, можно окунуться в творчество. Антураж решает всё. Ведь семейный портрет не обязан быть реалистичным. Хотите стилизацию под винтажное фото? Пожалуйста.
Vintage family photo from the 1950s, sepia tone, grainy film texture, aged paper effect
Нейросеть поймёт и передаст дух эпохи. Мечтаете о фэнтезийном мире? Тоже не проблема.
An elven family in a magical forest, father is a warrior with silver armor, mother is a sorceress in a flowing green dress, their child is holding a glowing orb, fantasy art, intricate details, art by Greg Rutkowski
Этот запрос перенесёт ваших персонажей в совершенно иное измерение. Ну и, конечно же, нельзя не упомянуть анимацию. Запрос в духе студии Ghibli подарит вам изысканный и трогательный рисунок, который выглядит впечатляюще.
Happy family portrait in the style of Studio Ghibli, soft watercolor background, warm and gentle atmosphere, anime movie screenshot
Подводные камни и частые ошибки
Есть несколько нюансов, о которых новички часто забывают. Во-первых, количество персонажей. Нейросетям довольно сложно гармонично разместить в кадре больше четырёх человек. С каждой новой фигурой растёт риск анатомических ошибок и смысловой путаницы. Во-вторых, те самые пресловутые руки. Это же настоящая головная боль. Если модель упорно не справляется с пальцами, попробуйте схитрить: в промте укажите, что персонажи держат руки за спиной, в карманах или обнимают друг друга. Иногда это помогает. Ну и, наконец, консистентность. Получить одних и тех же людей на разных изображениях – задача со звёздочкой. Для Midjourney решением может стать параметр —cref с ID персонажа, а для Stable Diffusion – кропотливое обучение собственных LoRA-моделей. Процесс не сложный, но кропотливый.
Разумеется, не существует единого «золотого» промта, который сработает для всех и всегда. Каждая генерация – это синтез технического задания и творческого поиска. Не бойтесь комбинировать стили, добавлять неожиданные детали и менять параметры «на лёту». Иногда самый вычурный и странный запрос приводит к результату, который превосходит все ожидания. Главное – не бояться экспериментов, ведь именно в них рождаются настоящие цифровые шедевры. Удачи в ваших творческих поисках!

