Каждый родитель знает, что поймать удачный кадр с непоседливым чадом — это задача со звёздочкой, требующая недюжинного терпения и, зачастую, простой удачи. Дети растут стремительно, меняются буквально по часам, и желание запечатлеть эти мгновения вполне естественно перерастает в гигабайты снимков на смартфоне, где «тот самый» шедевр часто теряется среди смазанных движений и закрытых глаз. Но технологии шагнули далеко вперёд, и сегодня для создания идеальной фотографии вовсе не обязательно мучить ребёнка многочасовым позированием в студии под слепящими софтами. Нейросети, такие как Midjourney или Stable Diffusion, открыли ящик Пандоры (в хорошем смысле), позволив генерировать гиперреалистичные или сказочные образы по текстовому описанию. А вот чтобы результат не выглядел как жутковатая кукла с семью пальцами, нужно овладеть искусством составления запросов.
С чего начинается правильный запрос?
Сложно ли составить промт? Технически — нет, но дьявол, как водится, кроется в деталях. Обыватель часто пишет просто: «ребёнок играет в мяч». Нейросеть, безусловно, выдаст результат, но он вряд ли порадует высокой художественной ценностью. Это будет довольно скучная, плоская картинка. Секрет успеха кроется в многослойности описания. Сначала стоит определить главного героя (субъект), затем добавить действие, поместить это всё в конкретную локацию, задать освещение и, наконец, «приправить» техническими параметрами камеры. Ведь именно от порядка слов и их специфики зависит то, как искусственный интеллект расставит акценты. К слову, описывать всё лучше на английском языке, так как львиная доля моделей обучена именно на нём, хотя и русские запросы системы понимают, но интерпретируют их порой весьма вольно.
Освещение и атмосфера
Свет — это кисть фотографа, пусть даже виртуального. Глупо игнорировать этот параметр. Если вы хотите получить нежное, почти эфирное изображение, стоит использовать термин «soft lighting» (мягкое освещение) или «golden hour» (золотой час). Последнее творит чудеса, заливая кадр тёплым закатным солнцем. Для более драматичных портретов подойдет «cinematic lighting» (кинематографичное освещение) или «rembrandt lighting» (свет Рембрандта), создающий объёмный рисунок на лице. А вот для имитации студийной съемки лучшим решением станет «studio lighting» в связке с «neutral background». И всё же, не стоит забывать про настроение. Довольно часто одно лишь слово «melancholic» или «joyful» меняет выражение лица сгенерированного персонажа кардинально.
Реализм: Как добиться эффекта живого фото?
Многие грезят о том, чтобы сгенерированное изображение было неотличимо от реального снимка. Задача не из лёгких. Здесь на помощь приходят технические маркеры. Чтобы текстура кожи не выглядела «пластиковой», в промт обязательно нужно включить такие характеристики, как «highly detailed skin», «skin texture», «pores». Также отлично работают уточнения по оборудованию. Например, добавление «shot on Canon R5, 85mm lens, f/1.8» дает нейросети команду размыть задний фон (боке) и сфокусироваться на глазах ребёнка. Глаза, кстати, — это зеркало души даже у цифрового персонажа. Стоит прописать «detailed eyes» или «sparkling eyes», чтобы взгляд стал живым.
Разберём конкретный пример для реалистичного портрета девочки. Конструкция может выглядеть так:
«A cute 5-year-old girl with curly red hair and green eyes, wearing a vintage floral dress, sitting on a wooden swing in a blooming garden, sun rays breaking through leaves, highly detailed face, soft bokeh, shot on 50mm lens, photorealistic, 8k –ar 3:4»
Этот запрос хорош тем, что он задает и внешность, и локацию, и свет, и технические параметры. Формат 3:4, кстати, идеально подходит для социальных сетей.
Сказочные стилизации
А если хочется уйти от реальности? Нейросети — это настоящий кладезь для создания фантазийных миров. Ребёнок может стать космонавтом, эльфом или героем любимого мультфильма. Здесь главенствуют ссылки на художественные стили. Фраза «Disney style» или «Pixar style 3D render» мгновенно превратит вашего ребёнка в милого большеглазого персонажа. А если добавить «watercolor painting» или «oil painting», то на выходе получится цифровая картина.
Для маленького мальчика, мечтающего о космосе, подойдет следующий вариант:
«A brave little boy in a futuristic astronaut suit, standing on the surface of Mars, looking at the Earth in the sky, galaxy background, cinematic lighting, hyper-realistic, intricate details, epic composition, unreal engine 5 render –ar 16:9»
Обратите внимание на «unreal engine 5» — этот тег добавляет изображению компьютерной, но очень качественной детализации, свойственной современным играм и фильмам. Широкий формат 16:9 здесь оправдан эпичностью сцены.
Сезонные и праздничные мотивы
Тема праздников всегда актуальна. Новогодние открытки, созданные с помощью ИИ, могут стать отличным решением для поздравления родственников. Тут важно передать уют и магию момента. Для рождественской истории можно использовать такой шаблон:
«A happy toddler in a knitted deer sweater opening a Christmas gift box, sitting near a fireplace and a decorated Christmas tree, cozy atmosphere, warm candlelight, sparkling lights, magical vibes, hyper-detailed, 4k»
Слова «cozy» и «warm candlelight» здесь ключевые — они создают ту самую «ламповую» атмосферу.
Летние сюжеты, напротив, требуют яркости и динамики. Попробуйте такой промт:
«A laughing child running on a sandy beach along the ocean waves, splashing water, bright sunny day, blue sky, seagulls in the background, action shot, high shutter speed, vivid colors, realistic photo –v 6.0»
Указание «high shutter speed» (короткая выдержка) подсказывает алгоритму, что нужно «заморозить» движение воды и бегущего ребёнка, чтобы кадр не выглядел смазанным, хотя нейросеть и не имеет настоящего затвора.
Нюансы внешности и одежды
Описывая ребёнка, не стоит перебарщивать с деталями, но основные черты указать необходимо. Если вы не напишете цвет глаз или волос, ИИ выберет их рандомно (случайным образом), и результат может вас удивить. Одежду тоже лучше конкретизировать. Вместо простого «dress», напишите «white lace dress» или «denim overalls». Ткани и фактуры имеют значение. Нейросеть отлично понимает разницу между «silk» (шёлк) и «wool» (шерсть).
Рассмотрим пример для стильной городской съемки:
«A stylish 7-year-old boy wearing a leather jacket, sunglasses and jeans, walking down a busy New York street, yellow taxi cabs in background, urban style, fashion photography, low angle shot, sharp focus, detailed texture –ar 2:3»
Здесь использован прием «low angle shot» (съемка с нижнего ракурса), который визуально делает героя значительнее и круче.
Сложности и подводные камни
Безусловно, генерация — процесс не всегда гладкий. Главная головная боль всех любителей нейросетей — это конечности. Пальцы. Их может быть шесть, семь, или они могут срастаться в причудливые формы. Хотя последние версии алгоритмов (например, Midjourney v6) справляются с этим гораздо лучше, проблема всё ещё всплывает. Чтобы минимизировать риски, старайтесь избегать поз, где руки находятся в сложном переплетении. Проще всего генерировать портреты по пояс или кадры, где руки чем-то заняты (держат игрушку, книгу).
Ещё один нюанс — глаза. Иногда зрачки могут смотреть в разные стороны. Исправить это можно либо перегенерацией (кнопка Reroll — ваш лучший друг), либо использованием функции Inpaint, которая позволяет перерисовать конкретный участок изображения. Также стоит избегать слишком длинных и противоречивых запросов. Если вы напишете «день и ночь одновременно», нейросеть может выдать сюрреалистичную кашу. Логика должна присутствовать даже в магии.
Динамика против статики
Статичные позы генерировать проще. Ребёнок сидит, стоит, лежит. Но динамика всегда смотрится выигрышнее. Однако тут есть свои сложности. При запросе «ребёнок прыгает» нейросеть может нарушить анатомию тела в полёте. Поэтому для динамичных сцен лучше использовать более общие планы, где мелкие анатомические огрехи не так бросаются в глаза.
Пример для активного сюжета в осеннем парке:
«Full body shot of a joyful girl throwing autumn maple leaves into the air, park background with orange and red trees, golden sunlight backlighting, motion blur on leaves, sharp focus on face, dynamic composition, emotional capture»
Здесь мы намеренно добавляем «motion blur on leaves» (размытие листьев в движении), чтобы подчеркнуть динамику, но требуем «sharp focus on face», чтобы лицо осталось чётким.
Использование референсов
Нужно отметить, что текстовый промт — не единственный способ управления результатом. Практически все современные генераторы позволяют загружать референсное изображение. Это может быть фото вашего реального ребёнка. Используя функцию Image-to-Image (или просто вставляя ссылку на фото в начале промта в Discord), вы даете нейросети «каркас» внешности. Конечно, 100% портретного сходства добиться сложно (без специальных тренировок модели LoRA), но общие черты и типаж сохранятся. Это спасательный круг для тех, кто хочет видеть на картинке именно своё чадо, а не абстрактного красивого ребёнка.
Стилизация под профессиональную плёнку
Сейчас в моде ретро-эстетика. Зернистость, плёночные цвета, легкие засветы. Чтобы добиться такого эффекта, используйте названия конкретных фотоплёнок. «Kodak Portra 400» дает прекрасные скин-тоны (оттенки кожи), а «Fujifilm Superia» уводит картинку в приятные зеленовато-пурпурные оттенки.
Попробуем создать атмосферный плёночный кадр:
«A candid photo of a boy reading a book under a blanket fort with a flashlight, dark room, mysterious atmosphere, shot on Kodak Portra 400, film grain, vignette, nostalgic mood, warm colors»
Слово «candid» (искренний, непостановочный) здесь очень важно — оно дает команду нейросети создать эффект подсмотренного момента, без нарочитого позирования.
Технические команды как часть промта
В конце любого промта обычно идут параметры через двойное тире (если мы говорим о Midjourney). Они не являются частью художественного описания, но критически влияют на результат. Параметр «–stylize» (или –s) отвечает за то, насколько вольно нейросеть будет интерпретировать ваш запрос. Низкие значения (например, –s 50) заставят ИИ строго следовать тексту, а высокие (–s 750) дадут волю его «творчеству». Параметр «–chaos» (или –c) вносит элемент случайности и разнообразия в сетку из четырех картинок. Иногда стоит поэкспериментировать, поставив –c 20, чтобы получить неожиданные композиционные решения. А вот параметр «–weird» позволяет создавать действительно странные и необычные образы, что может быть интересно для арт-проектов.
Чёрно-белая классика
Нельзя не упомянуть и о чёрно-белой фотографии. Она всегда выглядит дорого и вне времени. Промт для такого стиля должен быть лаконичным, но выразительным. Акцент смещается с цвета на свет и тень.
Пример:
«Black and white close-up portrait of a child crying tears of joy, dramatic lighting, high contrast, emotional, deep shadows, detailed texture, monochrome photography, masterpiece»
Высокий контраст («high contrast») здесь играет ключевую роль, делая снимок объёмным и графичным.
В мире нейросетевого искусства нет жёстких правил, есть лишь рекомендации и бесконечное поле для экспериментов. Один и тот же запрос может выдавать совершенно разные результаты в зависимости от малейших изменений в формулировке или даже от настроения «случайного числа» (seed), лежащего в основе генерации. Не бойтесь комбинировать стили, смешивать фотореализм с элементами фэнтези, менять объективы и освещение. В конце концов, создание промтов — это тоже творчество, современная форма заклинания, способная материализовать ваши мысли в пиксели. Пусть ваши виртуальные фотосессии приносят не меньше радости, чем реальные, а коллекция пополняется действительно уникальными кадрами, которые захочется распечатать и повесить на стену. Творите, пробуйте, и результат обязательно превзойдет ожидания.