Промт для детской фотографии (с примерами готовых промтов)

В мире профессиональной фотографии существует старое, проверенное годами правило, гласящее, что сложнее всего работать с животными и детьми. Непредсказуемость, искренность эмоций и невозможность заставить модель застыть в одной позе — всё это делает процесс съёмки настоящим испытанием для нервной системы, но результат, как правило, того стоит. Удивительно, но искусственный интеллект, перехвативший эстафету творчества, унаследовал эту сложность в полной мере, превращая генерацию детского портрета в увлекательный, хоть и порой утомительный квест. Ведь нейросеть, лишённая понимания анатомии и физики, так и норовит добавить лишний палец или наградить миловидное чадо взглядом умудрённого жизнью старца. Однако получить шедевр, который сложно отличить от снимка топ-фотографа, вполне реально, если знать правильные «заклинания» и понимать механику запроса. А начать стоит с фундаментальных основ построения промта.

С чего начинается магия?

Определение возраста — это тот самый краеугольный камень, о который спотыкаются многие новички. Слово «child» (ребёнок) для нейросети является слишком абстрактным понятием. В её «воображении» это может быть и годовалый малыш, и двенадцатилетний подросток. Поэтому конкретика здесь решает всё. Для обозначения младенцев лучше использовать «infant» или «newborn», для детей, которые только начали ходить — «toddler», а для дошкольников отлично подойдёт «preschooler». Если же вам нужен конкретный возраст, укажите его цифрами: «5-year-old girl» или «10-year-old boy». Это сужает вариативность генерации и направляет алгоритм в нужное русло. К слову, этническая принадлежность и цвет волос тоже прописываются на этом этапе. Например, запрос «adorable 4-year-old ginger boy with freckles» (очаровательный 4-летний рыжий мальчик с веснушками) даст куда более предсказуемый результат, чем простое описание мальчика. Важно помнить, что детализация внешности на старте избавляет от необходимости править изображение в фотошопе впоследствии.

Освещение

Свет в фотографии — это не просто физическое явление, а инструмент, создающий атмосферу и объём. В генеративных сетях дело обстоит точно так же. Плоский свет убивает кадр, делая его похожим на плакат или 3D-рендер низкого качества. Чтобы добиться реализма, используйте термины из мира кино и глянца. «Cinematic lighting» (кинематографичное освещение) придаст кадру глубину, а «golden hour» (золотой час) зальёт сцену тёплым, мягким закатным светом. Довольно часто для портретов используют «softbox lighting» или «rembrandt lighting» — последний вариант создаст тот самый знаменитый треугольник света на щеке, добавляя драматизма. Для светлых, воздушных снимков идеально подойдёт «high key lighting», а для таинственных и тёмных — «low key». Не стоит забывать и про естественный свет: «natural light», «window light» (свет от окна) или «sunlight filtering through trees» (солнечные лучи, проходящие сквозь листву) творят настоящие чудеса с текстурой кожи и общим настроением кадра.

Эмоции и действие

Застывший, «стеклянный» взгляд — главная проблема сгенерированных людей. Дети же по своей природе динамичны, их лица — это калейдоскоп эмоций. Чтобы оживить картинку, нужно задать действие или чувство. Глагол здесь солирует. Вместо статичного «standing» (стоит), попробуйте «laughing hysterically» (истерически смеётся), «crying» (плачет), «looking curiously at a butterfly» (с любопытством смотрит на бабочку) или «jumping in a puddle» (прыгает в лужу). Мелкие детали, такие как «messy hair» (растрёпанные волосы) или «dirt on cheeks» (грязь на щеках), добавляют ту самую изюминку, которая заставляет зрителя верить в происходящее. Искренность момента ценится выше идеальной укладки. Ведь именно несовершенства делают фотографию живой. Да и самой нейросети проще сгенерировать естественную позу, если она обусловлена конкретным действием, а не абстрактным ожиданием.

Стилизация

Вопрос выбора стиля для детской фотографии стоит довольно остро. Хотите ли вы получить гиперреализм или же тяготеете к художественной иллюстрации? Если цель — фотореализм, то в промт обязательно нужно включить технические характеристики камеры. Волшебное словосочетание «shot on Sony A7R IV» или «Canon EOS R5» сразу даёт сигнал алгоритму о высоком разрешении и резкости. Для любителей плёночной эстетики настоящим спасательным кругом станут названия легендарных плёнок: «Kodak Portra 400», «Fujifilm Pro 400H» или «Cinestill 800T». Они добавляют характерное зерно и цветопередачу. Упоминание объектива тоже играет роль: «85mm lens» обеспечит красивое размытие фона (боке) и правильные пропорции лица, а «35mm lens» захватит больше окружения, создавая эффект присутствия. К тому же, добавление слов «shallow depth of field» (малая глубина резкости) или «bokeh» гарантированно отделит модель от фона, акцентируя внимание на глазах ребёнка.

Примеры промтов: Студийный портрет

Попробуем собрать всё воедино и создать запрос для классического, но эмоционального студийного портрета. Представьте, что нам нужна девочка в винтажном платье. Промт может выглядеть следующим образом:

Close-up portrait of a cute 6-year-old girl with curly blonde hair, wearing a vintage lace dress, looking directly at the camera with big blue eyes, soft natural window lighting, neutral beige background, high detail, shot on 85mm lens, f/1.8, realistic skin texture, 8k resolution

В этом наборе слов мы задали и объект, и свет, и технические параметры. Результат порадует высокой детализацией и мягкостью. А если захочется добавить немного грусти и атмосферности, можно изменить вводные:

Moody portrait of a sad 5-year-old boy holding a teddy bear, tears in eyes, dark room, single light source illuminating the face, dramatic shadows, emotional, cinematic composition, shot on 35mm film, grainy texture

Здесь уже работает контраст и зернистость, создавая историю в одном кадре.

Уличная фотография

С динамикой на улице дело обстоит сложнее, но и интереснее. Здесь важно описать окружение. Допустим, мы хотим запечатлеть момент радости под дождём. Промт будет таким:

Candid shot of a happy 7-year-old boy running in the rain, wearing a bright yellow raincoat and red rubber boots, splashing water, water droplets in the air, laughing face, blurred city street background, motion blur, dynamic angle, high shutter speed, photorealistic, shot on Nikon D850

Обратите внимание на «motion blur» и «high shutter speed» — эти команды помогают передать движение, делая кадр не статичным, а живым. Другой вариант — солнечный день в парке:

Full body shot of a toddler girl chasing soap bubbles in a green sunny park, summer day, sun flare, backlit, grass and flowers, joyful expression, vibrant colors, sharp focus on the child, creamy bokeh background, canon 50mm lens

Такой запрос создаст тёплое, по-настоящему летнее настроение.

Сказочные мотивы

Детство неразрывно связано с фантазиями, и нейросети позволяют воплотить их в жизнь с пугающей реалистичностью. Чтобы поместить ребёнка в сказку, нужно уделить внимание описанию антуража и света. Пример для волшебного леса:

A dreamy photo of a little girl in a fairy costume sitting on a giant mushroom in a magical bioluminescent forest, glowing plants, fireflies around, night time, soft blue and purple lighting, ethereal atmosphere, fantasy art style, hyperrealistic, intricate details, octane render

Здесь мы смешиваем фотореализм с элементами 3D-арта («octane render»), чтобы усилить эффект нереальности. Или, скажем, юный космонавт:

Portrait of a 8-year-old boy wearing a futuristic astronaut suit, standing on the surface of Mars, red dust, starry sky background, reflection of stars in the helmet visor, epic lighting, cinematic wide shot, highly detailed, sci-fi movie poster style

Важно помнить, что в таких промтах слова «cinematic» и «epic» делают львиную долю работы по созданию настроения.

Одежда и текстуры

Нельзя не упомянуть о важности описания одежды. Нейросеть любит фактуры. Просто «dress» (платье) — это скучно. А вот «knitted wool sweater» (вязаный шерстяной свитер), «velvet jacket» (бархатный пиджак) или «dirty denim overalls» (грязный джинсовый комбинезон) дают алгоритму зацепку для прорисовки деталей. Ткань должна чувствоваться через экран. К примеру:

Close-up of a baby wrapped in a soft white knitted blanket, texture of wool visible, cozy atmosphere, warm tones, morning light

Именно упоминание текстуры шерсти заставляет ИИ прорабатывать мелкие ворсинки, что колоссально повышает реализм. Разумеется, цвета одежды тоже стоит указывать, чтобы они гармонировали с общим фоном или, наоборот, создавали контраст. Красный шарф на фоне белого снега — классика, которая всегда выглядит выигрышно.

Сложно ли избежать ошибок?

Ошибки неизбежны. Артефакты, странные глаза или лишние конечности будут всплывать то тут, то там. Однако минимизировать их количество вполне возможно. Для этого используются так называемые негативные промты (параметр –no в Midjourney или отдельное поле в Stable Diffusion). В них стоит вписать всё то, чего вы не хотите видеть:

bad anatomy, extra fingers, deformed hands, ugly face, distorted eyes, mutation, low quality, blurry, watermark, text

Это своего рода фильтр, отсеивающий мусор. Но даже с идеальным негативным промтом первый результат редко бывает идеальным. Часто приходится делать несколько вариаций (upscale или reroll), чтобы найти тот самый кадр. Это кропотливый процесс, требующий терпения. Тем более, что алгоритмы постоянно обновляются, и то, что работало вчера, сегодня может давать сбой.

Есть ли универсальный рецепт?

Многие считают, что существует некий «золотой промт», который всегда выдаёт шедевры. Но на самом деле успех зависит от умения комбинировать параметры под конкретную задачу. Универсального рецепта нет, есть лишь набор ингредиентов. Стиль, свет, камера, объект, действие — меняя эти переменные, вы получаете бесконечное множество вариантов. Иногда стоит убрать лишние детали и дать нейросети свободу творчества, сократив промт до пары слов: «Sad girl, rain, window». Порой такой минимализм выдаёт более пронзительный результат, чем нагромождение технических терминов. А иногда требуется скрупулёзный контроль над каждым пикселем. Главное — не бояться экспериментировать и смешивать несочетаемое.

Технические параметры и форматы

Формат изображения играет не последнюю роль в восприятии композиции. По умолчанию многие сети генерируют квадрат (1:1), но для портрета это не всегда лучший выбор. Вертикальный формат (aspect ratio 2:3 или 9:16) идеально подходит для ростовых портретов и крупных планов, позволяя лучше скомпоновать фигуру. Горизонтальный (16:9 или 3:2) — прерогатива кинематографичных сцен с широким охватом окружения. В Midjourney это задаётся параметром «–ar 2:3» или «–ar 16:9» в конце промта. Также стоит обратить внимание на версию алгоритма. Например, «–v 6.0» на данный момент обеспечивает наивысшую фотореалистичность, особенно в прорисовке кожи и глаз. А параметр стилизации «–s» (от 0 до 1000) определяет, насколько вольно нейросеть будет трактовать ваш запрос. Низкие значения (50-100) заставят её строго следовать тексту, а высокие (700-1000) добавят художественности, но могут увести далеко от первоначальной задумки.

Неочевидные нюансы

Существуют и менее очевидные хитрости. Например, добавление слова «symmetrical face» (симметричное лицо) часто делает портрет слишком искусственным, кукольным. Легкая асимметрия свойственна живым людям. Поэтому лучше избегать требований об идеальной симметрии. Зато фраза «looking away» (смотрит в сторону) спасает от проблемы косоглазия, которая всё ещё встречается в генерациях. Ещё один интересный приём — использование имён известных фотографов в промте. «In the style of Annie Leibovitz» или «Steve McCurry» может кардинально изменить цветокоррекцию и композицию, подражая почерку мастера. Конечно, это не сделает работу копией, но задаст правильный вектор. Ну и, наконец, не скупитесь на эпитеты. «Masterpiece» (шедевр), «award winning photography» (фотография, выигравшая награду), «trending on artstation» — эти, казалось бы, пафосные клише действительно работают, повышая приоритет качества генерации.

Эксперименты с возрастом и временем

Интересный эффект даёт игра с эпохами. Попробуйте перенести ребёнка в другое время.

Vintage photo of a boy from 1920s, sepia tone, old clothes, newsboy cap, standing on a cobblestone street

Такой запрос создаст совершенно иной антураж и настроение. Или, наоборот, будущее:

Cyberpunk child with neon glasses, futuristic city background, night, blue and pink neon lights

Временной контекст меняет всё: от одежды до выражения лица. Это мощный инструмент сторителлинга. Ведь фотография — это всегда история, застывшая во времени. И нейросеть, обладая доступом к визуальной базе данных всего человечества, способна воссоздать любую эпоху с пугающей точностью. Главное — правильно подобрать ключи к этой сокровищнице образов.

Процесс создания идеального промта для детской фотографии напоминает алхимию. Вы смешиваете ингредиенты, добавляете щепотку эмоций, каплю света и смотрите, что произойдёт в колбе. Иногда случается взрыв, а иногда рождается золото. Не бойтесь ошибаться, перебирать варианты и искать свой уникальный стиль общения с искусственным интеллектом. В конце концов, за каждым сгенерированным пикселем всё равно стоит человеческая фантазия и желание создать прекрасное. Пусть ваши виртуальные модели всегда радуют вас живыми эмоциями, а результаты генераций становятся поводом для гордости и вдохновения. Творите, пробуйте, и ваш личный шедевр обязательно появится на экране.