Любой родитель, хоть раз пытавшийся поймать в объектив своё неугомонное чадо, знает, что эта задача сродни попытке удержать воду в решете. Вы мечтаете о глубоком, художественном портрете, а получаете смазанную пятку или гримасу, достойную фильма ужасов, ведь дети живут в своём ритме, который редко совпадает с выдержкой затвора. Нейросети в этом плане стали настоящим спасательным кругом, превратив процесс создания семейного альбома из нервотрепки в увлекательный творческий эксперимент, где единственным ограничителем выступает лишь ваша фантазия. Теперь можно отправить ребёнка в космос, превратить его в эльфа или поместить в декорации любимого мультфильма, не вставая с дивана и не тратя деньги на дорогой реквизит. Однако просто набрать «ребенок в лесу» недостаточно, чтобы получить шедевр, так как искусственный интеллект мыслит алгоритмами, а не эмоциями. Поэтому, прежде чем приступать к генерации, стоит разобраться в хитросплетениях промпт-инжиниринга и понять, как именно «объяснить» машине вашу задумку.
Сложно ли договориться с нейросетью?
На первый взгляд, процесс кажется элементарным, но дьявол, как водится, кроется в деталях. Нейросеть — это не телепат. Она — исполнительный, но довольно буквальный художник. Если вы не укажете свет, она выберет случайный. Не уточните стиль — получите винегрет из пикселей. Сложно ли это? И да, и нет. С одной стороны, вам придется стать немного режиссером, оператором и стилистом одновременно. С другой стороны, освоив базу, вы получите инструмент, который творит чудеса. Главное — угадать с формулировкой. Ведь именно от порядка слов, их точности и, если угодно, эмоциональной окраски, зависит финальный результат.
Анатомия запроса
Конструкция идеального промта (текстового описания) всегда строится по определенной логике, которую игнорировать не стоит. Начинать нужно с главного героя. Кто он? Мальчик, девочка, возраст, цвет волос, одежда. Далее следует действие и окружение. Где находится ребёнок и чем занят? Сидит на луне, играет с динозавром или читает книгу в старинной библиотеке. Третий слой — это стилистика и технические параметры. Именно здесь обычная картинка превращается в «фотографию». Вы должны указать тип освещения, модель камеры, стиль рендера или художественное направление. Без этих уточнений нейросеть выдаст усредненный, «пластиковый» результат, который глаз обывателя распознает мгновенно. А завершает эту конструкцию, как правило, упоминание соотношения сторон и версии алгоритма, если вы пользуетесь, например, Midjourney.
Реализм или стилизация?
Один из самых популярных запросов — это, безусловно, имитация реальной фотосессии. Чтобы нейросеть «поверила» в реальность происходящего, нужно использовать профессиональную терминологию фотографов. К слову, такие слова, как «photorealistic», «hyperrealistic», «8k» и «shot on 35mm lens», являются обязательными маркерами. Представьте, что вы хотите получить портрет девочки в осеннем парке. Для этого подойдет промт:
«A cute 5-year-old girl with curly red hair, wearing a beige knitted sweater and a scarf, laughing in an autumn park, golden hour lighting, soft bokeh background, shot on Canon EOS R5, 85mm lens, highly detailed texture, hyperrealistic –ar 3:4»
Здесь мы задали не только внешность, но и конкретную оптику, которая обеспечивает то самое красивое размытие фона (боке). Результат, скорее всего, будет неотличим от работы дорогого фотографа.
Сказочные сюжеты
Совсем другое дело, когда хочется магии. Здесь в ход идут отсылки к известным художникам, стилям мультипликации или фэнтезийным вселенным. Детям часто хочется побыть героями сказок. Допустим, ваша цель — создать образ маленького волшебника в духе Гарри Поттера. Справиться с этим поможет следующий запрос:
«A little boy wearing a wizard robe and holding a glowing magic wand, standing in a magical library with floating books, mystical atmosphere, blue and gold sparkles, cinematic lighting, style of Harry Potter movies, fantasy art, detailed intricate costume –ar 16:9»
Обратите внимание на слова «mystical atmosphere» и «cinematic lighting» — они создают нужный антураж. А если же хочется чего-то более мультяшного, в стиле Pixar или Disney, то формулировка меняется кардинально.
Мультипликационный стиль
Дети обожают видеть себя героями 3D-мультфильмов. Это же так весело. Чтобы превратить ребёнка в персонажа современной анимации, нужно использовать маркеры 3D-рендеринга. Простой пример для девочки-принцессы будет звучать так:
«A cute little princess with a tiny crown, big expressive eyes, wearing a pink fluffy dress, standing in front of a fairytale castle, Pixar style, Disney style, 3d render, Unreal Engine 5, bright vivid colors, soft smooth lighting, cute cartoon character –ar 2:3»
Нюанс здесь заключается в упоминании движков «Unreal Engine 5» и слов «big expressive eyes». Именно они придают ту самую характерную «няшность» и объём, к которым мы привыкли в современных мультфильмах.
Профессиональная ориентация
Родители часто грезят о будущем своих чад, представляя их врачами, космонавтами или великими спортсменами. Искусственный интеллект позволяет примерить эти роли уже сейчас, причем довольно убедительно. Вариант для будущего покорителя космоса может выглядеть следующим образом:
«A 7-year-old boy wearing a futuristic detailed astronaut suit, standing on the surface of Mars, red dust, starry sky background, epic cinematic composition, sci-fi movie poster style, sharp focus, heroic pose, intricate details of the suit –ar 2:3»
Здесь важно слово «detailed», так как скафандр — вещь сложная, и без этого уточнения нейросеть может нарисовать просто непонятную пижаму. А для маленького художника подойдет такой сценарий:
«A messy messy cute girl painting on a large canvas, colorful paint on face and hands, art studio background, creative chaos, natural sunlight from window, candid shot, lifestyle photography, vibrant colors –ar 3:2»
Слова «messy» (испачканный) и «candid shot» (случайный кадр) добавляют живости и правдоподобия.
Свет
Именно освещение творит чудеса с восприятием кадра. Можно бесконечно описывать одежду, но если свет будет плоским, картинка выйдет скучной. Профессионалы знают, что есть несколько беспроигрышных схем. «Golden hour» (золотой час) дает тёплый, мягкий закатный свет, идеальный для уличных портретов. «Rembrandt lighting» (рембрандтовский свет) создает драматичный объем с тенями, что хорошо для студийных мужских портретов. «Softbox lighting» имитирует студийное оборудование, делая кожу гладкой и ровной. «Neon lighting» или «Cyberpunk light» погружают в атмосферу будущего с розовыми и голубыми отсветами. Экспериментировать с этим параметром стоит постоянно. Ведь именно свет задает настроение: от радостно-солнечного до таинственно-мрачного.
Времена года: Зима
Сезонные фотосессии — это отдельный, довольно обширный пласт запросов. Зимой хочется уюта, снега и праздника. Попробуйте сгенерировать такую сцену:
«A happy child catching snowflakes with tongue, wearing a thick winter jacket and a knitted hat, snowy forest background, falling snow, close-up portrait, shallow depth of field, cold color palette with warm skin tones, magical winter vibe, high detail –ar 4:5»
Контраст холодной палитры и тёплых оттенков кожи (warm skin tones) всегда выглядит выигрышно и профессионально. Это классический прием в колористике, который нейросети отлично понимают.
Времена года: Лето
Летние промты, напротив, требуют яркости, воды и солнца. Однако здесь есть подводные камни: слишком яркое солнце может создать пересветы даже в генерации. Поэтому лучше указывать «soft sunlight» или тень. Пример летнего приключения:
«A little boy running on a sandy beach with a kite, blue ocean waves in the background, sunny summer day, dynamic motion, splashing water, wide angle shot, GoPro style, vibrant saturated colors, joyful emotion –ar 16:9»
Упоминание «GoPro style» и «wide angle» (широкий угол) придаст изображению динамику и ощущение присутствия, будто вы бежали рядом.
Чего стоит избегать?
Генерация изображений людей, а особенно детей — процесс не лишённый трудностей. Главная проблема нейросетей — это конечности. Лишние пальцы, искривленные руки или ноги, растущие из неожиданных мест, — классика жанра. Чтобы минимизировать этот эффект, опытные пользователи используют так называемые «Negative Prompts» (негативные подсказки) — список того, чего на картинке быть не должно. Обычно туда вписывают:
«deformed hands, extra fingers, missing limbs, blurry face, bad anatomy, disfigured, low quality, ugly, watermark, text»
Впрочем, даже с этими заклинаниями брак случается довольно часто. Кроме того, не стоит перегружать промт противоречивыми командами. Если вы напишете «день» и «ночь» одновременно, алгоритм, скорее всего, сойдет с ума и выдаст нечто серое и невнятное. Также лучше отказаться от слишком длинных и сложных предложений; разбивайте их на ключевые теги через запятую, так машине проще расставить приоритеты.
Исторический антураж
Путешествие во времени — ещё одна захватывающая возможность. Хотите увидеть своего ребёнка в эпоху Возрождения или викторианской Англии? Легко. Но тут важна точность в описании костюмов и интерьеров. Для образа маленького аристократа подойдёт:
«Portrait of a young victorian boy dressed in a velvet suit with a lace collar, standing in an ornate vintage interior, oil painting style, cracked paint texture, classical art, soft chiaroscuro lighting, regal pose, muted colors –ar 3:4»
Фраза «oil painting style» (стиль масляной живописи) и «cracked paint texture» (текстура потрескавшейся краски) придадут изображению вид музейного экспоната. Это выглядит внушительно и благородно.
Чёрно-белая классика
Иногда цвет только мешает восприятию эмоций. Чёрно-белая фотография — это выбор эстетов. Она позволяет сосредоточиться на взгляде и фактуре. Промт для такого стиля должен быть лаконичным, но емким:
«Black and white portrait of a thoughtful girl looking out of a rainy window, raindrops on glass, high contrast, dramatic shadows, noir style, emotional photography, grain texture, Leica M6 style –ar 2:3»
Упоминание плёночного зерна (grain texture) и камеры Leica сразу задает высокий стандарт качества и определенную ностальгическую ноту. Такой портрет не стыдно и в рамку повесить, и бабушке отправить.
Технические нюансы
Помимо содержания, огромную роль играют параметры генерации. Соотношение сторон (–ar) определяет, будет ли это вертикальный портрет для сторис (9:16) или кинематографичный горизонтальный кадр (16:9). Не стоит забывать и про параметр стилизации (–s в Midjourney). Низкие значения делают картинку более точной к запросу, но, возможно, менее художественной. Высокие — дают нейросети творческую свободу, которая порой приводит к неожиданным, но грандиозным результатам. Это инструмент тонкой настройки, и пренебрегать им — значит лишать себя львиной доли возможностей.
Животные и дети
Классика умиления — ребёнок и питомец. Но сгенерировать двух персонажей, взаимодействующих друг с другом, сложнее, чем одного. Нейросеть может «сплавить» их вместе или напутать с пропорциями. Секрет успеха — в четком разделении объектов. Пример:
«A small girl hugging a giant fluffy Golden Retriever dog, sitting on green grass, friendship and love, soft focus background, natural lighting, highly detailed fur, heartwarming atmosphere –ar 1:1»
Слово «giant» (гигантский) иногда помогает сделать акцент на животном, чтобы оно не потерялось на фоне. А «detailed fur» (детализированная шерсть) — обязательный атрибут для реалистичности, иначе собака будет похожа на пластилиновую поделку.
Фэнтези и косплей
А что, если хочется чего-то совсем необычного? Например, стимпанк или киберпанк. Эти стили богаты деталями, и нейросети их просто обожают. Ребёнок-механик в мире паровых машин — это же интересно. Попробуйте такой вариант:
«Steampunk style little boy wearing pilot goggles and a leather vest with brass gears, industrial background with steam and pipes, sepia tones, intricate mechanical details, cinematic lighting, adventure vibe –ar 2:3»
Здесь «brass gears» (латунные шестерёнки) и «sepia tones» (тона сепии) делают половину работы, создавая нужную цветовую гамму и настроение.
Стоит ли платить за фотосессию?
На фоне таких возможностей возникает закономерный вопрос: а нужны ли теперь живые фотографы? Безусловно, нужны. Нейросеть — это суррогат, красивая картинка, но в ней нет момента «здесь и сейчас». Она не сохранит память о том, как у вашего сына выпал первый зуб или как дочь впервые встала на коньки. ИИ создает фантазию, идеализированную версию реальности. Это отличное дополнение к семейному архиву, способ развлечься и создать уникальные открытки, но заменить тепло настоящей жизни пиксели всё-таки не могут. Да и тактильных ощущений от процесса обнимания ребенка никакой промт не заменит.
Эксперимент как основа
В конечном счёте, универсального рецепта не существует. Один и тот же промт в разных моделях и даже при разных попытках выдаст совершенно разные результаты. И это прекрасно. Не бойтесь добавлять странные слова, смешивать стили (например, «киберпанк» и «ренессанс») и ошибаться. Иногда именно ошибка алгоритма рождает шедевр, который хочется разглядывать часами. Подходите к процессу как к игре. Пусть ваш ребёнок сам подскажет сюжет — дети генерируют идеи куда быстрее любых компьютеров. А вам останется лишь перевести их детский лепет на язык машины. Удачных вам генераций и пусть каждый созданный образ займет достойное место в вашей цифровой галерее!