Промт для новорождённых (с примерами готовых промтов)

В мире цифрового искусства существует отдельная, невероятно трогательная ниша, которая заставляет сердца биться чаще, а зрителей — умиляться до слёз. Речь идёт, конечно же, о генерации изображений младенцев. Казалось бы, что может быть проще? Вбил слово «ребёнок» — и готово. Но любой, кто пробовал получить качественный результат от нейросети, знает: вместо ангелочка на экране часто появляется пластиковая кукла с жутким взглядом или пугающим количеством пальцев. Фотография новорождённых (или newborn-съёмка) в реальной жизни — это сложнейший процесс, требующий титанического терпения, тепла и мастерства, а в мире искусственного интеллекта — это битва за текстуру кожи, естественность позы и правильный свет. Удивительно, но чтобы создать идеальный цифровой портрет младенца, нужно мыслить как профессиональный фотограф, понимающий физику света и анатомию. А начать стоит с осознания того, что машина не понимает эмоций, она понимает только чёткие, сухие инструкции, обёрнутые в правильные токены.

С чего начинается магия?

Первым делом стоит определиться со стилистикой, ведь понятие «красиво» для нейросети — звук пустой. Если ваша цель — фотореализм, то фундамент запроса должен строиться на конкретной терминологии фотографов. Просто написать «cute baby» — значит, отдать результат на волю случая. Львиная доля успеха зависит от указания типа съёмки. В профессиональной среде это называется «Newborn photography». Именно это словосочетание запускает в «мозгах» ИИ нужные ассоциативные ряды: спящий младенец, свёрнутый калачиком, мягкие складки, спокойствие. К слову, довольно часто новички забывают указывать возраст. А ведь «baby» может быть и годовалым карапузом, сидящим в луже, и трёхмесячным ребёнком. Поэтому уточнение «newborn» (новорождённый) или «0 months old» (0 месяцев) — это не просто деталь, а обязательное условие. Далее следует описание физиологии. У младенцев кожа не идеально гладкая, она имеет текстуру, иногда лёгкий пушок (lanugo) или шелушения. Если не указать «highly detailed skin texture» или «skin pores», вы получите глянцевый манекен.

Свет и тени

Играет ли освещение ключевую роль? Безусловно. В съёмке детей никогда не используется жёсткий свет, бьющий в лоб. Это убивает всю нежность. В промтах лучше использовать описания мягких источников. Отличным решением станет упоминание «soft window light» (мягкий свет от окна) или «diffused lighting» (рассеянное освещение). Это придаёт кадру объём, но не создаёт грубых теней под носом или глазами. А если хочется добавить немного волшебства и кинематографичности, можно попробовать «rim lighting» (контровый свет), который подсветит пушок на голове или контур щёчки. Ну и, конечно же, нельзя не упомянуть о цветовой температуре. «Warm tones» (тёплые тона) сделают картинку уютной, домашней, а «cool tones» (холодные тона) подойдут для более стилизованных, воздушных образов. Главное — угадать с палитрой.

Реквизит и окружение

Сам по себе ребёнок в пустоте выглядит странно (если это не студийный макро-портрет), поэтому антураж имеет колоссальное значение. В мире newborn-фотографии существует классический набор реквизита, который нейросети считывают на ура. Один из самых популярных вариантов — плетёная корзина («wicker basket»). В нее обычно кладут мягкие пледы или искусственный мех. К слову, текстура ткани — это тот самый нюанс, который добавляет реализма. Попробуйте добавить в запрос «knitted blanket» (вязаный плед) или «merino wool» (шерсть мериноса). Крупная вязка на контрасте с нежной кожей младенца творит чудеса. Другой распространённый сценарий — это «cocoon wrap» (обмотка кокон), когда малыша плотно пеленают в красивую ткань. Это помогает скрыть конечность (руки и ноги), с генерацией которых у ИИ до сих пор возникают сложности. Ведь именно пальцы часто становятся той ложкой дёгтя, что портит идеальный кадр.

Пример готового промта: Реализм

Чтобы не быть голословным, разберём конкретную конструкцию, которая даёт стабильно качественный, добротный результат. Представьте, что нам нужен спящий мальчик в уютной домашней обстановке. Запрос будет строиться послойно. Сначала объект:

sleeping newborn baby boy, wrapped in a beige knitted blanket, lying in a rustic wooden basket, surrounded by dried flowers and soft pillows. macro photography, close-up shot, 85mm lens, f/1.8, extremely detailed skin texture, soft lanugo, realistic eyes, soft natural morning light, bokeh background, hyperrealistic, 8k resolution, cinematic lighting

Такой «слоёный пирог» из слов позволяет нейросети чётко понять задачу и выдать картинку, которую сложно отличить от работы топ-фотографа.

Сказочные сюжеты: стоит ли экспериментировать?

Разумеется. Нейросети тем и хороши, что позволяют поместить младенца в условия, невозможные в реальности. Например, сон на облаке или внутри цветка. Однако здесь есть свои подводные камни. Чем фантастичнее окружение, тем сложнее сохранить реализм самого ребёнка. ИИ может попытаться «мультиплицировать» лицо. Чтобы этого избежать, нужно жёстко фиксировать стиль. Допустим, мы хотим получить малыша-эльфа в волшебном лесу. Начинаем так: «cute newborn baby with tiny elf ears, sleeping inside a giant glowing lotus flower». Далее обязательно «заземляем» фантазию реализмом: «bioluminescent forest background, magical atmosphere, fireflies, sparkles». Но в конце обязательно добавляем «photorealistic style, octane render, unreal engine 5, detailed features». Это даст понять системе, что мы хотим не рисунок из детской книжки, а кадр из высокобюджетного фэнтези-фильма. Результат выглядит впечатляюще, хоть и далёк от реальности.

Стилизация под живопись и иллюстрацию

Иногда задача стоит иначе — нужна не фотография, а рисунок для открытки или принта на одежду. Здесь работают совсем другие законы. Слова «macro» и «8k» могут даже навредить, сделав картинку слишком резкой. Вместо этого в ход идут художественные техники. Очень нежно смотрятся акварельные промты. Основа может быть такой: «illustration of a sleeping newborn baby on the moon, cute clouds and stars». А вот дальше — самое интересное. Добавляем: «watercolor style, wet on wet technique, pastel colors, soft edges, dreamy atmosphere, paper texture». Тем более, что акварель прощает мелкие анатомические ошибки, которые на фото бросаются в глаза. Ещё один интересный вариант — карандашный набросок: «pencil sketch, graphite drawing, hand-drawn style, minimalist lines». Это выглядит самобытно и стильно.

Технические команды и настройки

Впрочем, одних слов мало. Если вы работаете, например, в Midjourney, нельзя забывать про параметры, которые пишутся через двойное тире. Настоящий спасательный круг для тех, кто ищет идеальную композицию — это соотношение сторон. Для портрета ребёнка лучше всего подходят форматы 2:3 (вертикальный) или 3:2 (горизонтальный). Квадрат 1:1 часто «режет» композицию корзинки или кроватки. Команда «–ar 3:2» в конце промта решит эту проблему. Ещё один важный параметр — стилизация («–s»). Высокие значения (например, –s 750) делают картинку более художественной, вылизанной, но иногда менее похожей на реальное фото. Для чистого реализма лучше держать значение в районе –s 250. А вот параметр хаоса («–c») стоит использовать с осторожностью. Если поставить высокое значение, нейросеть начнёт выдавать совершенно непредсказуемые результаты, вплоть до младенцев с тремя головами. Для стабильного результата лучше оставить этот параметр на нуле или ставить минимальные 5-10.

Как бороться с анатомическими ошибками?

Это, пожалуй, самый болезненный вопрос. Лишние пальцы, искривлённые конечности, «поплывшие» глаза — классика жанра. Исправить это на этапе генерации сложно, но можно минимизировать риски. Во-первых, старайтесь выбирать позы, где руки и ноги скрыты. Промты с пеленанием («swaddled baby», «wrapped in fabric») — это гарантия того, что ИИ не придётся рисовать сложные пальчики. Во-вторых, избегайте открытых глаз, если они не являются центром композиции. Взгляд — это зеркало души, и нарисовать его достоверно машине трудно. Часто получается «стеклянный» или косящий взгляд. Поэтому «sleeping» (спящий) или «eyes closed» (глаза закрыты) — это безопасный выбор, который к тому же добавляет умиротворения. Если же нужны открытые глаза, обязательно добавляйте «symmetrical eyes», «detailed iris», «perfect pupils». И всё же, будьте готовы к тому, что из десяти генераций удачными будут две-три. Это нормальный процесс отсева.

Пример готового промта: Минимализм

Иногда хочется чистоты и простоты, без лишнего реквизита. Этот стиль называется «Clean minimal». Здесь нет корзинок и цветов, всё внимание — на ребёнке. Промт будет выглядеть примерно так:

newborn baby lying on a white sheet, top down view, minimalist style, high key lighting, bright and airy, soft shadows, pure white tones, vogue style editorial

Такая картинка выглядит дорого и изысканно. Кстати, именно такие изображения часто используют в рекламе детской косметики или одежды. Главное — следить за тем, чтобы белый цвет не «выжег» детали лица.

Винтажный стиль и ретро

Особый интерес вызывает стилизация под старые фотографии. Это придаёт снимку историю, делает его похожим на семейную реликвию. Для достижения такого эффекта нужно оперировать названиями старых плёнок и камер. Попробуйте добавить в конец промта: «shot on Kodak Portra 400» или «Fujifilm Pro 400H». Эти плёнки славятся своей специфической цветопередачей и зернистостью («film grain»). Промт может звучать так: «vintage photo of a newborn baby in a retro pram, 1950s style, grainy texture, muted colors, nostalgic atmosphere». Такой подход позволяет скрыть мелкие огрехи генерации за счёт «шума» и низкой контрастности, присущей старым снимкам. Зрелище получается действительно атмосферным.

Чего делать категорически не стоит?

Есть ряд слов-паразитов и концепций, которые только портят результат. Не стоит перегружать промт эмоциями вроде «incredibly beautiful» или «breathtaking masterpiece». Нейросеть это игнорирует. Лучше потратить лимит символов на описание света или текстуры. Также лучше отказаться от сложных действий. «Ребёнок, играющий с кубиками» — это задача для ИИ повышенной сложности, так как взаимодействие объектов (рук и предметов) пока даётся алгоритмам с трудом. Скорее всего, пальцы сольются с кубиком в единую массу. Статика — наш лучший друг. Ну и, наконец, не пытайтесь впихнуть в один кадр слишком много персонажей. «Мама, папа, бабушка и младенец» — это верный путь к тому, что у кого-то из родственников будет искажённое лицо. Лучше сосредоточиться на одном герое.

Сезонные и тематические вариации

Отдельно стоит упомянуть сезонные промты. Это настоящий кладезь идей для контента. Осенью отлично заходят тыквы и тёплые оранжевые тона: «newborn baby sleeping inside a hollowed pumpkin, autumn leaves, warm orange lighting, cozy atmosphere». Зимой — вязаные шапочки с помпонами и снежинки (конечно, искусственные, на фоне): «baby in a winter knitted hat with pompom, fake snow background, winter wonderland theme, silver and blue tones». Такие запросы всегда актуальны и выглядят очень нарядно. Но помните про меру: избыток декора («наляпистость») может отвлечь внимание от самого главного — от ребёнка.

Тонкости работы с Stable Diffusion

Если Midjourney понимает более литературный язык, то Stable Diffusion тяготеет к тегам и весам. Там структура промта будет немного иной. На первое место выходят токены, усиливающие качество. Конструкция часто начинается с «(masterpiece:1.2), (best quality:1.2), (photorealistic:1.4)». Скобки и цифры здесь повышают значимость слов. Для генерации младенцев в этой нейросети критически важно использовать Negative Prompt (то, чего быть не должно). В негатив обязательно вписываем: «bad anatomy, deformed, disfigured, extra limbs, extra fingers, mutation, ugly, blur, bad quality». Это тот самый фильтр, который отсекает большинство монстров. Без грамотного негативного промта в Stable Diffusion получить милого ребёнка практически невозможно. Зато эта система позволяет точечно контролировать позу с помощью инструмента ControlNet, чего так не хватает в других генераторах.

Практика и насмотренность

Создание идеального промта — это процесс не быстрый, но увлекательный. Не стоит расстраиваться, если первые десять картинок пойдут в корзину. Это плата за обучение. Анализируйте, какие слова дают нужный эффект, а какие — лишь создают шум. Сохраняйте удачные сиды (seed — цифровое зерно генерации), чтобы потом воспроизвести стиль. Экспериментируйте с освещением, ведь именно свет рисует форму. Ищите вдохновение в работах классиков жанра, таких как Анна Геддес, и пытайтесь перевести их визуальный язык на язык токенов. В конечном итоге, нейросеть — это всего лишь инструмент, кисть в ваших руках. А какой шедевр вы ей напишете — зависит только от вашей фантазии и настойчивости. Пусть каждый ваш сгенерированный кадр вызывает улыбку и тепло. Удачи в творческих поисках!