Образ матери и ребёнка во все времена был центральным в искусстве, начиная от иконописных канонов и заканчивая современными фотосессиями для глянцевых журналов. Казалось бы, что может быть естественнее и проще, чем изобразить двух родных людей? Однако при попытке сгенерировать такую сцену с помощью нейросетей многие пользователи сталкиваются с неожиданными трудностями: то возраст персонажей «плывёт», то лица становятся пугающе похожими, словно у близнецов, а то и вовсе количество конечностей превышает анатомическую норму. Проблема кроется не столько в несовершенстве алгоритмов, сколько в отсутствии конкретики в запросе, который обыватель часто формулирует слишком абстрактно. А ведь именно нюансы описания, правильная расстановка акцентов и технические теги творят чудеса. Но чтобы не ошибиться и получить достойный результат с первой попытки, нужно разобраться в анатомии идеального промпта.
С чего начинается создание запроса?
Первый шаг – это чёткое определение возраста и действия. Довольно часто новички пишут просто «mother and son», надеясь на понятливость искусственного интеллекта. Разумеется, нейросеть выдаст картинку, но результат будет усреднённым и, скорее всего, скучным. Стоит сразу задать временные рамки. Если вы хотите видеть молодую маму с младенцем, формулировка должна содержать уточнения вроде «young woman 25 years old» и «baby boy 1 year old». А вот для сцены с взрослым сыном потребуются уже совсем иные маркеры. К слову, возрастную разницу лучше прописывать цифрами, так как слова «adult» или «child» алгоритмы могут трактовать довольно вольно.
Огромное значение имеет и взаимодействие персонажей. Статичные позы, где герои просто смотрят в камеру, выглядят неестественно. Куда интереснее задать динамику. Например, запрос может строиться вокруг совместного занятия: чтение книги, прогулка в парке или приготовление ужина. В промпт стоит включить глаголы действия: «hugging» (обнимаются), «holding hands» (держатся за руки), «playing together» (играют вместе). Это не только оживит кадр, но и поможет нейросети правильнее выстроить композицию, избежав печально известного смешения тел.
Реализм и фотодокументалистика
Для тех, кто тяготеет к фотографическому качеству, существует целый набор технических терминов, превращающих генерацию в настоящий шедевр. Здесь на помощь приходят указания модели камеры, типа плёнки и освещения. Представим, что наша цель – уютный домашний портрет. В таком случае основу промпта составит описание сцены:
hyperrealistic photo of a beautiful mother and her little son laughing in a sunny kitchen
Но это лишь каркас. Чтобы добавить «воздуха» и объёма, стоит дописать: «shot on Canon R5, 85mm lens, f/1.8, natural morning lighting, depth of field». Такая комбинация размоет фон (боке), сделает акцент на эмоциях и прорисует текстуру кожи.
Другой вариант – кинематографичный стиль, который сейчас довольно популярен. Он отличается драматичным светом и глубокими тенями. Сценарий может быть таким: мама и сын идут по осеннему лесу. Промпт в этом случае обрастет деталями:
cinematic shot, wide angle, mother walking with 7 year old son in autumn forest, golden hour, sun rays through trees, highly detailed, 8k, unreal engine 5 render style
Результат наверняка порадует глаз тёплой гаммой и проработанным окружением. Кстати, не стоит забывать про одежду. Если не указать этот параметр, ИИ может облачить героев в странные балахоны или, наоборот, в слишком официальные костюмы. Простая добавка «wearing casual clothes, sweaters, jeans» решит эту проблему.
Стилизация: От Pixar до киберпанка
Но кто сказал, что мы обязаны ограничиваться реальностью? Нейросети – это кладезь возможностей для экспериментов с художественными стилями. Любители анимации часто грезят о том, чтобы увидеть себя и своих чад в образе героев мультфильмов. Для получения картинки в духе студии Pixar запрос должен содержать специфические триггеры. Основа остаётся прежней – описание действия (например, мама завязывает шнурки сыну), но в конце добавляются стилистические модификаторы: «Disney Pixar style, 3d render, cute, vibrant colors, soft lighting, cartoon character design». Лица станут более округлыми, глаза большими, а общая атмосфера – сказочной.
А если захочется чего-то более брутального или фантастического? Киберпанк, например. Представьте маму и сына в неоновом городе будущего. Тут уже солирует другая лексика. Промт будет выглядеть примерно так:
cyberpunk style, futuristic city background, mother and son wearing sci-fi armor, neon lights, rain, blue and pink color palette, dystopian atmosphere, detailed intricate design
Впрочем, здесь есть свои подводные камни. Сложные костюмы и обилие деталей могут сбить алгоритм с толку, поэтому композицию лучше оставлять простой.
Винтаж и ретро-фотография
Особый интерес вызывает стилизация под старые плёночные снимки. Это вызывает чувство ностальгии и придает изображению особую теплоту. Чтобы получить эффект фотографии из 90-х или 80-х, нужно использовать названия конкретных плёнок и указывать на несовершенства кадра. Пример готового решения для прогулки:
vintage photo 1990s style, mother holding baby son in a park, grainy texture, Kodak Portra 400, flash photography, amateur shot aesthetic
Такой запрос добавит изображению характерный шум, слегка искажённую цветопередачу и эффект «красных глаз» (если это нужно для аутентичности), что сделает картинку неотличимой от скана из семейного альбома.
Тем более, что ретро-стиль прощает многие огрехи генерации. Если в гиперреализме странная тень на лице будет бросаться в глаза и портить впечатление, то на «старом снимке» это будет воспринято как дефект плёнки или особенность проявки. Для усиления эффекта можно добавить теги «polaroid frame» или «slightly blurred», что добавит динамики и живости.
Как настроить эмоции?
Самое сложное в генерации людей – это передача искренних чувств. «Стеклянный» взгляд – частая проблема ИИ-моделей. Чтобы этого избежать, недостаточно просто написать «happy». Нужно описывать мимику. Вместо общего слова лучше использовать уточнения: «laughing out loud» (громко смеются), «looking at each other with love» (смотрят друг на друга с любовью), «gently kissing forehead» (нежно целует в лоб). Эмоциональная связь между матерью и ребёнку передается через прикосновения и направление взгляда.
Попробуйте такой вариант для трогательной сцены перед сном:
young mother reading a book to her son in bed, night lamp warm light, cozy atmosphere, sleepy child, mother smiling gently, detailed facial expressions, emotional bond
Словосочетание «emotional bond» (эмоциональная связь) иногда работает как магический ключ, заставляя нейросеть уделять больше внимания взаимодействию персонажей, а не фону. И всё же, иногда приходится делать несколько генераций, чтобы поймать ту самую искру.
Работа с отрицательными промптами (Negative Prompt)
Безусловно, даже самый подробный запрос не гарантирует отсутствия ошибок. Лишние пальцы, искривлённые конечности или размытые лица – вечные спутники генеративного искусства. Чтобы минимизировать этот риск, стоит уделить внимание полю Negative Prompt (то, чего на картинке быть не должно). В это поле следует вписать стандартный набор ограничений: «deformed, bad anatomy, disfigured, poorly drawn face, extra limbs, mutation, floating limbs, disconnected limbs, blurry, ugly».
Для сцены с мамой и сыном особенно важно добавить в негативный промпт слова «twins» (близнецы) и «same face» (одинаковое лицо). Дело в том, что алгоритм часто ленится и накладывает одну и ту же маску лица на обоих персонажей, лишь слегка меняя размер. Указание этих слов в запрещённом списке заставит ИИ генерировать разные черты лица, соответствующие возрасту и полу. Также не помешает добавить «two mothers» или «two sons», если вы хотите видеть строго пару персонажей, ведь нейросеть порой увлекается и добавляет лишних людей в кадр.
Примеры готовых сценариев для копирования
Теперь перейдем к практике и рассмотрим несколько конкретных шаблонов, которые можно брать за основу и дорабатывать под свои нужды. Первый вариант – студийный портрет. Это классика, которая подойдёт для аватарок или иллюстраций. Текст запроса:
studio photography, portrait of beautiful mother and son, plain grey background, professional studio lighting, softbox, sharp focus, elegant clothes, happy expressions, high quality, 4k
Этот промпт даст чистую картинку без отвлекающих деталей, где всё внимание приковано к лицам.
Второй сценарий – сказочная иллюстрация для книги. Допустим, мы хотим изобразить маму и сына в образе эльфов. Промпт будет звучать так:
fantasy illustration, elf mother and little elf son sitting on a giant mushroom, magical forest background, glowing plants, fireflies, intricate details, artstation style, greg rutkowski style, digital painting, whimsical atmosphere
Здесь мы используем имена известных художников (Грег Рутковски – популярный референс для ИИ), чтобы задать определённую манеру рисовки.
Третий вариант – динамичный кадр на улице. Например, обучение катанию на велосипеде. Это сложная сцена, требующая правильной анатомии. Запрос:
mother teaching her son to ride a bicycle, sunny day in suburb, action shot, motion blur background, dynamic pose, protective helmet on boy, realistic textures, photograph
Тег «action shot» поможет избежать статичности, а «motion blur» добавит ощущение скорости.
Нюансы внешности и одежды
Нельзя не упомянуть о кастомизации. Ведь «мама и сын» – это слишком общее понятие. Вы можете задавать этническую принадлежность, цвет волос и стиль одежды. Например, если нужна семья азиатской внешности в традиционных костюмах, это обязательно нужно прописать в самом начале промпта: «Asian mother and son wearing traditional kimono, cherry blossom garden background…». Нейросеть отлично понимает такие маркеры.
То же касается и цвета волос. Если не уточнить, ИИ часто генерирует шатенов или блондинов по умолчанию. Чтобы получить рыжеволосую семью, пишите: «redhead mother and son with freckles». Кстати, веснушки (freckles) добавляют невероятную живость и реализм портретам. А вот с очками стоит быть осторожнее: часто нейросеть рисует оправу, которая врезается в кожу, или стёкла, отражающие что-то странное. Если очки необходимы, добавляйте тег «perfectly fitted glasses».
Ошибки, которые портят всё
Одной из распространённых ошибок является перегруженность промпта. Новички пытаются впихнуть в одно предложение всё: и погоду, и одежду, и стиль художника, и модель камеры, и философский подтекст. В итоге получается каша. Лучше придерживаться структуры: [Главный объект] + [Действие] + [Окружение] + [Стиль/Освещение] + [Технические параметры]. Такой порядок слов помогает алгоритму расставить приоритеты. Сначала он рисует маму и сына, потом помещает их в комнату, а затем накладывает фильтры.
Ещё один момент – использование абстрактных понятий. Слова вроде «beautiful life» или «success» нейросеть понимает с трудом или интерпретирует буквально (например, рисует гору золота или кубок). Лучше заменять их на визуальные эквиваленты. Вместо «success» изобразите героев в дорогом интерьере или красивой одежде. Конкретика – лучший друг промпт-инженера.
Стоит ли использовать референсы?
Многие генераторы (например, Midjourney) позволяют загружать картинку-референс. Это отличный способ задать композицию, если словами описать её сложно. Вы можете взять свое фото с ребёнком (даже не очень удачное) и попросить нейросеть перерисовать его в стиле масляной живописи или киберпанка. Для этого в начало промпта вставляется ссылка на изображение. Это не панацея, но львиную долю проблем с позами это решает.
Однако надеяться только на референс не стоит. Текстовое описание всё равно остаётся ведущим. Картинка задает структуру, а слова – наполнение. Сочетание этих двух методов даёт наиболее предсказуемый и качественный результат. Это скрупулёзный процесс, требующий терпения, но радость от полученного изображения перекроет все затраченные усилия.
Секреты освещения
Свет в генерации изображений играет роль первой скрипки. Именно он создаёт настроение. Для нежных материнских сцен идеально подходит «soft lighting» (мягкое освещение) или «natural window light» (естественный свет из окна). Это сглаживает недостатки кожи и создаёт ореол уюта. Если же вы хотите драмы, попробуйте «rim lighting» (контровой свет). Он подсветит контуры фигур, отделив их от фона.
Интересный эффект даёт «golden hour» (золотой час) – время перед закатом. Свет становится тёплым, золотистым, что идеально подходит для уличных фотосессий. А вот «neon lighting» превратит обычную сцену в кадр из фантастического фильма. Экспериментируйте со светом смелее, ведь именно он превращает плоскую картинку в объёмное изображение.
Путь к идеальному изображению
Создание промпта для дуэта «мама и сын» – это увлекательное творчество, балансирующее на грани технологии и искусства. Не стоит бояться неудачных попыток. Иногда случайная опечатка или неожиданное слово в запросе приводят к гениальным результатам, которые невозможно повторить намеренно. Главное – не останавливаться на базовых формулировках и постоянно усложнять задачу, добавляя детали, эмоции и стиль. Пусть ваши генерации станут настоящим украшением цифрового альбома и вызовут только тёплые эмоции.