Ни одна цифровая генерация не обходится без доли разочарования на первых этапах. В сети представлено множество идеальных портретов взрослых, где текстура кожи и свет выглядят безупречно. А вот создать реалистичного годовалого ребёнка без пугающих анатомических искажений — задача со звёздочкой. Искусственный интеллект часто тяготеет к кукольным лицам, делая малышей похожими на фарфоровые статуэтки или, что ещё хуже, придавая им пугающие взрослые черты. Это связано с тем, что в обучающих базах львиная доля детских снимков уже прошла агрессивную глянцевую ретушь. Но чтобы не слить часы на пустые попытки, нужно грамотно выстроить технический текстовый каркас.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
С чего начинается база?
Фокусное расстояние решает всё. Это основа. Ведь именно оптика формирует правильную геометрию лица в кадре. Стоит ли сразу вписывать в генератор декор и воздушные шарики? Вовсе нет. Начинать нужно с определения технического фундамента, который задаст тон всей картинке. К слову, опытные креаторы всегда стартуют с указания параметров камеры. Когда-то давно, в ранних версиях алгоритмов, обывателю хватало простого слова «photo», но сейчас машины требуют щепетильный технический подход. Если нужен классический добротный портрет, прописать стоит следующее:
professional photography of a 1-year-old baby boy, shot on Canon EOS R5, 85mm f/1.2 lens, sharp focus, shallow depth of field, highly detailed skin texture, 8k resolution
Мультяшность отсекает именно этот промт, поскольку он имитирует работу дорогого современного оборудования. Ну и, конечно же, не стоит забывать про соотношение сторон.
Эстетика Smash Cake
Заляпанный кремом нос. Именно с такой незначительной детали обычно начинается поиск референсов для первого дня рождения. Традиция крушить кондитерские изделия перед камерой зародилась за океаном довольно давно, а сегодня она прочно осела в портфолио фотографов по всему миру. Многие считают, что для генерации такого сюжета достаточно написать «ребёнок ест торт», но на самом деле результат вас неприятно удивит. Вычурный наляпистый декор просто поглотит главного героя. Чтобы кадр получился живым, процесс описания следует разворачивать строго хронологически. Сначала мы задаём возраст и пол, затем описываем действие и эмоцию, следом добавляем сам декор и завершаем всё параметрами света. Отличным решением станет такой вариант:
A cute 1-year-old baby boy smashing a blue birthday cake with his hands, messy face with frosting, laughing happily, sitting on a white seamless background, light blue and silver balloons around, bright studio lighting, photorealistic, cinematic color grading –ar 4:5 –style raw –v 6.0
Здесь солирует именно эмоция, а не фон.
Праздник в саду: закатный свет
Абстрактное зелёное месиво вместо листвы выдавали нейросети буквально пару лет назад, но сейчас алгоритмы творят чудеса. Сцены на открытом воздухе смотрятся невероятно атмосферно, если правильно поймать освещение. Тем более, что естественный свет всегда сглаживает мелкие артефакты цифровой рисовки. Эксперт прекрасно знает всю ценность закатных лучей (особенно в так называемый золотой час). Сложно ли стилизовать церемонию на природе без реальной вылазки в парк? Да, процесс не сложный, но кропотливый. Картинка получится самобытной, если использовать следующий текст:
1 year old toddler boy walking outdoors in a summer blooming garden, wearing beige linen overalls, soft golden hour sunlight, sun flares, natural bokeh, magical atmosphere, highly detailed foliage, shot on Kodak Portra 400, analog photography style –ar 16:9
К тому же, плёночный колорит добавляет ту самую изюминку, скрывая излишнюю резкость. Да и самим родителям приятнее смотреть на мягкие, исконно тёплые оттенки.
Вредно ли перегружать запрос?
Словарный запас машины огромен. Однако жадность часто бьёт по бюджету времени. Нередко авторы пытаются впихнуть в одну строку цвет глаз, фасон рубашки, количество пуговиц, текстуру ковра и породу собаки на заднем плане. И всё же алгоритм неизбежно начнёт путаться. Дело в том, что внимание нейросети рассеивается при обилии прилагательных. Мальчик, облачённый в хлопковую рубашку, окружённый плюшевыми медведями, освещённый контровым светом, легко может получить медвежьи уши. Поэтому не стоит перебарщивать. Лучше отказаться от лишней атрибутики в пользу качественного описания света и эмоций. Огромный внушительный список реквизита есть смысл заменить парой ёмких фраз. Например, вместо перечисления всех видов шаров, напишите просто:
pastel balloon garland
Этого вполне хватит.
Световые схемы
Освещение творит чудеса. Плоский свет убивает любой, даже самый скрупулёзный промт. Естественно, большинство новичков забывают указать тип источника, получая на выходе пластилиновые лица без объёма. А начать стоит с базовых терминов студийных мастеров. Окно, дающее мягкий рисующий свет, дополненное серебристым отражателем, создаёт нужную глубину. Попробуйте добавить в запрос связку:
Rembrandt lighting, softbox, cinematic rim light
Это же правило касается и фонового освещения. Заслуживает истинного уважения приём с использованием гирлянд на заднем плане, которые нейросеть превращает в роскошное боке. Подобные махинации с фокусом позволяют скрыть недостатки генерации. Пример промта для студии с тёплым светом:
Portrait of a 1-year-old boy, sitting on a dark wooden floor, surrounded by warm glowing fairy lights, soft studio lighting, rim light on hair, hyper-detailed skin texture, 85mm lens, f/1.4, highly detailed, 8k –ar 4:5
Зрелище получается поистине грандиозное, когда блики играют в глазах малыша.
Как управлять эмоциями?
Открытая искренняя улыбка. Поймать её у годовалого непоседы в реальности — та ещё лотерея. Сложно ли заставить ИИ нарисовать искреннюю радость? Довольно часто алгоритм выдаёт либо истерический смех, либо пугающе серьёзный взгляд взрослого умудрённого жизнью человека. Обе стороны медали выглядят неестественно. Секрет кроется в использовании правильных глаголов действия. Статические описания дают статичные напряжённые лица. Вместо сухого «happy boy» лучше использовать:
giggling baby boy, eyes wide open with wonder, clapping hands, pure joy
И не стоит забывать про взаимодействие с предметами. Ребёнок, увлечённо разглядывающий мыльный пузырь, автоматически обретает живую мимику. Вот отличный вариант:
1 year old boy trying to catch a floating soap bubble, looking up, mouth slightly open in amazement, bright sunny day, park background, sharp focus on the face, blurred background, documentary photography style –v 6.0
Здесь всё разложено по полочкам.
Отрицательные маркеры
Шестипалые руки. Они всплывут обязательно. Подводные камни кроются в том, что анатомия младенцев до сих пор даётся ИИ с огромным трудом из-за специфических пропорций пухлых конечностей (особенно запястий и фаланг). Безусловно, спасательный круг здесь — это грамотный блок negative prompt. В интерфейсах Stable Diffusion или Midjourney стоит вносить лепту в чистоту кадра суровыми запретами. Разумеется, базовые слова работают неплохо:
ugly, deformed, mutated
А вот для детской специфики нужно отметить необходимость блокировать взрослые черты лица. Пропишите в минус-слова:
adult face, makeup, unnatural skin, plastic, 3d render, cartoon, extra fingers, distorted proportions, long neck
Инверсия: именно эти параметры чистоту картинки сохраняют. Впрочем, иногда приходится генерировать десятки вариантов, прежде чем наткнёшься на идеальные ручки без лишних суставов.
Скандинавский минимализм в интерьере
Когда-то пёстрые фотозоны с ростовыми куклами были пределом мечтаний, но сейчас тренды кардинально сместились в сторону лаконичности. Самобытный интерьер без лишнего визуального шума приковывает внимание к лицу героя. Эстетичны ли такие кадры? Само по себе пустое светлое пространство может показаться скучным, но грамотно расставленные акценты спасают положение. Деревянные экологичные игрушки, фактурные вязаные пледы и нейтральная палитра не сильно ударят по кошельку при реальной съёмке, а в нейросети они генерируются вообще без проблем. Главное — угадать с палитрой. Попробуйте такой запрос:
Candid photo of a 1 year old boy sitting on a cozy rug in a minimalist scandinavian living room, natural window light from the left, wearing neutral tones knitted sweater, playing with wooden blocks, soft shadows, magazine aesthetic, ultra realistic –v 6.0
В представлении многих это самый выигрышный коммерческий вариант.
Найти свой идеальный визуальный почерк — процесс не быстрый, но крайне увлекательный. Экспериментируя с освещением, оптикой и стилистикой, вы обязательно нащупаете те самые комбинации слов, которые заставят алгоритм выдать настоящий шедевр. Пусть каждый сгенерированный кадр радует глаз безупречной детализацией, а процесс создания новых уникальных образов запомнится надолго!