Промт для чата GPT для создания персонажа Дисней по фотографии

В сети можно встретить тысячи сгенерированных аватарок, но лишь единицы действительно передают дух классической или современной трёхмерной анимации. Буквально десятилетие назад детальная отрисовка одного мультяшного героя отнимала у студий месяцы кропотливой работы, а сейчас этот грандиозный процесс сжался до нескольких секунд. Плохой или неестественный результат генерации — это не всегда вина самой нейросети. С одной стороны, алгоритм честно пытается перенести черты реального лица на трёхмерную модель, с другой — без чётких текстовых координат машина скатывается в пугающий реализм. Но чтобы не ошибиться и не получить пластиковую куклу вместо живого героя, нужно грамотно составить словесный каркас.

Все топовые нейросети в одном месте

С чего начинается стилизация?

Блик на зрачке, созданный мягким боковым светом. Именно с таких мелочей добротный диснеевский рендер и начинается. Сложно ли добиться такого эффекта новичку? Вовсе нет. Львиная доля успеха кроется в правильном указании визуального движка. Ведь встроенный в чат алгоритм DALL-E 3 тяготеет к фотографичности, если его не ограничить жёсткими рамками мультипликации. Стоит отметить, что простые запросы вроде «в стиле Дисней» выдают откровенную наляпистость довольно часто. А вот оригинальное название студии Pixar, дополненное упоминанием конкретного софта для рендеринга, творит чудеса. Разумеется, не стоит забывать про соотношение сторон. Вертикальный детализированный портрет смотрится выигрышнее.

Англоязычный базовый промт

Родной язык нейросеть понимает значительно лучше. И всё же отечественные пользователи часто грезят идеальным машинным переводом, хотя на самом деле лучше скармливать чату нативные английские конструкции. Алгоритм действий выстраивается хронологически: сначала задаётся общий стиль графики, затем описывается базовая анатомия, после чего настраивается свет, заканчиваясь проработкой текстур. Это же правило касается и загружаемой фотографии (она должна быть хорошо освещена). Вот вполне рабочий стартовый вариант:

Create a 3D Pixar and Disney style character based on the attached photo. A cute 25-year-old girl with big expressive hazel eyes, slightly oversized head, smooth soft skin, wearing a cozy oversized knitted sweater. 3D animation style, Unreal Engine 5 render, volumetric lighting, plain pastel background, 8k resolution

Этот изысканный текстовый шаблон станет отличной отправной точкой.

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

Детализация внешности

Глаза в любой анимации солируют. Это непреложный факт. Если не уделить им должного внимания, персонаж получится абсолютно стеклянным. К тому же фирменная изюминка таких мультфильмов кроется именно в преувеличенных эмоциях. Впрочем, не стоит перебарщивать с искажением пропорций. Иначе кошелёк станет легче от потраченных впустую лимитов генерации, а результат лишь разочарует. Лучше отказаться от сложных динамичных поз на первых этапах тестирования. Пусть герой просто смотрит прямо в камеру. А облачиться в наряд принцессы или добавить колоритный национальный костюм можно уже позже. Пример отличного модификатора для лица:

Exaggerated facial expressions, large luminous eyes with detailed iris, soft magical smile, slightly rosy cheeks, cinematic depth of field

Зрелище удручающее, если забыть про эти маркеры. Но с ними статичная картинка моментально оживает.

Русскоязычная адаптация

Языковой барьер преодолим. Задача не из лёгких. Машина переводит наш текст на свой внутренний код перед каждой генерацией. Тем более, что многие скрупулёзные детали легко могут затеряться при таком двойном преобразовании. Однако для многих специалистов такой подход довольно удобен. Стоит попробовать следующую русскую конструкцию:

Сгенерируй трёхмерного персонажа в стиле мультфильмов студии Пиксар на основе прикреплённого фото. Мужчина тридцати лет, лёгкая небритость, добрая ухмылка, волосы уложены крупными прядями. Одет в плотную фланелевую рубашку лесоруба. Освещение мягкое кинематографичное, фон размытый осенний. Высокая детализация текстур кожи, стиль современной компьютерной анимации

Естественно, нейросеть попытается перенести черты лица с исходника максимально точно. Дело в том, что алгоритмы машинного зрения сначала выделяют жёсткие контуры, потом считывают геометрию черепа, завершая сложный процесс натягиванием новой мультяшной текстуры поверх каркаса.

Опасны ли референсы?

Загрузка одной качественной фотографии — это серьёзное вложение в итоговую схожесть. Обязательно ли отправлять сразу десяток разных ракурсов? Безусловно, нет. Встроенный модуль анализирует только одно прикреплённое изображение в рамках конкретного запроса. Конечно, всплывут некоторые подводные камни, если исходник слишком тёмный или откровенно засвеченный. Лицо должно быть освещено равномерно. Многие считают, что нейросеть сама додумает невидимые участки во мраке, но на самом деле она просто возьмёт усреднённый пластиковый шаблон из своей базы. Такие махинации с тенями часто приводят к тому, что на выходе получается совершенно другой человек. Ну и, конечно же, откажитесь от снимков с перекрытым лицом. Очки, медицинские маски или руки возле подбородка алгоритм интерпретирует крайне неоднозначно.

Окружение и антураж

Правильно выстроенный фон спасает даже самую посредственную генерацию. И всё же обыватель забывает про задний план довольно часто. А ведь именно он позволяет зрителю окунуться в ту самую сказочную атмосферу. Кстати, вычурный фон отвлекает внимание от самого героя. Поэтому стоит отдавать предпочтение слегка размытым, кинематографичным локациям. С одной стороны, нужен понятный контекст, с другой — персонаж обязан стоять на ногах как главная визуальная доминанта. Можно использовать такой запрос для атмосферы:

Character sitting in a cozy magical cafe, warm fairy lights glowing in the background, bokeh effect, soft magical dust floating in the air, golden hour lighting

Этот самобытный сказочный шлейф точно внесёт свою лепту в итоговую композицию.

Как избежать эффекта зловещей долины?

Идеальных нейросетей пока не существует. Ложка дёгтя обязательно найдётся в виде странных артефактов на одежде или пугающего стеклянного взгляда. Нельзя не упомянуть, что нейросети страдают излишней любовью к текстурам дешёвого пластика. Иногда кожа получается слишком глянцевой, что сразу бросается в глаза. Как победить этот неприятный эффект? Способ существует. В промт вводится фраза-спасательный круг:

Matte skin, subtle natural skin texture, soft cloth physics, avoiding plastic look and creepy staring

Впрочем, грандиозный провал может случиться и при попытке сделать волосы слишком реалистичными. Исконно мультяшная эстетика подразумевает волосы, уложенные крупными геометричными прядями, подсвеченные контровым светом, обрамляющие лицо без излишней прорисовки каждого волоска. Не перегружайте текстовый запрос излишней анатомией.

Злодейская эстетика

Мрачная стилистика. Она требует совершенно иного подхода к формированию запроса. Если добрые персонажи грезят пастельными тонами, то антагонисты требуют жёстких теней. Бомонд классических диснеевских злодеев всегда выделялся острыми чертами лица и контрастным освещением. К слову, чтобы превратить человека с фотографии в харизматичного негодяя, нужно использовать другие маркеры. Попробуйте этот вариант:

Create a Disney villain style character from the photo. Sharp facial features, pale skin, mysterious glowing green eyes, wearing elegant dark gothic clothes with silver embroidery. Dramatic shadows, harsh directional lighting, spooky misty castle background, Unreal Engine render

Лицо, искажённое лёгкой надменной ухмылкой, подсвеченное снизу (градусов под сорок пять), создаст нужный драматический эффект.

Животные-компаньоны

Ни одна уважающая себя история не обходится без забавного питомца. Да и самим зверькам комфортнее находиться в кадре вместе с хозяином. Добавление пушистого спутника делает картинку невероятно милой. Тем более, алгоритм отлично справляется с генерацией шерсти. Запрос можно модифицировать так:

A cute 25-year-old girl in Pixar style holding a small fluffy orange kitten with massive adorable eyes. The kitten has soft textured fur and a funny expression. Magical forest background, volumetric sun rays

Важно понимать нюанс: чем больше объектов в кадре, тем сложнее алгоритму удержать сходство с исходной фотографией. Поэтому такие сложные композиции лучше создавать шаг за шагом.

Все топовые нейросети в одном месте

Поэтапная доработка

Прямое общение с машиной через диалоговое окно — это мощнейший инструмент. Получив первый результат, не стоит удалять чат и начинать всё заново. Лучше разложить по полочкам то, что конкретно не понравилось, попросив бота внести точечные изменения в уже созданную картинку.

«Сделай глаза чуть больше, а улыбку шире», «поменяй цвет куртки на изумрудный», «добавь милые веснушки на нос»

Машина запоминает контекст беседы отлично. Это же правило действует, когда вы создаёте сказочный аватар для своего чада. Обе стороны медали заключаются в том, что алгоритм может отказаться генерировать детей по реальному фото из-за строгих внутренних фильтров безопасности. В таких случаях выручит подробное словесное описание без прикрепления снимка.

Отдельно стоит упомянуть работу с цветовой палитрой. Кладезь хорошего вкуса кроется в ограничении цветов. Выберите три основных оттенка (например, бирюзовый, золотой и белый) и прямо пропишите их в запросе:

Color palette limited to teal, gold and pure white

Такая строгость не сильно ударит по креативности бота, но сделает изображение гармоничным. Ну и, конечно же, экспериментируйте с эпохами внутри самой анимации. Попробуйте смешать классическую плоскую рисовку девяностых годов с современным объёмным освещением. Создание собственного альтер-эго — процесс невероятно увлекательный, он точно порадует домочадцев и подарит массу положительных эмоций. Пусть каждый сгенерированный портрет станет отличным решением для социальных сетей и запомнится надолго. Удачи в творческих поисках!