Промт для фото с чебурашкой (с примерами готовых промтов)

Ни одна современная нейросеть, будь то Midjourney или Stable Diffusion, не обходится без казусов при попытке воссоздать культовых персонажей советской мультипликации. Кто бы мог подумать, что милый зверёк с большими ушами, переживший настоящий ренессанс после выхода одноименного фильма, станет настоящим камнем преткновения для искусственного интеллекта? Обыватель часто полагает, что достаточно ввести одно заветное слово, и цифровой холст озарится знакомой улыбкой, но на практике мы довольно часто получаем жутковатых монстров или абстрактные пятна. Ведь западные модели попросту не обучались на образах из «Союзмультфильма», а значит, концепт придется собирать буквально по крупицам, описывая внешность героя с нуля. Но чтобы не ошибиться и не потратить генерации впустую, стоит детально разобрать механику составления запроса.

Сложно ли создать ушастика?

Задача эта, прямо скажем, не из лёгких. А всё почему? Дело в том, что в базе данных большинства нейросетей токен «Cheburashka» либо отсутствует вовсе, либо связан с очень странными, искаженными изображениями из интернета. Глобальные модели «грезят» образами Микки Мауса или медведей, когда встречают этот запрос. Поэтому полагаться на одно лишь имя персонажа не стоит. Львиная доля успеха зависит от того, насколько скрупулёзно вы опишете анатомию существа. Придется выступить в роли биологического конструктора. Начинать описание нужно с ключевых характеристик, которые делают Чебурашку узнаваемым: огромные круглые уши, коричневая шерсть, небольшое тело и большие выразительные глаза. И все же, даже детальное описание не всегда гарантирует стопроцентное попадание в образ без правильных стилистических модификаторов.

Анатомия правильного запроса

С чего начинается выбор слов? С определения визуальной доминанты. Главное в нашем герое — это, безусловно, уши. В промте их следует обозначать как «huge round ears» или «large circular ears on the sides of the head». Если упустить этот нюанс, нейросеть может нарисовать обычную обезьянку или медвежонка. Далее следует описание текстуры. Чтобы зверёк не выглядел пластиковой игрушкой (если только это не ваша цель), обязательно добавляем «fluffy fur», «brown textured fur» или «soft wool». Это придаст изображению тактильности и реализма.

Нельзя не упомянуть и про лицо. Чебурашка обладает человекоподобными чертами, что довольно сложно объяснить машине. Лучший вариант — использовать связку «cute face», «big eyes», «friendly expression». А вот нос лучше описать как «tiny black nose» или «small button nose», иначе алгоритм может пририсовать внушительный звериный шнобель. К тому же, стоит уточнить пропорции тела: «small body», «short legs», «standing on two legs». Без этих уточнений вы рискуете получить существо, передвигающееся на четвереньках. Ну и, конечно же, не забудьте про цвет — «dark brown» или «light brown» в зависимости от того, какую версию (мультяшную или киношную) вы хотите получить.

Стилистические решения

А в каком стиле вы хотите видеть героя? Здесь поле для экспериментов поистине безгранично. Вы можете поместить Чебурашку в киберпанк-вселенную, где его уши будут заменены на неоновые радары, или же отправить его в мир высокого фэнтези. Для создания реалистичного образа, напоминающего кадры из недавнего блокбастера, стоит использовать такие модификаторы, как «unreal engine 5 render», «cinematic lighting», «hyperrealistic», «8k», «highly detailed fur». Это довольно просто, но результат творит чудеса. Картинка становится объёмной, свет играет на каждой ворсинке, а глаза обретают живой блеск.

Если же душа тяготеет к классике или более художественным интерпретациям, можно попробовать стиль Pixar или Disney. В этом случае промт должен содержать слова «3d render», «cartoon style», «vibrant colors», «soft lighting». Такой подход сгладит текстуры, сделает формы более округлыми и дружелюбными. А для любителей мрачной эстетики или стиля Тима Бёртона подойдут теги «gothic atmosphere», «dark mood», «big creepy eyes», «twisted background». Зрелище, возможно, получится немного удручающее, но зато самобытное и атмосферное.

Готовые промты: Фотореализм

Создать ощущение, что Чебурашка существует в нашем мире, поможет правильная работа со светом и камерой. Попробуйте использовать следующий запрос, который хорошо показал себя в Midjourney и последних версиях Stable Diffusion.

Промт:

A cute small fantasy creature resembling Cheburashka, huge round big ears on the sides of the head, brown fluffy fur, big kind eyes, small button nose, standing on a wooden table, cozy warm lighting, depth of field, bokeh, cinematic shot, hyperrealistic, 8k, highly detailed texture –ar 3:2

Разберем этот пример. Мы не просто назвали персонажа, а описали его («fantasy creature resembling…»), задали текстуру («fluffy fur») и поместили в конкретную среду («wooden table»). К слову, параметр «–ar 3:2» задает горизонтальный формат изображения, что привычнее для восприятия “киношной” картинки. Свет здесь играет решающую роль — «cozy warm lighting» создает ощущение домашнего уюта, столь свойственного этому персонажу.

Ещё один вариант для улицы, где наш герой мог бы прогуливаться с апельсинами.

Промт:

Adorable anthropomorphic creature with massive round ears, brown wooly texture, holding a bright orange fruit, walking on a rainy street, reflection in puddles, soft cinematic lighting, realistic photography, shot on 35mm lens, sharp focus on face –v 6.0

Тут мы добавили действие («holding a bright orange fruit») и атмосферу («rainy street»). Вода и отражения — это всегда испытание для нейросети, но результат выглядит впечатляюще. Использование «shot on 35mm lens» добавляет тот самый антураж профессиональной фотографии.

Готовые промты: Сказочная иллюстрация

Иногда хочется уйти от реальности и окунуться в мир детских книг. Для этого нам понадобятся совсем другие маркеры. Откажитесь от гиперреализма в пользу мягкости и живописности.

Промт:

Illustration of a cute little brown creature with giant round ears, sitting in a box of oranges, magical forest background, watercolor style, soft pastel colors, dreamy atmosphere, detailed art, intricate details, by Beatrix Potter style

Здесь солирует стиль Беатрис Поттер, известной своими акварельными рисунками животных. Это придает изображению винтажный шарм и некоторую наивность. Слово «dreamy» (мечтательный) помогает ИИ настроить цветовую гамму и освещение соответствующим образом.

А вот вариант для любителей современной 3D-анимации.

Промт:

Tiny brown monster with very large round ears, big glossy eyes, smiling, wearing a red scarf, pixar style 3d render, bright vibrant colors, studio lighting, clean background, high quality, cgsociety

Красный шарф — это та самая изюминка, которая может добавить цветовой акцент. Тег «cgsociety» часто используется для улучшения качества рендеринга, так как отсылает к популярному сообществу цифровых художников.

Какой сервис выбрать?

Где же лучше всего генерировать нашего ушастого друга? Вопрос не праздный. Разумеется, лидером по качеству картинки остается Midjourney. Она лучше всего понимает сложные описательные конструкции и выдает наиболее художественный результат. Однако, так как это западный продукт, слово «Cheburashka» для него — пустой звук без детального описания. Приходится изворачиваться.

А вот отечественная разработка Kandinsky (от Сбера) понимает запрос «Чебурашка» с полуслова. Это настоящий кладезь для тех, кто не хочет мучиться с английским языком и сложными описаниями. В «Кандинском» достаточно написать «Чебурашка в космосе» или «Чебурашка ест мороженое», и нейросеть выдаст вполне узнаваемый образ, так как она обучалась на массиве данных, включающем русскоязычный культурный код. Впрочем, качество детализации шерсти и света там может уступать западным аналогам.

Stable Diffusion — это выбор гиков и тех, кто любит полный контроль. Для этой нейросети существуют специально обученные модели LoRA (небольшие файлы-надстройки), которые «учат» нейросеть рисовать конкретно Чебурашку. Установив такую LoRA, вы сможете генерировать персонажа в любых позах и одеждах, просто добавляя ключевое слово-триггер. Это серьезное вложение времени в настройку, но оно окупается стабильностью результата.

Подводные камни генерации

С какими проблемами вы можете столкнуться? Самый частый баг — это количество ушей. Нейросеть иногда «думает», что раз уши должны быть большими, то пусть их будет четыре. Или размещает их не по бокам головы, а на макушке, превращая Чебурашку в странного зайца. Бороться с этим можно через Negative Prompt (негативный промт), куда стоит вписать: «extra ears», «mutated», «deformed», «ears on top».

Другая сложность — конечности. Маленькие ручки и ножки часто сливаются с телом или превращаются в непонятные отростки. Особенно если персонаж держит предмет (тот же апельсин). Тут поможет только метод проб и ошибок, а также использование функции Inpainting (перерисовка части изображения), чтобы исправить конкретный неудачный участок. Ну и, конечно же, лицо. Иногда оно получается слишком человеческим, что вызывает эффект «зловещей долины». Не стоит перебарщивать с тегами «human face», лучше использовать «animal face» или «muzzle».

Стоит ли использовать референсы?

Безусловно. Функция Image-to-Image (генерация по картинке) — это ваш спасательный круг. Если у вас есть изображение классического Чебурашки, загрузите его в нейросеть как основу. Это даст алгоритму понять пропорции и цветовую гамму, к которой нужно стремиться. В Midjourney это делается через вставку ссылки на картинку в начале промта. В Stable Diffusion есть отдельные вкладки для этого. Использование референса значительно снижает градус хаоса и позволяет получить предсказуемый результат даже при скудном текстовом описании. Тем более, что можно регулировать силу влияния референса на итоговый результат, находя баланс между копированием и творчеством.

Тонкости настройки параметров

В завершение темы нельзя не упомянуть технические параметры. Для Midjourney параметр «–stylize» (или –s) отвечает за то, насколько вольно нейросеть будет интерпретировать ваш запрос. Для Чебурашки лучше ставить средние значения (например, –s 250), чтобы сохранить баланс между точностью описания и художественностью. Слишком высокие значения могут увести генерацию в абстракцию. А параметр «–chaos» (хаос) поможет получить неожиданные варианты композиции, если стандартные позы вам наскучили. В Stable Diffusion важную роль играет параметр «CFG Scale» — чем он выше, тем строже нейросеть следует промту. Для персонажей обычно хватает значений от 7 до 11.

Не бойтесь экспериментировать с окружением. Чебурашка в кибер-городе, Чебурашка-самурай или Чебурашка в стиле стимпанк — всё это возможно, если правильно подобрать слова. Главное — четко держать в голове (и в промте) основные визуальные якоря персонажа: уши, глаза и шерсть. А остальное — дело техники и вашей фантазии. Удачных вам генераций, и пусть ваш виртуальный Чебурашка получится самым милым и добротным!