Промт для создания мультяшного персонажа в WhiskAI под дальнейшую видеоанимацию

В сети можно найти огромное количество красивых картинок от нейросетей, но когда дело доходит до их «оживления», магия часто рушится на глазах. Обыватель видит изысканную статичную иллюстрацию, а моушен-дизайнер, пытаясь анимировать своё нарисованное чадо, получает сплошную головную боль с симметрией или слипшимися слоями, включая искажённые пропорции. Плохой исходный материал — это далеко не всегда вина самой вычислительной модели. Ведь чаще всего корень зла кроется в изначально неправильно составленном текстовом запросе. А если ещё вспомнить специфику работы алгоритмов, то процесс подготовки графических ассетов превращается в изнурительную рутину. Поэтому перед началом работы желательно сразу сформировать грамотный технический каркас запроса.

Все топовые нейросети в одном месте

Специфика генерации

С настройки параметров холста начинается настоящая работа. Здесь кроется важный нюанс. Модель WhiskAI отличается от многих конкурентов тем, что она исконно тяготеет к избыточной визуальной детализации. Сложно ли укротить эту нейросеть? Да, но результат того стоит. Обилие градиентов или сложных текстур вкупе с мелкими тенями создадут при скелетной анимации эффект графического мусора. К слову, буквально десятилетие назад создание одного чистого векторного героя занимало у профессионального художника несколько дней, а сейчас похожий сырой результат можно получить за тридцать секунд. И всё же не стоит слепо доверять автоматике. Ведь львиная доля успеха зависит от вашей способности жёстко ограничить фантазию алгоритма. Довольно часто неопытные авторы пытаются вписать в один блок все мыслимые характеристики, получая на выходе невразумительную наляпистость. На самом деле кошелёк станет легче гораздо быстрее, если бездумно тратить лимиты на перегенерацию, вместо того чтобы сразу использовать выверенные лингвистические конструкции.

Как добиться правильной позы?

Задача не из лёгких. Для дальнейшего скелетного риггинга в профильных программах (например, Spine или After Effects) нам жизненно необходима абсолютно нейтральная стойка. Естественно, классическая Т-образная позиция смотрится в статике довольно скучно. Многие грёзят о том, что герой должен сразу выглядеть эпично, но на самом деле динамичные ракурсы полностью убивают возможность аккуратно разрезать фигуру на суставы. Рабочий добротный промт для таких утилитарных целей обязан включать прямые указания на фронтальное расположение и зеркальную симметрию. А вот оригинальное название желаемого стиля лучше выносить в самое начало строки. Пример надёжного англоязычного запроса выглядит так:

Generate a 2D vector cartoon character of a young brave forester boy wearing simple plain green clothes while standing in an A-pose with symmetrical full body shot facing the camera using flat colors and clear outlines on a white solid background in a minimalist character design sheet style

В этом тексте солирует именно техническая часть, а не художественная концепция. Безусловно, машина всё равно попытается добавить отсебятины, но жёсткие рамки удержат её от создания сложных анатомических поворотов.

Нереальный визуал и кинематографичное видео в пару кликов 🎬

Нужен крутой концепт-арт, реалистичная анимация или профессиональный апскейл? Теперь у вас есть единый доступ к лучшим визуальным нейросетям планеты: Midjourney, Runway, Kling и Sora. Улучшайте качество готовых роликов до максимума с помощью встроенных ИИ-инструментов. Никаких сложных настроек, мощного ПК или зарубежных карт. Всё работает прямо в браузере или в Telegram-боте!

Откройте новые горизонты для творчества. Жмите на ссылку, регистрируйтесь и создавайте шедевры 👉 https://clck.ru/3RNCRL

Ошибки новичков: Лишние детали

Одежда для избранных. Выбор фасонов поистине грандиозный. Но есть и существенные минусы в чрезмерной креативности при генерации нарядов. Дело в том, что каждый лишний ремень или накладной карман, а также развевающийся на ветру шарф аниматору придётся обрабатывать отдельно. Компактное решение — монолитные формы без болтающихся элементов. Стоит серьёзно задуматься о том, как виртуальная рука будет проходить сквозь длинный плащ. Герою стоит облачиться в максимально простую экипировку. Внести ясность и порядок поможет следующий промт:

Create a clean vector art character with simple outfit design and minimalist clothing utilizing plain colors alongside blocky shapes without any dangling accessories

Если же концепт категорически требует вычурности, придётся генерировать элементы гардероба по частям. В представлении творческого бомонда машина сразу выдаёт готовый шедевр уровня крупных студий. Когда-то кривые генерации с пугающей анатомией вызывали лишь смех, сейчас же качество шагнуло неимоверно далеко вперёд, однако законы физики в анимации никто не отменял. Главное — изначально угадать с геометрией.

Нужна ли раскадровка?

Ответ кроется в специфике вашего проекта. Если герой будет свободно передвигаться по сцене, одного ракурса спереди критически мало. Создание так называемого оборотного листа решает эту проблему на корню. Метод не сложный, но кропотливый, требующий максимально точных формулировок от инженера. Запрос нужно выстраивать вокруг концепции множественных видов на одном полотне. В генератор следует отправить такую конструкцию:

Generate a character turnaround sheet for a cute sci-fi mechanic girl showing her front view and side profile view alongside a back view standing in a row with the same proportions using flat cel shading isolated on a pure white background as a concept art reference

С одной стороны мы получаем готовый набор проекций для понимания объёмов, с другой — сохраняем единый колоритный стиль отрисовки. К тому же такой подход серьёзно экономит бюджет на поиски нужного референса. Ну и, конечно же, не стоит перебарщивать с количеством ракурсов в одном запросе.

Эмоции и лицевой риг

Слезливая гримаса или искренняя улыбка творят чудеса при восприятии мультфильма. Нужно ли генерировать каждую новую эмоцию отдельным длинным промтом? Вовсе нет. Гораздо эффективнее заставить WhiskAI выдать целый лист с вариантами лицевой артикуляции в рамках одного изображения. Именно в лицевой анимации кроется главная изюминка любого характера. Запрос можно сформировать следующим образом:

Create a character expression sheet featuring face close-ups of a grumpy old wizard containing multiple head shots on one page to show a happy and sad or angry and surprised including a neutral face in a flat vector style isolated on a plain background

Вся суть в том, что нейросети проще выдерживать стилистику, когда она рисует несколько объектов за один проход, опираясь на соседние пиксели. К слову, именно этот приём считается настоящим кладезем полезного материала для специалистов по моушен-графике. К тому же именно лицо приковывает внимание зрителя больше всего остального.

Что насчёт освещения и фона?

Глаз нещадно режет яркий неоновый свет. Именно с такой неприятной проблемой часто натыкаешься на результаты работы неопытных авторов, пытающихся выжать максимум из драматичного освещения. С цветокоррекцией дело обстоит довольно специфически: нам нужен абсолютно плоский, скучный цвет. Это связано с тем, что глубокие тени и яркие блики моушен-дизайнер будет накладывать самостоятельно уже в процессе финального композитинга. В противном случае нарисованный объёмный свет при повороте головы начнёт конфликтовать с логикой сцены, и зрелище получится крайне удручающее. Надёжный спасательный круг кроется в словах «flat shading» или «no gradients». Стоит отметить, что задний план тоже требует скрупулёзного подхода. Лучше отказаться от генерации живописных пейзажей позади фигуры. Ведь лишний визуальный антураж только усложнит обтравку. Идеальным решением станет чистый зелёный фон, залитый сплошным цветом, прописанный через простую фразу:

solid chroma green background

Да и самим художникам гораздо комфортнее вырезать объекты с такого однородного контрастного полотна.

Все топовые нейросети в одном месте

Санитарный контроль

Сначала прописывается смысловое ядро персонажа. Затем аккуратно накладываются атрибуты одежды, усиленные конкретными оттенками и отлитые в плоскую графику под строгим указанием нужного ракурса. Впрочем, иногда на экране всплывают неприятные сюрпризы в виде третьей ноги или разорванных контуров. Эти подводные камни надёжно лечатся грамотным негативным промтом. Отрицательные значения имеют внушительный вес в архитектуре WhiskAI. В специальное поле обязательно нужно внести лепту в виде запрещающих тегов:

Do not use 3D render or realistic photography and avoid gradient mesh alongside drop shadows or background environment including text and watermark with asymmetrical features or dynamic pose and perspective distortion

Тем более, что полное отсутствие теней и перспективных искажений — это базовые постулаты плоскостного риггинга. Разумеется, безупречного результата с первой попытки добиться очень сложно. Это тяжёлый, но исключительно эффективный способ получить исходник, который не стыдно передать в отдел анимации.

Подготовка к отправке

Венчает этот процесс финальный технический этап, требующий особого щепетильного внимания к рабочему разрешению. Не скупитесь на встроенный апскейл, если платформа позволяет это сделать без потери качества. Огромное количество цифрового мусора оседает на краях формы при низком разрешении. Ведь сложные махинации с альфа-каналом и пикселями способны загубить всю работу при попытке перевести растровое изображение в чистый вектор. Для получения максимально резкого контура можно смело добавить в конец запроса спасительные слова:

sharp edges and 8k resolution including crisp clean lines

Исконно строгий вид достигается именно этими короткими тегами. Конечно, полностью избежать ручной чистки в графическом редакторе не удастся, однако объём черновой работы сократится в десятки раз. Этот скрупулёзный процесс тонкой настройки текстового ввода в итоге с лихвой окупается на этапе непосредственного оживления героя. Чтобы с головой окунуться в производство, требуется системный технический склад ума, где каждое английское слово стоит на своём месте, формируя прочный фундамент будущего видеоролика. Надеюсь, этот структурированный подход поможет вам приручить строптивую нейросеть, а готовый анимированный проект запомнится надолго.