Создание собственной анимации ещё пару лет назад казалось чем-то из области фантастики или требовало многомиллионных бюджетов (иногда и того, и другого сразу). Любой, кто хоть раз пытался освоить профессиональный софт вроде Blender или Maya, знает, насколько высок порог вхождения в эту индустрию, ведь на моделирование простого персонажа уходят недели кропотливого труда. Однако цифровая революция, которую принесли нейросети, перевернула игру, дав возможность обычным пользователям почувствовать себя режиссёрами Pixar или Studio Ghibli, не вставая с дивана. Но чтобы этот сложный инструмент выдал шедевр, а не психоделическое месиво из полигонов, нужно владеть специальным языком общения с ИИ. А начать стоит с понимания того, как правильно формулировать свои желания в текстовой строке.
С чего начинается магия?
Сложно ли объяснить машине, что именно вы хотите увидеть? На первый взгляд — довольно просто, но дьявол, как известно, кроется в деталях. Нейросеть — это исполнительный, но совершенно лишенный воображения художник, который воспринимает каждое слово буквально. Если вы напишете «кот в космосе», вы получите кота. В космосе. Но будет ли это милый пушистик в стиле «Истории игрушек» или жутковатый реалистичный зверь, задыхающийся в вакууме? Результат непредсказуем. Именно поэтому построение промта (запроса) напоминает конструктор LEGO, где каждый кирпичик отвечает за определенный параметр: объект, действие, окружение, освещение и, конечно же, художественный стиль. Игнорирование любого из этих элементов обычно приводит к посредственному результату.
Формула идеального запроса
Существует ли универсальный рецепт? Безусловно, каркас успешного промта довольно стабилен. В основе всего лежит главный герой или объект. Сразу за ним следует описание действия или позы, ведь статичная картинка в анимации выглядит скучно. Далее необходимо прописать окружение (задний план), причём чем детальнее, тем лучше. Завершает эту конструкцию блок технических и стилистических уточнений, которые задают тон всему произведению. К слову, именно стилистические теги творят чудеса, превращая обычное фото в рисованный шедевр. Не стоит забывать и про освещение, ведь «cinematic lighting» (кинематографичное освещение) способно вытянуть даже довольно слабую композицию.
Диснеевский стиль и 3D-анимация
Едва ли найдётся человек, который не любил бы современные 3D-мультфильмы с их мягкими формами и выразительными глазами персонажей. Чтобы добиться такого эффекта, нужно использовать специфический лексикон. Ключевые слова здесь играют решающую роль. Для имитации стиля Pixar или Disney стоит обязательно указывать такие теги, как «Pixar style», «Disney style», «3D render» и «Unreal Engine 5». Это даёт нейросети сигнал использовать алгоритмы, имитирующие трёхмерную графику. А для усиления эффекта можно добавить «Octane render» — это название популярного движка рендеринга, который делает картинку сочной и объёмной.
Рассмотрим конкретный пример готового промта для создания милого персонажа. Допустим, нам нужен маленький робот. Текст запроса может выглядеть так:
«A cute tiny rusty robot holding a glowing flower, big expressive eyes, Pixar style, Disney animation, 3D render, high detail, bokeh, cinematic lighting, 8k –ar 16:9»
Обратите внимание на структуру. Сначала мы описали объект (ржавый робот с цветком), затем добавили детали (большие глаза), задали стиль (Pixar, Disney) и заполировали техническими параметрами (8k, соотношение сторон). Результат гарантированно порадует глаз и станет отличной основой для генерации видео.
Аниме и японская эстетика
Совсем другое дело, когда речь заходит о японской анимации. Здесь правят бал линии, цвет и особая атмосфера. Любители работ Макото Синкая или Хаяо Миядзаки знают, что их мультфильмы отличаются невероятной проработкой фонов и неба. Чтобы получить картинку в таком стиле, нужно использовать теги «anime style», «Studio Ghibli», «Makoto Shinkai style» или «detailed line art». Нюанс заключается в том, что для аниме важны цвета, поэтому добавление «vibrant colors» (яркие цвета) будет весьма кстати.
Попробуем составить запрос для сцены в духе киберпанк-аниме. Описание может быть следующим:
«Cyberpunk girl with pink hair standing in the rain, neon city background, anime style, highly detailed, Studio Ghibli vibes, 4k, sharp focus, atmospheric lighting»
В данном случае мы смешали футуристичный сюжет с мягкой стилистикой Ghibli, что довольно часто даёт интересный, самобытный результат. Тем более, что нейросети отлично обучаются на популярных аниме-тайтлах и прекрасно понимают, чего от них хотят.
Пластилиновая ворона и стоп-моушн
Отдельно стоит упомянуть технику кукольной анимации или пластилина. Это довольно редкий, но невероятно колоритный стиль, который сразу выделяется на фоне глянцевого 3D. Чтобы добиться эффекта, будто мультик сделан вручную, используйте слова «claymation» (пластилиновая анимация), «stop-motion» (покадровая анимация) и «Aardman style» (ссылка на студию, создавшую «Уоллеса и Громита»). Изюминка таких генераций — в несовершенстве текстур.
Пример запроса для создания уютной сценки может звучать так:
«Funny fat cat sitting on a sofa, claymation style, Aardman animation, plasticine texture, visible fingerprints, handmade, stop-motion look, soft lighting»
Тег «visible fingerprints» (видимые отпечатки пальцев) здесь критически важен. Он добавляет тот самый антураж ручной работы, за который мы так любим старые мультики. Без него картинка может выглядеть слишком «цифровой» и искусственной.
Зачем нужны негативные промты?
Бывает ли так, что нейросеть рисует лишние конечности или превращает лицо героя в кашу? К сожалению, довольно часто. Это и есть те самые подводные камни, о которые разбиваются мечты новичков. Чтобы избежать подобных казусов, используется так называемый «Negative Prompt» — список того, чего в кадре быть не должно. Это своего рода спасательный круг для вашего творчества. В этот список стоит вносить такие понятия, как «deformed», «ugly», «bad anatomy», «extra fingers», «blurry», «watermark», «text».
В профессиональных интерфейсах (например, в Stable Diffusion или настройках Midjourney) для этого есть отдельное поле. Но если вы пишете промт в одну строку, можно использовать параметры (например, –no в Midjourney). Пример дополнения к основному запросу:
«… –no ugly, deformed hands, extra limbs, text, low quality»
Это значительно очищает результат от визуального мусора. Ведь никому не хочется видеть в добром детском мультике монстра с семью пальцами на одной руке.
Технические параметры и свет
Насколько важен свет? Он буквально формирует настроение сцены. Простое указание «lighting» не даст нужного эффекта. Лучше использовать конкретику: «volumetric lighting» (объёмный свет, лучи), «golden hour» (золотой час, мягкий тёплый свет), «neon lighting» (неоновый свет для киберпанка) или «rembrandt lighting» (драматичное освещение лица). Свет способен превратить скучную модель в живого персонажа.
Также не стоит забывать про соотношение сторон. По умолчанию многие нейросети генерируют квадратные изображения. Но кино и мультики — это широкий формат. Поэтому в конце промта всегда стоит добавлять параметр соотношения сторон. Для Midjourney это «–ar 16:9» или «–ar 2.35:1» (сверхширокий кинематографический формат). Это сразу придаёт изображению вид кадра из полноценного фильма. Казалось бы, мелочь, но именно она отличает любительскую картинку от профессионального концепт-арта.
Секретные модификаторы качества
Есть ли слова, которые автоматически делают картинку лучше? Опытные промпт-инженеры знают, что да. Такие слова, как «masterpiece» (шедевр), «trending on ArtStation» (в тренде на ArtStation), «award winning» (победитель наград) и «high definition» (высокое разрешение), работают как усилители качества. Нейросеть, видя эти маркеры, обращается к тем слоям своей базы данных, где хранятся наиболее качественные и художественно ценные изображения.
Попробуем собрать сложный промт с использованием всех знаний. Допустим, мы хотим эпичную сцену фэнтези-битвы. Промт будет выглядеть внушительно:
«Epic battle between a wizard and a dragon, magical forest background, fire and ice spells, dynamic pose, intense action, Pixar style mixed with World of Warcraft, 8k resolution, unreal engine 5, volumetric lighting, particle effects, cinematic angle, masterpiece, trending on ArtStation –ar 16:9»
Здесь мы смешали стили, добавили динамику («dynamic pose»), эффекты частиц («particle effects») и маркеры качества. Результат с большой вероятностью будет выглядеть грандиозно.
Ошибки, которые убивают результат
Чего делать категорически нельзя? Главная ошибка — чрезмерная перегруженность промта противоречивыми понятиями. Нельзя одновременно просить «photo realistic» (фотореализм) и «flat 2D vector art» (плоский векторный арт). Нейросеть просто сойдёт с ума и выдаст нечто среднее и весьма уродливое. Также не стоит писать абстрактные философские понятия вроде «смысл жизни» или «настоящая любовь». Машина мыслит визуальными образами, поэтому лучше описать «пару, держащуюся за руки на закате», чем просто «любовь».
Ещё один нюанс — порядок слов. То, что стоит в начале промта, имеет для нейросети наибольший вес. Поэтому не прячьте главного героя в конец предложения. Сначала — кто, потом — где, и только потом — как. Это золотое правило, нарушение которого часто приводит к тому, что фон становится главным героем, а персонаж теряется где-то в углу.
Как превратить картинку в видео?
Получив идеальный кадр, многие задаются вопросом: а как заставить это двигаться? Сейчас существуют инструменты (Runway Gen-2, Pika Labs, Kling), которые позволяют анимировать статичное изображение. В этом случае ваш промт для видео должен описывать именно движение. Например: «The robot waves his hand, camera pan right, slow motion».
Если вы генерируете видео сразу из текста, то промт должен быть ещё более сценарным. Пример для видео-нейросети:
«Cinematic shot of a pirate ship sailing in rough storm, lightning strikes, waves crashing, camera zoom in, highly detailed, 4k»
Здесь мы указываем не только объект, но и движение камеры («zoom in» — приближение) и динамику среды. Это сложный, но увлекательный процесс, где вы становитесь настоящим оператором.
Нужен ли английский язык?
Обязательно ли писать на английском? Львиная доля современных нейросетей обучалась на англоязычном контенте. Хотя некоторые модели (например, Kandinsky или последние версии Midjourney) начинают понимать русский, точность интерпретации на английском всё же остаётся на порядок выше. Поэтому, если вы хотите предсказуемый и качественный результат, лучше использовать переводчик. Такие слова, как «fluffy» (пушистый), «glowing» (светящийся) или «intricate» (замысловатый), понимаются машиной гораздо точнее их русских аналогов.
Тем более, что сообщество промпт-инженеров общается преимущественно на английском, и найти готовые примеры или подсказки на этом языке гораздо проще. Это не значит, что нужно владеть языком Шекспира в совершенстве — базового набора слов и Google Translate обычно вполне достаточно для создания добротного контента.
Смешивание стилей
Можно ли экспериментировать? Разумеется. Самые интересные результаты получаются на стыке жанров. Попробуйте смешать «Cyberpunk» и «Medieval» (средневековье). Или «Pixar» и «H.R. Giger» (создатель Чужого). Результат может быть неожиданным и пугающим, но точно не скучным.
Вот пример смелого экспериментального промта:
«Alien creature making coffee in a cozy kitchen, morning light, Looney Tunes style mixed with Lovecraftian horror, surreal, vibrant colors, wide angle lens»
Такое сочетание несочетаемого (уют, мультяшность и ужас) может родить уникальный визуальный стиль, который станет вашей визитной карточкой. Ведь в мире, где контент льётся рекой, ценится именно оригинальность и смелость решений.
Творческий поиск
Путь к идеальному промту — это всегда метод проб и ошибок. Не стоит расстраиваться, если с первого раза вылезла трехногая собака вместо благородного волка. Измените одно слово, добавьте уточнение по свету, уберите лишнюю деталь. Иногда замена «big» на «colossal» меняет восприятие масштаба кардинально.
Главное — не бояться нажимать кнопку «Generate» снова и снова. Каждая генерация приближает вас к пониманию логики машины. И помните, что нейросеть — это всего лишь инструмент, мощная кисть в ваших руках. А настоящим творцом истории остаётесь именно вы. Удачи в создании собственных вселенных, которые, возможно, однажды покорят сердца миллионов зрителей!