Промт для создания картинки из мультика с нуля в Midjourney и DALL-E

В сети можно найти несметное количество готовых промтов, обещающих сотворить шедевр в один клик. Многие из них действительно работают, но часто результат получается шаблонным, лишённым индивидуальности. Ведь истинное удовольствие от работы с нейросетями — не в копировании чужих находок, а в создании чего-то своего, уникального, в воплощении образа, который до этого жил лишь в воображении. Однако, чтобы не блуждать в потёмках и не тратить драгоценные попытки генерации на неудачные эксперименты, стоит разложить весь процесс создания запроса по полочкам.

Базовый синтаксис: Скелет запроса

Задача не из лёгких, но вполне решаемая. Начать нужно с основ, с того самого «скелета», на который потом будут нанизываться детали. Любой хороший промт для мультяшного персонажа строится на нескольких китах. Во-первых, это сам объект — кто или что будет солировать на изображении. Во-вторых, его действие и окружение, задающие контекст. Ну и, конечно же, стилистика, которая превратит обычную картинку в кадр из мультфильма. В самом простом виде это выглядит так:

Мультяшный лисёнок в очках читает книгу в уютной лесной библиотеке, стиль студии Ghibli

Такой запрос нейросеть поймёт без труда. Главное на этом этапе — чёткость и лаконичность. Не стоит перегружать базовый запрос эпитетами, это всё будет позже.

Как задать стилистику мультфильма?

А вот тут начинается самое интересное. Выбор стилистики — это 80% успеха. Ведь именно она определяет настроение и визуальный язык будущей картинки. Существует несколько подходов, и каждый из них по-своему хорош. Один из самых очевидных путей — указание на конкретную, хорошо известную студию. Формулировки вроде in the style of Pixar, Ghibli studio style или in the style of classic Disney animation (1990s) дают нейросети довольно чёткие референсы. Результат получается предсказуемым и добротным.

Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸

Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.

Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL

Другой, не менее действенный подход — апелляция к именитому автору, чей стиль узнаваем. Например, добавление by Tim Burton мгновенно окрасит картинку в готические, слегка меланхоличные тона. А вот упоминание Хаяо Миядзаки (Hayao Miyazaki) наполнит её воздухом и акварельной лёгкостью. Третий способ, который требует большей скрупулёзности, — это описание стиля словами. Можно использовать такие маркеры, как 2D animation, cel shading, vector art, storybook illustration или anime key visual. К слову, последний вариант часто даёт очень чистые и детализированные изображения, похожие на официальные постеры. Не стоит бояться комбинировать подходы, например:

cute cartoon sticker, vector art, flat design

Управление персонажем: Детализация и эмоции

Львиная доля успеха зависит от проработки героя. Что насчёт его внешности? Здесь не стоит скупиться на детали. Вместо простого `девочка` лучше написать:

a little girl with big curious blue eyes and freckles, wearing a red raincoat and yellow boots

Чем точнее описание, тем меньше у нейросети пространства для нежелательных импровизаций. Это же правило касается и одежды, и аксессуаров, и даже причёски. Каждый нюанс вносит свою лепту в итоговый образ.

Как быть с эмоциями? Тут простым «грустный» или «весёлый» не обойтись. Гораздо лучше работают описательные конструкции. Например, вместо sad можно использовать on the verge of tears, melancholic gaze, а вместо happy — joyful smile, laughing heartily, eyes sparkling with happiness. Такие формулировки помогают нейросети уловить тонкие оттенки настроения и передать их через мимику. К тому же, не стоит забывать о позе. Указание dynamic pose, action pose или, наоборот, relaxed sitting pose сразу задаёт динамику или статику всей композиции. Вся суть в том, что вы режиссируете сцену, а нейросеть её отрисовывает.

Работа с камерой и светом. А так можно было?

Многие обыватели упускают из виду один мощнейший инструмент — управление виртуальной камерой и светом. А ведь именно эти параметры превращают плоскую картинку в кинематографичную сцену. Разумеется, это требует определённого навыка. Начать стоит с ракурсов. Такие команды, как close-up shot (крупный план), medium shot (средний план), full-body shot (в полный рост) или wide angle shot (широкоугольный кадр) знакомы любому фотографу и творят настоящие чудеса в Midjourney. Они заставляют ИИ сфокусироваться на нужной детали или, наоборот, показать масштаб окружения.

Не менее важен свет. Он задаёт атмосферу. Попробуйте добавить в свой промт cinematic lighting — и картинка мгновенно станет более драматичной и объёмной. Другие удачные варианты — soft volumetric light для создания мягкой, сказочной атмосферы, rim lighting для эффектной контурной подсветки персонажа или dramatic backlight для создания силуэта на ярком фоне. Это тот самый случай, когда одна небольшая деталь (например, добавление `—ar 16:9 для широкоформатного кадра) способна кардинально изменить восприятие всего изображения. Результат выглядит впечатляюще.

Негативные промты: От чего стоит отказаться?

Подводные камни есть везде. Иногда нейросеть, несмотря на все ухищрения, добавляет в изображение что-то лишнее: текст, водяные знаки, уродливые детали или искажённые конечности. На этот случай существует спасательный круг — негативные промты. В Midjourney за это отвечает параметр `—no`. После него через запятую можно перечислить всё, чего на картинке быть не должно. Стандартный джентльменский набор выглядит так:

—no text, watermark, signature, ugly, deformed

Нужно отметить, что не стоит перебарщивать с отрицаниями. Слишком длинный список «не» может сбить нейросеть с толку. Лучше сосредоточиться на самых критичных моментах. Например, если вы генерируете персонажа, имеет смысл добавить —no deformed hands, extra limbs, ведь именно с руками у ИИ до сих пор бывают проблемы. DALL-E же, в свою очередь, лучше понимает негативные указания прямо в тексте, в духе a man with no beard. Это не так надёжно, но довольно часто срабатывает.

Главное — не бояться экспериментировать и воспринимать каждую генерацию не как конечный результат, а как шаг в творческом поиске. Иногда самая неожиданная формулировка или случайная комбинация стилей приводит к открытию, которое станет вашей персональной «изюминкой». Удачи в ваших творческих махинациях, и пусть каждый сгенерированный кадр станет маленьким шедевром.

Базовый синтаксис: Скелет запроса

Как задать стилистику мультфильма?

Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸

Управление персонажем: Детализация и эмоции

Работа с камерой и светом. А так можно было?

Негативные промты: От чего стоит отказаться?

Статьи по теме

Нано банана нейронка без цензуры

Промт для малышей (с примерами готовых промтов)

Смешные промты для фото (с примерами готовых промтов)

Промт для мамы (с примерами готовых промтов)