Множество однотипных генераций представлено в сети, где при малейшей попытке стилизации реальные лица людей сливаются в сплошную пластиковую массу. Ведь обыватель зачастую просто вбивает пару слов в строку ввода, надеясь с первого раза получить шедевр. Плохой результат кроется не всегда в лени алгоритма, гораздо чаще проблема произрастает из скудного текстового описания. А если ещё вспомнить постоянные галлюцинации нейронок с перекошенными глазами, то задача для дизайнера усложняется многократно. Но чтобы не ошибиться, нужно использовать точные связки токенов, грамотно направляя машинный разум в нужное русло.
Объёмная стилизация
Сначала прописываем схему освещения. В работах знаменитых анимационных студий солирует именно мягкий свет. К слову, добиться той самой бархатистой кожи из современных полнометражек довольно сложно, если забыть про рендерные движки. Начинать стоит с проверенной железобетонной базы:
3D animation style, cute character, smooth rendering, octane render, volumetric lighting, unreal engine 5, Pixar style, highly detailed, vivid colors
А уж потом навешивать на этот скелет детали внешности. Впрочем, многие новички считают достаточным просто упомянуть название самой студии, но на самом деле без указания конкретного 3D-движка картинка получится плоской и невыразительной.
Как добиться классической 2D-рисовки?
Наряд для избранных. Это касается винтажной эстетики, требующей скрупулёзного и щепетильного подхода. Вся суть в том, что плоская анимация прошлого века тяготеет к пастельным тонам и очень чётким карандашным контурам. К первой группе обязательных токенов относится конструкция:
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Studio Ghibli style, anime art, flat color, 2D animation, watercolor background, soft shading, hand drawn, cel shading
Далее следует добавить конкретику по самому портрету, описывая эмоции:
portrait of a young woman, gentle smile, wind in hair
Ну и, наконец, замыкает формулу упоминание общей атмосферы — «nostalgic mood, magical lighting». Это же правило касается любых попыток воссоздать старый добрый диснеевский рисунок. Ведь именно он имеет ту самую изюминку, заставляющую зрителя окунуться в детские воспоминания.
Мрачный комикс и нуар
Обязательно ли ограничиваться только добрыми сюжетами? Вовсе нет. Львиная доля коммерческих заказов требует более жёсткой, рубленой стилистики графических романов. Буквально десятилетие назад это было роскошью, но сейчас качественный добротный нуар создаётся за три миллисекунды. Особый интерес у заказчиков вызывает стилизация под вселенную Майлза Моралеса. Чтобы кошелёк стал тяжелее от наплыва клиентов, стоит использовать такую мощную связку:
Spider-verse style, comic book art, halftone dots, chromatic aberration, vibrant neon colors, dynamic angle, bold outlines, expressive shading, masterpiece, trending on ArtStation
Разумеется, здесь правит бал хроматическая аберрация. Забывать про этот мощный визуальный инструмент не стоит.
Весовые коэффициенты
Выбор параметров огромен. И всё-таки задачу сохранения сходства с исходным фото нужно решать радикально. Процесс этот не сложный, но кропотливый, бьющий по нервам при потере геометрии лица. Начинается работа с загрузки исходника, сопровождаемой настройкой параметра Image Weight, дополненной точной текстовой подсказкой. Токены распределяются по своей значимости с помощью цифр. Взгляните на этот пример:
caricature style, exaggerated features, funny cartoon portrait, 8k resolution, clear facial features:1.5, background scenery:0.5
Тем более, что цифровые веса позволяют разложить по полочкам все приоритеты для нейросети напрямую. Это надёжно. Потому что проверено. Опытом множества зарубежных энтузиастов.
Отрицательные подсказки
Зрелище крайне удручающее, когда на выходе получается гиперреализм вместо ожидаемой сказки. Это связано с тем, что изначально все алгоритмы обучались на гигабайтах фотографий, и их постоянно клонит в суровый реализм. Ложка дёгтя всегда кроется в пустом поле «Negative prompt». Спасательный круг — это объёмный стоп-лист, отсекающий всё лишнее. Внести свою лепту в чистоту генерации поможет такой базовый набор:
photorealistic, realism, 3d render, photography, ugly, deformed, glitch, noisy, poorly drawn face, bad anatomy, mutant
Конечно, иногда система всё равно выдаёт артефакты, однако с этим щитом махинации машинного интеллекта будут сведены к минимуму. Нет смысла переплачивать за лишние попытки генерации, лучше сразу перестраховаться.
Киберпанк в мультипликации
На скулы мягко ложатся неоновые блики. В представлении многих обывателей неон сочетается только с реалистичным кино, но мультяшный киберпанк выглядит по-настоящему впечатляюще. Главное достояние такого направления — жесточайший контраст между тёмными переулками и кислотными вывесками. С синтаксисом здесь дело обстоит несколько сложнее, так как требуется идеальный баланс цвета. Строится конструкция из следующих элементов:
Arcane style, cyberpunk city background, neon glowing lights, stylized 3d character, cel-shaded, painterly textures, concept art, rich deep colors, dramatic rim light
Не стоит забывать про текстуры, нарисованные кистью (painterly textures). Они творят чудеса, убивая излишнюю «пластиковость» объектов. Да и самим персонажам в такой насыщенной среде находиться куда гармоничнее.
Сложно ли выставить свет?
Да, но финальный результат того стоит. Безусловно, грамотно прописанный свет вытягивает даже бюджетный скучный исходник. С одной стороны, мы имеем плоское любительское фото, с другой — грандиозный потенциал для глубокой ретуши. Стоит отметить, что для создания тёплой сказочной атмосферы отлично подходит связка:
golden hour lighting, god rays, soft cinematic light, glowing dust particles, magical atmosphere
А вот для имитации профессионального студийного сетапа применяется:
studio lighting, rim light, subsurface scattering, pastel color palette
Использование эффекта подповерхностного рассеивания (subsurface scattering) делает кожу мультяшных героев живой, слегка полупрозрачной на просвет.
Строгая векторная графика
Строгий коммерческий формат. Когда-то тихое пристанище корпоративного дизайна сейчас превратилось в настоящее поле битвы промпт-инженеров. Для логотипов и стикеров бомонд тяготеет к плоской векторной рисовке, где любая наляпистость строго недопустима. Нужно отметить, что здесь работает совершенно другой, аскетичный подход. Идеально выверенный запрос выглядит так:
flat vector illustration, corporate memphis style, minimal details, solid pastel colors, clean lines, no gradients, white background, UI design elements, dribbble style
Никаких сложных текстур здесь нет, солирует чистый плоский цвет. Естественно, стоит сразу отсекать любые тени в негативном промпте.
Смешение стилей
А если попробовать смешать абсолютно несовместимое? Удивительно, но гибридные запросы довольно часто выдают колоритный самобытный результат. Например, объединение эстетики детского оригами с мощным 3D-рендером приковывает внимание зрителя мгновенно. Сначала прописываем фактурную основу:
origami paper craft style, 3d animation, cute character made of folded paper, vibrant macro photography, tilt-shift, soft colorful paper textures, unreal engine
Буквально каждая деталь здесь работает на общий антураж. Подводные камни всплывут только в том случае, если переборщить с детализацией глаз (они могут стать слишком человечными и пугающими). Лучше отказаться от излишней физиологичности в угоду чистой стилизации.
Влияет ли ControlNet?
Как удержать точную позу и композицию? Исключительно с помощью дополнительных обученных модулей. В сети оседает множество расширений, но именно связка с картами глубины или контурами решает проблему на корню. Само по себе изображение-референс стопроцентного успеха не гарантирует. Алгоритм, ограниченный жёсткими рамками, направляемый текстовой подсказкой, выдаёт поразительно точное совпадение. Впрочем, не стоит перебарщивать с силой воздействия самого модуля, иначе картинка получится вычурной. Значение в пределах от нуля целых пяти десятых до нуля целых семи десятых — золотая середина для стилизации портретов. Ну, а промпт в этом случае может быть предельно лаконичным:
cute cartoonish character, highly detailed, vibrant, 8k
Финальные штрихи
Отдельного внимания всегда заслуживает аккуратная постобработка. Ведь сгенерированная база крайне редко имеет идеальное разрешение для печати. И здесь на помощь приходят апскейлеры с сохранением заложенной стилистики. К тому же, на этапе увеличения можно добавить немного искусственного шума с помощью короткого промпта:
subtle film grain, hyper-detailed texture, 4k resolution
Добавит этот шаг работе изысканный кинематографический лоск. Не скупитесь на время для тонкой настройки шагов генерации, тестируйте разные модели и алгоритмы. Удачи в создании собственных анимационных миров, пусть каждый отрисованный персонаж запомнится надолго и порадует домочадцев!

