Ни одна вселенная не будоражит умы так сильно, как мир мальчика, который выжил, ведь на истории о Хогвартсе выросло уже не одно поколение. В сети представлено множество артов, созданных художниками вручную, но сегодня любой желающий может почувствовать себя волшебником, просто открыв нейросеть. Казалось бы, нажал кнопку — и шедевр готов, но на практике искусственный интеллект часто выдает совсем не то, что рисовало воображение: то шрам не на том месте, то факультетский шарф превращается в бесформенное пятно, а то и вовсе вместо магии получается дешёвый косплей. Устав от суеты и бесконечных попыток сгенерировать «того самого» Поттера, пользователь часто бросает затею. Но чтобы не ошибиться и получить результат, достойный обложки книги, нужно знать правильные заклинания, а точнее — промты.
С чего начинается волшебство?
Фундамент любого качественного изображения — это стиль. Не стоит забывать, что «Гарри Поттер» — это не просто набор персонажей, а вполне конкретная эстетика, которую принято называть Dark Academia или Magical Realism. Если вы просто напишете имя героя, нейросеть выдаст усреднённый результат. Задача не из лёгких. Ведь машине нужно объяснить, какую именно эпоху и какое настроение вы хотите видеть. Первым делом стоит указать общее направление. К слову, отлично работают связки вроде cinematic shot (кинематографичный кадр) или movie scene (сцена из фильма). Это сразу задает нужный формат. Тем более, что львиная доля обучающих данных для ИИ взята именно из кадров экранизаций. А вот если вы хотите получить картинку в духе книжных иллюстраций, тут на помощь придёт уточнение book illustration style или даже упоминание конкретных художников, например, Mary GrandPré style (именно она рисовала американские обложки).
Освещение и атмосфера
Сложно ли создать правильный антураж? Да, но результат того стоит. Освещение в мире Роулинг играет едва ли не главную роль. Вспомните фильмы: первые части, снятые Крисом Коламбусом, были тёплыми, сказочными и уютными. Чтобы добиться такого эффекта, в промт стоит добавить warm lighting, cozy atmosphere, golden hour или candle light. А вот начиная с «Узника Азкабана», картинка становится холодной, мрачной и контрастной. Здесь уже солируют другие теги: moody lighting, foggy, gloomy atmosphere, blue tones, dark fantasy. Разумеется, нельзя не упомянуть и про технические параметры. Чтобы нейросеть не выдала «мыло», обязательно добавляйте highly detailed, 8k, sharp focus, unreal engine 5 render или volumetric lighting. Последнее, кстати, творит чудеса, создавая тот самый эффект объёмных лучей света, пробивающихся сквозь витражи Большого зала.
Как описать персонажа?
Главная ошибка новичка — надежда на то, что ИИ сам всё знает. Безусловно, Дэниел Рэдклифф известен всем, но нейросеть может «забыть» нарисовать очки или шрам, если не сделать на этом акцент. Промт для самого Гарри должен быть подробным. Начать нужно с внешности: Harry Potter, round glasses, lightning scar on forehead, mess hair, green eyes. Далее следует одежда. Если это школа, пишем Hogwarts Gryffindor uniform, robe with hood, striped tie. Если же мы хотим видеть героя в «гражданском», можно уточнить muggle clothes или Weasley sweater with letter H. Нюанс здесь в том, что нейросети иногда путают цвета факультетов. Поэтому для надёжности можно прописать red and gold colors вручную. Ну и, наконец, возраст. Young boy подойдёт для первых курсов, а teenager или adult wizard — для более поздних сюжетов.
Женские образы: Гермиона и другие
С Гермионой Грейнджер дело обстоит сложнее. В фильмах у Эммы Уотсон волосы были довольно аккуратными (особенно в последних частях), тогда как в книге они описывались как «воронье гнездо». Какой образ выбрать? Решать вам. Для каноничного книжного варианта используйте Hermione Granger, bushy brown hair, holding a stack of books, smart look. А если вам ближе кинообраз, то добавьте Emma Watson likeness. К тому же, женские образы в мире магии часто ассоциируются с определёнными атрибутами. Для Полумны Лавгуд (Luna Lovegood) обязательно стоит упомянуть Spectrespecs glasses (спектрально-астральные очки) и dreamy look. Для профессора МакГонагалл — stern expression, pointed hat, emerald green robes. Кстати, возрастные персонажи получаются у ИИ особенно фактурными, так как морщины и текстура кожи добавляют реализма. Detailed skin texture — тег, который здесь просто незаменим.
Слизеринская эстетика
Отдельного внимания заслуживает «тёмная сторона». Драко Малфой и его окружение — это всегда стиль, холод и аристократизм. Промт для Драко может выглядеть так: Draco Malfoy, platinum blonde sleek hair, pale skin, sneering expression, Slytherin uniform, green and silver colors, dungeon background. Обратите внимание на фон. Для слизеринцев отлично подходят Slytherin common room, stone walls, greenish lighting, underwater window. Это создает нужный контраст с тёплыми гостиными Гриффиндора. Тем более, что эстетика Dark Arts сейчас довольно популярна. Можно попробовать создать образ Пожирателя Смерти: Death Eater mask, dark hooded robe, dark mark on arm, ominous atmosphere, smoke and shadows. Выглядит впечатляюще.
Промты для локаций
Не всегда же рисовать людей. Хогвартс сам по себе — произведение искусства. Чтобы получить величественный замок, используйте такой конструктор: Hogwarts castle exterior, night view, full moon, mountains in background, lake with reflection, magical lights in windows, starry sky, cinematic composition. Если же нужна библиотека, то тут пригодятся Hogwarts library, huge bookshelves reaching ceiling, flying books, dust particles in light rays, ancient scrolls, mysterious atmosphere. Главное — угадать с масштабом. Теги wide angle (широкий угол) или grand scale помогут показать величие архитектуры. А вот для уютной хижины Хагрида лучше подойдёт close up или eye level view с упоминанием pumpkins, stone hut, forest edge.
Примеры готовых промтов (Copy-Paste)
Разумеется, теория без практики мертва. Ниже приведены конкретные сценарии, которые можно копировать в Midjourney или Stable Diffusion, но с небольшими пояснениями, чтобы вы могли их адаптировать.
Для создания гиперреалистичного портрета Гарри попробуйте такой вариант:
portrait of Harry Potter, 15 years old, messy jet black hair, bright green eyes, round glasses, lightning bolt scar, wearing Gryffindor robes, holding glowing wand, magical sparks, Hogwarts castle background, depth of field, bokeh, cinematic lighting, 8k, highly detailed texture –ar 2:3
Здесь соотношение сторон 2:3 идеально для портрета.
Если вам нужна сцена урока зельеварения со Снейпом, введите:
Severus Snape teaching potions class, dungeon classroom, shelves with glass jars containing strange ingredients, cauldron with green bubbling liquid, steam, gloomy atmosphere, stone walls, cinematic lighting, dramatic shadows, realistic photo style –ar 16:9
Формат 16:9 сделает картинку похожей на кадр из фильма.
Для любителей милых существ (например, Добби) подойдёт такой запрос:
Dobby the house elf, large green eyes, floppy ears, wearing a dirty pillowcase, holding a sock, joyful expression, Hogwarts kitchen background, warm lighting, detailed skin texture, hyperrealistic, 3d render style –v 6.0
А если хочется увидеть Патронуса? Это ведь чистая магия света. Попробуйте:
ethereal stag Patronus made of bright silvery blue light, glowing in a dark forbidden forest, mist, mysterious atmosphere, magical energy, translucent, high contrast, cinematic masterpiece –ar 3:2
Стилизация под разные эпохи и жанры
Кто сказал, что Гарри Поттер обязан быть реалистичным? Нейросети позволяют перенести героев в совершенно иные миры. Представьте себе «Поттериану» в стиле киберпанк. Звучит дико? Но выглядит круто. Добавьте в промт cyberpunk style, neon lights, futuristic Hogwarts, robes with glowing led stripes, high tech wands. Или, скажем, вы фанат аниме. Тогда смело пишите anime style, Studio Ghibli style, cel shading, vibrant colors. Картинка мгновенно станет мягче и «мультяшнее». Ещё один интересный эксперимент — стиль нуар. Film noir style, black and white photography, heavy rain, detective coat on Harry Potter, London street 1940s. Это переворачивает восприятие вселенной с ног на голову.
Ошибки и подводные камни
Впрочем, не всё так гладко в датском королевстве. Главная беда генераций — это пальцы и волшебные палочки. ИИ часто рисует персонажам по шесть пальцев или превращает палочку в ветку, растущую прямо из ладони. Как с этим бороться? Во-первых, используйте негативные промты (параметр --no в Midjourney или поле Negative Prompt в SD). Впишите туда: deformed hands, extra fingers, missing limbs, blurry, low quality, bad anatomy, two wands. Это не панацея, но количество брака снизит заметно. Во-вторых, старайтесь избегать слишком сложных сцен с множеством действующих лиц. «Битва за Хогвартс» с сотней персонажей скорее всего превратится в кашу. Лучше фокусироваться на 1-3 героях. Ну и, конечно же, лица на заднем плане. Они почти всегда будут деформированы. С этим проще смириться или использовать апскейлеры и инструменты для исправления лиц (Inpainting) уже после генерации.
Магия деталей
Дьявол, как известно, кроется в мелочах. А в случае с «Гарри Поттером» — в магических артефактах. Обыватель может не заметить, но фанат сразу увидит подвох, если снитч будет размером с футбольный мяч. При описании предметов будьте скрупулезны. Если это Золотой снитч, пишите Golden Snitch, small gold ball with silver fluttering wings, intricate patterns, metallic texture. Если Распределяющая шляпа — Sorting Hat, old tattered leather, face-like folds, brown color. Нейросеть тяготеет к упрощению, поэтому чем больше прилагательных вы дадите предмету, тем лучше. Особый интерес вызывают животные. Букля (Hedwig) получается почти всегда идеально, так как сов ИИ рисует превосходно. Достаточно написать snowy owl, white feathers, amber eyes, sitting on shoulder. А вот с фестралами могут возникнуть проблемы, так как их анатомия слишком специфична («скелетообразные лошади с крыльями летучей мыши»). Тут придётся подбирать слова долго и упорно: skeletal black horse, bat wings, leathery skin, visible bones, spooky.
Какой движок выбрать?
На самом деле, выбор инструмента тоже влияет на промт. Midjourney понимает более художественные, абстрактные описания. Ей можно просто сказать «magic atmosphere», и она сделает красиво. Stable Diffusion требует больше технической конкретики и строгого соблюдения синтаксиса (вес токенов, скобки). DALL-E 3, встроенный в ChatGPT, лучше всего понимает естественный язык. Ему можно написать промт как рассказ: «Нарисуй Гарри, который сидит у камина и грустит». Он поймёт контекст лучше других. Но есть и минусы. DALL-E часто делает картинки слишком «пластиковыми» и прилизанными. Если вам нужна мрачная, зернистая текстура плёнки, Midjourney или настроенный SD будут предпочтительнее.
Секреты композиции
Не забудьте про ракурс. Большинство генераций по умолчанию делаются «в лоб», на уровне глаз. Это скучно. Чтобы добавить динамики, используйте low angle shot (вид снизу) — это придаст герою величия или угрозы (идеально для Волан-де-Морта). High angle shot (вид сверху) сделает персонажа уязвимым или покажет масштаб окружения. Dutch angle (заваленный горизонт) добавит напряжения и хаоса, что отлично подойдёт для боевых сцен. Также стоит упомянуть macro shot для детальной съёмки зелий, колец или палочек. Глубина резкости (shallow depth of field) поможет отделить объект от фона, сделав акцент на главном. Это простой приём, но он делает изображение на порядок профессиональнее.
А что насчёт цвета?
Цветовая палитра — мощнейший инструмент повествования. Вы можете принудительно задать гамму. Например, emerald and silver palette мгновенно отправит зрителя в подземелья Слизерина. Scarlet and gold — в башню Гриффиндора. Но можно играть тоньше. Desaturated tones (обесцвеченные тона) создадут эффект воспоминания или флешбэка из Омута Памяти. Vibrant vivid colors подойдут для сцен в магазине «Всевозможные волшебные вредилки» близнецов Уизли. Не бойтесь экспериментировать с тегами color grading (цветокоррекция), подсматривая названия популярных фильтров из киноиндустрии, например teal and orange (классическая киношная схема).
Финальные штрихи
Создание промта — это процесс, похожий на зельеварение. Добавил лишнее слово — котёл взорвался (картинка испорчена). Не доложил ингредиентов — зелье не сработало (изображение скучное). Приходится постоянно помешивать, пробовать, менять пропорции. Иногда удачный результат получается с первой попытки, а иногда приходится генерировать десятки вариантов, меняя одно-единственное слово. Это нормально. Главное — не останавливаться на шаблонах. Мир магии огромен, и он не ограничивается стенами школы. Есть Министерство Магии, Тисовая улица, Нора Уизли, Косой переулок. Каждая из этих локаций заслуживает своего уникального промта и своего подхода.
Генеративная магия сегодня доступна каждому, у кого есть клавиатура и немного фантазии. Пусть ваш цифровой Патронус всегда будет ярким, а результаты генераций радуют глаз и собирают тысячи лайков.