Промт для персонажа (с примерами готовых промтов)

Рождается ли герой с наброска в блокноте или с удачно подобранного слова? В эпоху цифрового искусства этот вопрос звучит как никогда актуально, ведь нейросети, будь то Midjourney или ChatGPT, превратились в мощнейший инструмент для креаторов всех мастей. Однако многие сталкиваются с так называемым синдромом «пластиковой куклы», когда сгенерированный образ выглядит безупречно, но совершенно безжизненно, или же текстовый персонаж говорит шаблонными фразами из дешёвых мыльных опер. Львиная доля успеха здесь зависит не от удачи, а от умения формулировать мысли, превращая абстрактные идеи в понятные алгоритму команды. Но чтобы вдохнуть душу в цифровой код и получить результат, от которого перехватит дыхание, нужно освоить специфическую архитектуру запроса.

С чего начинается магия?

Сложно ли придумать героя? Кажется, что нет ничего проще, но как только пальцы касаются клавиатуры, в голове образуется вакуум. Первая ошибка, которую довольно часто совершают новички, — это излишняя краткость. Написав «красивая девушка в стиле киберпанк», вы отдаёте инициативу в руки рандома, а он, уж поверьте, обладает весьма специфическим вкусом. Стоит понимать, что нейросеть — это не телепат, а исполнительный, но невероятно буквальный художник. Ей нужны якоря. Ими становятся детали, которые обыватель мог бы счесть незначительными. Цвет пуговиц на камзоле, шрам над левой бровью или даже текстура ткани — всё это формирует тот самый уникальный антураж. Начинать же стоит с базового архетипа, постепенно наслаивая на него визуальное «мясо».

Анатомия визуального запроса

Разберём структуру, которая творит чудеса при работе с генераторами изображений. Основу костяка составляет, разумеется, сам объект. Но просто назвать его мало. К слову, опытные промпт-инженеры используют метод «слоёного пирога». Сначала вы описываете физические данные (раса, возраст, телосложение), затем переходите к одежде и аксессуарам, а венчает эту конструкцию описание окружения и стиля. При этом порядок слов имеет колоссальное значение: то, что стоит в начале, алгоритм считает приоритетным.

Рассмотрим конкретный пример для фэнтези-сеттинга. Если мы хотим получить мрачного мага, запрос не должен ограничиваться парой слов. Добротный промт будет выглядеть примерно так:

«Пожилой некромант с измождённым лицом, глубокие морщины, бледная кожа с сероватым оттенком, длинные спутанные седые волосы, облачён в истрёпанную чёрную робу с серебряной вышивкой, на шее амулет из кости, держит в руках посох с навершием в виде черепа ворона, тёмная магическая аура, зловещий лес на фоне, туман, кинематографичное освещение, высокая детализация, стиль тёмное фэнтези».

Здесь каждое слово — это мазок кисти, уточняющий итоговую картину.

А как быть с научной фантастикой?

Здесь работают те же постулаты, но меняется лексикон. Тяготеет этот жанр к техническим терминам и описанию материалов. Допустим, нам нужен пилот боевого робота. Скупиться на описание гаджетов тут точно не стоит. Пример запроса может звучать следующим образом:

«Молодая женщина-пилот меха, кибернетический глаз с красным свечением, короткая стрижка, неоновые татуировки на шее, носит футуристический бронекостюм с потёртостями и следами масла, хромированные детали, шлем в руках, на заднем плане ангар с гигантскими роботами, искры от сварки, объёмный свет, стиль киберпанк, гиперреализм, Unreal Engine 5 render».

Заметьте, мы добавили «потёртости» и «следы масла» — именно эти нюансы убивают искусственную «пластиковость» и делают картинку живой.

Текстовые ролевые модели

Совсем иначе дело обстоит с текстовыми нейросетями. Тут визуальная красота отходит на второй план, а солирует психология. Чтобы ChatGPT или Claude вошли в роль, нужно задать им так называемую «системную персону». Это, по сути, инструкция актёрского мастерства. Нельзя просто сказать «ты — пират». Нужно объяснить, какой именно это пират. Может, он боится воды? Или цитирует Шекспира?

Работающая схема выглядит так. Сначала вы задаёте имя и роль, затем описываете мотивацию, манеру речи и скрытые страхи. Пример готового промта для текстового отыгрыша:

«Твоя роль — старый ворчливый алхимик по имени Элиас. Ты скептически относишься к любой магии, кроме своей собственной науки. Твоя речь изобилует сложными терминами, которые ты тут же упрощаешь для собеседника с ноткой снисходительности. Ты часто кашляешь и жалуешься на ревматизм. Твоя главная цель — найти рецепт философского камня, но ты скрываешь это за маской безразличия. Никогда не выходи из образа, даже если собеседник говорит о современных вещах — интерпретируй их через призму средневековой алхимии».

Такой подход превращает сухого бота в харизматичного собеседника.

Стилизация и художественные приёмы

Важно ли указывать имя художника? Безусловно. Это, пожалуй, самый короткий путь к желаемой эстетике. Ведь нейросети обучались на миллионах картин, и упоминание конкретных фамилий (например, Грег Рутковски для фэнтези или Альфонс Муха для ар-нуво) мгновенно меняет стилистику генерации. Однако ограничиваться только именами не стоит. Можно использовать описание техник: «масло», «акварель», «угольный набросок» или «цифровая живопись».

Для любителей фотореализма существует свой набор заклинаний. Ключевые слова здесь играют роль настроек камеры. Фразы вроде «снято на 35mm», «глубина резкости», «боке», «студийный свет» или «золотой час» кардинально меняют восприятие кадра. Хотите драмы? Добавьте «контрастное освещение» или «рембрандтовский свет». Нужна лёгкость? Используйте «мягкий фокус» и «пастельные тона».

Ошибки, которые убивают результат

Натыкаешься на них постоянно. Главная проблема — противоречивые команды. Если в одном предложении вы напишете «минимализм» и «сверхдетализация», нейросеть, скорее всего, выдаст нечто среднее и невнятное. Также не стоит перебарщивать с количеством объектов. Когда в промте упоминается пять разных персонажей с детальным описанием каждого, алгоритм начинает «галлюцинировать», смешивая части тел и одежды в жутковатый винегрет. Лучше сфокусироваться на одном герое, а остальных добавить позже через функции редактирования (Inpainting), если софт это позволяет.

Ещё один нюанс — отрицательные промты. Это спасательный круг для тех, кто устал от лишних пальцев или размытых фонов. Во многих интерфейсах для этого есть отдельное поле, но если его нет, можно попробовать добавить параметр «–no» (в Midjourney). Обычно туда вписывают: «mutated hands, blurry, low quality, distortion, extra limbs». Это своего рода фильтр, отсекающий брак.

Примеры универсальных промтов

Давайте соберём своеобразный конструктор, который выручит в моменты творческого ступора. Эти шаблоны можно адаптировать под любую задачу, меняя лишь переменные.

Для создания эпического героя подойдёт такая формула:

«[Имя/Тип героя], [Ключевая черта внешности], [Одежда и экипировка], [Действие или поза], [Окружение], [Тип освещения], [Художественный стиль]».

На практике это превращается в:

«Викинг-берсерк, шрамы в виде рун на груди, меховой плащ и тяжёлый топор, кричит в ярости, заснеженные горы во время бури, драматичный холодный свет, стиль концепт-арт для игры God of War».

Для создания милого персонажа-талисмана (маскота) структура будет иной:

«Милый [Вид существа], большие выразительные глаза, [Текстура: пушистый/гладкий/глянцевый], [Цвет], [Аксессуар], простой однотонный фон, 3D рендер, стиль Pixar, яркие цвета».

Реализация:

«Маленький робот-помощник, округлые формы, глянцевый белый пластик, светящийся синий экран-лицо, держит в руках цветок, мягкое студийное освещение, 4k, стиль мультфильмов Disney».

Тем более, что эксперименты никто не отменял. Порой самые неожиданные комбинации, вроде «рыцарь в скафандре, стиль средневековой гравюры», дают самый впечатляющий и самобытный результат.

Свет и цвет

Играет ли освещение решающую роль? Да, и даже большую, чем геометрия лица. Плоский свет может убить самую гениальную задумку, превратив 3D-модель в картонную вырезку. Поэтому стоит уделить этому аспекту особое внимание. «Volumetric lighting» (объёмный свет) добавляет воздуху плотности и загадочности. «Rim light» (контровой свет) очерчивает силуэт, отделяя героя от фона, что особенно полезно для тёмных сцен. А «Cinematic lighting» делает картинку похожей на кадр из дорогого блокбастера.

Что касается цвета, то тут тоже есть свои хитрости. Не обязательно перечислять все оттенки. Достаточно задать палитру: «neon palette» для киберпанка, «earthy tones» для друидов или «monochrome with red accents» для стильного нуара. Нейросеть прекрасно понимает такие ассоциативные ряды.

Нюансы веса и приоритетов

В продвинутых генераторах есть возможность регулировать «вес» слова. Это значит, что вы можете приказать искусственному интеллекту уделить какому-то аспекту больше внимания. Обычно это делается через синтаксис (::) или скобки. Например, «cat::2 dog::1» скажет системе, что кошка на изображении должна быть в два раза важнее или заметнее собаки. Это инструмент тонкой настройки, который помогает, когда нейросеть упорно игнорирует важную деталь, например, головной убор или цвет глаз. Однако новичкам с этим спешить не стоит — легко нарушить баланс композиции.

Генерация как процесс

Не стоит ожидать шедевра с первой попытки. Создание идеального промта — это итеративный процесс, похожий на огранку алмаза. Вы пишете запрос, смотрите на результат, морщитесь, добавляете пару уточняющих прилагательных, меняете стиль освещения и пробуете снова. Иногда одна единственная запятая или перестановка слов местами меняет композицию до неузнаваемости.

Помните, что нейросеть — это кладезь возможностей, но без вашего видения она всего лишь калькулятор пикселей. Не бойтесь использовать метафоры. Фразы вроде «взгляд, полный скорби» или «атмосфера надвигающейся бури» алгоритмы последних поколений считывают на удивление точно, переводя эмоции в визуальные коды. А если добавить к этому технические параметры разрешения (4k, 8k) и детализации (ultra-detailed, intricate), результат может превзойти самые смелые ожидания.

Пусть ваши персонажи обретут голос, историю и неповторимый облик, который запомнится надолго.