Промты для художников (с примерами готовых промтов)

Цифровая эпоха подкинула творцам очередную головоломку, разделив арт-сообщество на два непримиримых лагеря, где одни видят в нейросетях угрозу, а другие — безграничные возможности. Многие художники, иллюстраторы и дизайнеры до сих пор с опаской поглядывают на стремительно умнеющие алгоритмы, полагая, что «бездушная машина» обесценит их многолетний труд. Но так ли это на самом деле? Скорее, ситуация напоминает появление фотографии в XIX веке: живопись не умерла, она трансформировалась. И сегодня умение грамотно составить текстовый запрос становится таким же важным навыком, как владение кистью или графическим планшетом. Ведь нейросеть — это не замена творцу, а мощный инструмент, способный ускорить процесс создания референсов, поиска идей и даже финальных артов. А начать стоит с освоения языка, на котором говорят эти цифровые помощники.

Что такое промт?

Сложно ли составить запрос? На первый взгляд, всё довольно просто: пишешь слова, получаешь картинку. Однако на практике новички часто сталкиваются с тем, что результат бесконечно далёк от задумки. Промт (от английского prompt) — это не просто набор слов, а своего рода программный код, только написанный на естественном языке, который интерпретирует нейросеть. И здесь кроется главный нюанс. Машина не понимает абстракций так, как их понимает человек. Если написать «красивая женщина», алгоритм выдаст нечто усреднённое, основанное на миллионах изображений из своей базы. Чтобы получить конкретный результат, нужно научиться мыслить дескрипторами и тегами. Важно понимать, что порядок слов имеет значение: то, что стоит в начале, имеет для генератора больший вес, чем то, что плетётся в конце.

Анатомия идеального запроса

Любой добротный промт строится по определенной логике, которую стоит усвоить раз и навсегда. Первым делом мы обозначаем объект (Subject) — то, что, собственно, должно быть изображено. Это может быть «рыцарь в сияющих доспехах» или «футуристический город». Далее следует описание среды и действий (Action & Context). Где находится наш герой? Что он делает? К примеру, «стоит на краю скалы под проливным дождем». Следующий важный критерий — художественный стиль (Art Style). Без него нейросеть будет блуждать в потёмках, выдавая то фотореализм, то детский рисунок. Мы можем задать направление словами «киберпанк», «масло», «акварель» или указать конкретного художника. Завершает эту конструкцию блок технических параметров и уточнений качества (Details & Tech specs). Сюда входят такие маркеры, как 4k, highly detailed, cinematic lighting и прочие модификаторы, повышающие детализацию.

Как выбрать стиль?

Стиль — это та самая изюминка, которая задает настроение всей работе. Ограничиваться простым «рисунок» точно не стоит. Нейросети — настоящий кладезь знаний о мировой живописи и современных направлениях. Для создания мрачных, атмосферных работ отлично подходят стили Dark Fantasy или Gothic. Если же душа тяготеет к технологиям будущего, то на помощь придут Cyberpunk, Synthwave или Sci-fi. А вот любителям классики стоит поэкспериментировать с Renaissance или Baroque. Разумеется, можно смешивать несмешиваемое. Например, попросить нарисовать «кота в стиле Ван Гога» (Starry Night style). Результат часто получается непредсказуемым, но весьма колоритным. Тем более, что использование имён известных художников (таких как Greg Rutkowski, Alphonse Mucha или H.R. Giger) помогает задать очень точный вектор генерации, хотя этический аспект этого приема до сих пор вызывает жаркие споры.

Свет и камера

Освещение в генерации изображений играет роль не меньшую, чем в кинопроизводстве. Плоский свет может убить даже самую интересную композицию. Поэтому в промт стоит обязательно включать описания освещения. Cinematic lighting (кинематографичное освещение) добавляет драматизма и объёма. Volumetric lighting (объёмный свет) создает красивые лучи, пробивающиеся сквозь туман или пыль. А если нужно что-то более мягкое и естественное, подойдет Golden Hour (золотой час) или Soft lighting. Не стоит забывать и о ракурсах. Слова Wide angle (широкий угол), Close-up (крупный план) или Aerial view (вид с воздуха) помогают управлять виртуальной камерой. Для достижения эффекта фотореализма часто добавляют названия конкретных камер и объективов, например, Shot on Sony A7R IV или 85mm lens. Это звучит как магия, но алгоритмы действительно реагируют на такие технические детали, подстраивая глубину резкости и боке (размытие фона).

Портретная живопись

Создание портретов — задача не из лёгких. Ведь человеческий глаз моментально считывает малейшие ошибки в анатомии лица. Чтобы получить качественный результат, описание должно быть скрупулезным. Начинать лучше с описания внешности: цвет глаз, форма лица, прическа, особенности кожи. Ключевые слова intricate details, sharp focus и detailed eyes просто обязательны к использованию. Примером может служить такой запрос:

«Portrait of an elven princess with silver hair, glowing blue eyes, intricate jewelry, forest background, ethereal lighting, hyperrealistic, 8k, Unreal Engine 5 render»

Здесь мы видим четкую структуру: объект, детали, фон, свет и технические параметры. А если хочется чего-то более живописного, можно добавить oil painting и visible brushstrokes (видимые мазки кисти), чтобы придать изображению фактуру настоящего полотна.

Пейзажи и окружение

С ландшафтами дело обстоит несколько иначе. Здесь важнее передать масштаб и атмосферу. Грандиозный замок на скале или уютная хижина в лесу требуют разных подходов. Для эпических полотен отлично подходят слова majestic, breathtaking, epic scale. Если же цель — создать постапокалиптический пейзаж, то в ход идут ruins, overgrown, rusty, foggy. Пример готового промта для любителей фэнтези:

«Majestic floating island with waterfalls, ancient ruins, clouds, fantasy world, sunset, vibrant colors, matte painting, highly detailed, concept art»

Обратите внимание на словосочетание matte painting — это техника создания фонов для кино, и нейросети отлично понимают этот термин, выдавая детализированные и композиционно выверенные изображения. А добавление concept art часто уводит стилистику в сторону профессиональной игровой графики.

Отрицательный промт

Есть в мире нейросетей и свой «спасательный круг», который называется Negative Prompt. Это поле, куда мы вписываем всё то, чего категорически не хотим видеть на картинке. И пренебрегать им — большая ошибка. Ведь алгоритм может по своему усмотрению добавить лишние конечности, размытость или текст. Стандартный набор слов для этого раздела обычно включает:

ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face.

Этот список можно копировать из раза в раз, он работает как фильтр грубой очистки, отсекая откровенный брак. Иногда стоит добавлять туда и специфические вещи, например, 3d, если вы добиваетесь эффекта плоского рисунка, или black and white, если нужна только цветная картинка.

Сложно ли работать с весами?

Нюанс, о котором знают далеко не все, — это веса токенов. Иногда нейросеть слишком сильно акцентирует внимание на одном слове и игнорирует другое. Чтобы это исправить, используются специальные синтаксические конструкции. В Midjourney это двойное двоеточие «::», в Stable Diffusion — скобки. Например, запись (blue hair:1.5) скажет алгоритму, что синие волосы — это критически важно, и приоритет этого условия нужно повысить в полтора раза. А вот конструкция [fog:0.5] наоборот, снизит влияние тумана, сделав его едва заметным. Это позволяет тонко настраивать генерацию, добиваясь именно того баланса элементов, который родился в голове художника. Балансировка весов — процесс кропотливый, требующий метода проб и ошибок, но именно он превращает случайную генерацию в управляемый творческий процесс.

Готовые решения: Киберпанк и Фантастика

Для тех, кто хочет сразу окунуться в мир неона и высоких технологий, есть проверенные связки. Попробуйте ввести следующее:

«Cyberpunk street level view, raining, neon lights reflecting in puddles, futuristic skyscrapers, cyborg walking, detailed textures, volumetric lighting, blade runner vibes, hyperrealistic, 8k, octane render»

Здесь каждое слово работает на атмосферу. Octane render — это движок для 3D-рендеринга, упоминание которого заставляет нейросеть имитировать характерный для 3D-графики «глянец» и работу со светом. А упоминание blade runner vibes отсылает к визуальному стилю культового фильма, что сразу дает нужную цветовую гамму — смесь синего, розового и оранжевого.

Готовые решения: Акварельная лёгкость

Смоделировать акварель сложнее, чем кажется, ведь нейросети часто пытаются сделать её слишком детализированной, теряя воздушность. Однако правильный промт творит чудеса. Попробуйте такой вариант:

«Watercolor painting of a cozy cottage in the woods, spring flowers, soft pastel colors, wet-on-wet technique, splashes of paint, paper texture, minimal details, dreamy atmosphere, art by aquarelle masters»

Ключ здесь — wet-on-wet technique (техника «мокрым по мокрому») и splashes of paint (брызги краски). Эти токены добавляют ту самую небрежность и хаотичность, которая свойственна живой акварели. А paper texture добавит изображению фактуру бумаги, что окончательно убедит зрителя в рукотворности работы.

Готовые решения: Тёмное фэнтези

Этот жанр требует особого подхода к теням и деталям. Львиная доля успеха здесь зависит от правильной атмосферы. Пример промта:

«Dark fantasy knight, rusted armor, glowing red eyes, standing in a gloomy cathedral, god rays, dust particles, ominous atmosphere, horror theme, intricate gothic patterns, hyperdetailed, artstation trend, 4k»

Словосочетание artstation trend — это довольно хитрый трюк. ArtStation — платформа для профессиональных художников, и этот тег заставляет нейросеть подтягивать качество генерации до уровня топовых работ с этого сайта. Dust particles (частицы пыли) и god rays (лучи света) добавляют сцене глубины и мистики, делая её живой и пугающей одновременно.

Сюрреализм и абстракция

Иногда хочется уйти от реальности и создать нечто, что не поддается логическому объяснению. Сюрреализм — идеальное поле для экспериментов нейросети, ведь её «галлюцинации» часто напоминают сны. Попробуйте такой запрос:

«Melting clock in the desert, surrealism, dreamlike atmosphere, vivid colors, distorted reality, Salvador Dali style, intricate abstract shapes, mind-bending, absurd, high quality»

Здесь мы прямо ссылаемся на Дали, но добавляем mind-bending (меняющий сознание) и absurd. Это развязывает алгоритму «руки», позволяя генерировать самые невероятные формы и сочетания. В абстракции же хорошо работают запросы, описывающие чувства или математические концепции:

«Fractal patterns, explosion of colors, chaos theory, swirling energy, nebulas, sacred geometry, digital art, vibrant saturation»

Влияние соотношения сторон

Ещё один важный технический момент (о котором часто забывают новички) — это формат изображения. По умолчанию многие сети выдают квадрат. Но для пейзажа это губительно, а для портрета в полный рост — неудобно. В Midjourney параметры задаются через —ar 16:9 (для широкого экрана) или —ar 9:16 (для вертикального формата, как в сторис). В Stable Diffusion размеры выставляются ползунками, но суть та же. Композиция кадра кардинально меняется в зависимости от пропорций. В широком формате нейросеть склонна добавлять больше деталей по бокам, разворачивая панораму, тогда как в вертикальном акцент смещается на высоту объектов или фигуру персонажа. Поэтому промт «Tall skyscraper» в формате 16:9 может выглядеть обрубленным, а в 9:16 — величественным.

Стоит ли копировать чужое?

Этот вопрос часто возникает у тех, кто только начинает свой путь. Можно ли брать чужие промты? Безусловно. Более того, на начальном этапе это даже полезно. Разбор чужих успешных запросов помогает понять логику машины, увидеть, как те или иные слова влияют на результат. Существуют целые базы данных и сайты-агрегаторы (вроде Lexica), где можно найти миллионы изображений с открытыми промтами. Это своего рода библиотека знаний. Однако слепое копирование быстро надоедает. Настоящий азарт появляется тогда, когда начинаешь смешивать, казалось бы, несовместимые стили, добавлять свои уникальные эпитеты и находить те самые «золотые» комбинации, которые выдают шедевры. Ведь в конечном итоге, промт — это лишь партитура, а дирижёром выступает сам человек.

Особенности локальных установок

Если вы решите углубиться в тему и установить Stable Diffusion на свой компьютер, перед вами откроется ещё один пласт возможностей. Речь идет о моделях (Checkpoints) и LoRA. Модели — это, грубо говоря, разные «мозги» нейросети, обученные на конкретных стилях. Есть модели, заточенные исключительно под аниме, есть — под фотореализм. А LoRA — это небольшие надстройки, позволяющие добавить в генерацию конкретного персонажа, стиль одежды или позу. И промтинг здесь становится ещё более специфичным. Приходится использовать специальные слова-триггеры, которые активируют эти надстройки. Это уже высший пилотаж, требующий времени на изучение, но и контроль над результатом становится практически полным. Серьёзное вложение времени окупится сторицей, когда вы сможете генерировать именно то, что задумали, вплоть до узора на пуговицах.

Коммерческое применение

Где же всё это может пригодиться, кроме как для развлечения? Спектр применения огромен. Концепт-арт для игр и кино, иллюстрации для книг и музыкальных обложек, принты для одежды, идеи для татуировок, фоны для веб-сайтов и презентаций. Многие дизайнеры используют генерации как основу для фотобаша (коллажирования), дорисовывая и правя детали вручную. Это значительно ускоряет работу. Вместо того чтобы часами искать на стоках нужную фотографию «девушки в скафандре с котом на руках», можно сгенерировать её за минуту, выбрав нужный ракурс и освещение. Да, нейросеть пока не может полностью заменить сложную верстку или создание логотипов со смыслом, но как генератор визуального контента она уже вне конкуренции.

Подводные камни и этика

Конечно, не всё так безоблачно. Юридические аспекты авторского права на сгенерированные изображения до сих пор остаются серой зоной во многих странах. Кому принадлежат права: пользователю, разработчикам нейросети или никому? Кроме того, сообщество художников справедливо возмущается тем, что сети обучались на их работах без разрешения. Это вызывает волну негатива в сторону «АИ-арт». Поэтому, выкладывая свои работы, стоит быть честным и указывать, что изображение создано с помощью ИИ. Это правило хорошего тона, которое помогает избежать ненужных конфликтов и недопонимания. Тем более, что аудитория постепенно учится отличать ручную работу от машинной, и честность здесь — лучшая политика.

Эксперимент — двигатель прогресса

Самое главное в работе с промтами — не бояться ошибаться. Иногда опечатка в слове приводит к совершенно неожиданным и прекрасным результатам. Нейросеть — это хаотичная сущность, и попытка полностью её обуздать заранее обречена на провал. Лучше относиться к этому как к сотрудничеству с очень талантливым, но немного безумным художником. Меняйте слова местами, используйте синонимы (вместо big напишите colossal, gigantic, enormous — разница будет!), играйте с весами и стилями. Не останавливайтесь на первой же удачной генерации, делайте вариации, смешивайте результаты.

Пусть каждый ваш запрос станет началом нового шедевра, который удивит не только зрителей, но и вас самих.