Промты для diffusion (с примерами готовых промтов)

Сотни тысяч сгенерированных изображений ежедневно наводняют ленты социальных сетей, заставляя обывателя верить в то, что искусственный интеллект — это какая-то волшебная палочка, читающая мысли по одному клику. Кажется, достаточно ввести слово «кот», и нейросеть тут же выдаст шедевр, достойный лучших галерей мира, где пушистый зверь будет сидеть в золотом ошейнике на троне из слоновой кости. Но суровая реальность довольно быстро сбивает спесь с новичков: вместо ожидаемой красоты на экране появляется нечто с тремя хвостами, поплывшим глазом и лапами, растущими из ушей. Глубокое разочарование — вот первое чувство, которое испытывает человек, столкнувшийся с «сырой» генерацией. Ведь машина не понимает абстракций, она оперирует математикой, векторами и тегами, и чтобы заставить её «рисовать» красиво, нужно выучить её язык. И начать стоит с осознания того, что промт — это не просто описание, а набор точных координат в многомерном пространстве смыслов.

Анатомия запроса

С чего начинается построение грамотной команды? С определения главного объекта, разумеется. Это фундамент, на котором будет держаться вся композиция, будь то портрет девушки, футуристический город или тарелка с супом. Однако сухого называния предмета нейросети будет недостаточно. Ей нужны подробности, контекст и стиль. Львиная доля успеха зависит от того, насколько скрупулезно вы опишете детали, которые человеку кажутся очевидными, а для машины — пустым местом.

Здесь в игру вступает структура. Сначала мы обозначаем субъект (Subject), затем навешиваем на него действия и обстоятельства, а в конце — заполировываем всё это стилистическими модификаторами. Важно понимать, что слова, стоящие в начале строки, имеют для алгоритма больший вес, чем те, что плетутся в хвосте. Поэтому, если вам важен цвет глаз персонажа, не стоит запихивать его в самый конец огромного абзаца.

Модификаторы стиля и качества

Красивая картинка. Как объяснить это машине? Для неё понятие «красиво» — пустой звук, набор нулей и единиц. Чтобы задать нужный вектор эстетики, приходится прибегать к хитростям и использованию специфического словаря, который сформировался в сообществе за последние пару лет. Вы наверняка замечали в чужих работах странные приписки вроде «unreal engine 5», «octane render» или «8k resolution». Казалось бы, при чем тут игровой движок, если мы генерируем портрет маслом? Дело в том, что в базе данных, на которой обучалась модель, изображения с такими тегами обычно имели высочайшее качество, детализацию и проработанное освещение. Добавляя эти слова, мы как бы намекаем нейросети: «Сделай мне так же круто, как на тех рендерах».

Кроме технических терминов, отлично работают отсылки к конкретным художникам. Это довольно мощный инструмент, способный мгновенно изменить антураж изображения. Если вы хотите получить что-то воздушное и декоративное, попробуйте добавить имя Альфонса Мухи (Alphonse Mucha). Нужна мрачная биомеханика? Ханс Рудольф Гигер (H.R. Giger) вам в помощь. А для эпических фэнтези-пейзажей часто используют Грега Рутковски (Greg Rutkowski), чьё имя стало уже нарицательным в мире AI-арта. Впрочем, не стоит ограничиваться одним именем; смешение стилей разных авторов порой творит чудеса, рождая совершенно новые, самобытные визуальные языки.

Свет и камера

Освещение решает всё. Плоский свет способен убить даже самую интересную задумку, превратив её в скучную аппликацию. Поэтому работе со светом стоит уделить особое внимание. Кинематографичное освещение (cinematic lighting) придаст сцене драматизма и глубины. Объёмный свет (volumetric lighting) добавит в воздух пылинки и лучи, пробивающиеся сквозь туман или листву. А если хочется чего-то более мягкого и студийного, подойдут теги вроде «soft lighting» или «studio light».

Не стоит забывать и о камере. Ведь от ракурса зависит восприятие масштаба и эмоций. Широкий угол (wide angle) поможет охватить грандиозный пейзаж, но может исказить пропорции лица при портретной съёмке. Для крупных планов лучше использовать указания на фокусное расстояние, например, 85mm или 100mm, что обеспечит красивое размытие фона (bokeh) и правильную геометрию лица. Кстати, само слово «bokeh» — отличный триггер для создания глубины резкости. А вот тег «macro» позволит разглядеть мельчайшие детали, будь то фасетчатый глаз насекомого или текстура ткани.

Негативные промты

Нужны ли они вообще? Безусловно. Это своего рода спасательный круг, который не дает нейросети скатиться в безумие мутаций. Негативный промт (Negative Prompt) — это поле, куда мы вписываем всё то, что категорически не хотим видеть на итоговом изображении. И тут есть свои нюансы.

Часто новички игнорируют это поле, а потом удивляются, почему у девушки три руки, а пейзаж размыт, как будто на объектив пролили масло. В стандартный набор «оберегов» обычно входят слова: ugly, deformed, noisy, blurry, low quality, bad anatomy, extra limbs, watermark. Это база. Но для конкретных задач список может расширяться. Например, если вы генерируете чёрно-белое фото, в негатив стоит добавить «color». Если создаете реалистичный портрет, то «cartoon», «illustration» и «3d» отправляются в запрещённый список, чтобы избежать эффекта пластиковой кожи. Это надежно. Потому что проверено. Временем и тысячами испорченных генераций.

Синтаксис и веса

Как заставить нейросеть обратить внимание на конкретную деталь? Повысить её вес. В большинстве интерфейсов (Automatic1111, ComfyUI) для этого используются скобки. Если мы возьмем слово в круглые скобки (word), его значимость немного вырастет. Если добавим ещё одни ((word)) — вырастет ещё сильнее. Также можно использовать числовой коэффициент: (word:1.2) увеличит вес на 20%, а (word:0.8) — уменьшит. Это невероятно полезный инструмент, когда нужно сбалансировать композицию.

Например, вы генерируете девушку в лесу, но лес забивает собой всё пространство, а героиня теряется. Достаточно заключить описание девушки в скобки или повысить её коэффициент, и она снова выйдет на первый план. А вот перебарщивать с весами не стоит. Слишком высокие значения (выше 1.5–1.6) могут привести к появлению артефактов, «пережаренных» цветов и общей деградации картинки. Всё хорошо в меру.

Реалистичные портреты

Давайте перейдём от теории к практике и рассмотрим структуру промта для создания фотореалистичного портрета. Задача не из лёгких. Ведь человеческий глаз моментально считывает малейшую фальшь в чертах лица или текстуре кожи.

Для начала формируем базу. Нам нужна молодая женщина с конкретными характеристиками. Пишем: «portrait of a beautiful young woman, intricate details, natural skin texture, realistic eyes». Это скелет. Но он слишком прост.Теперь добавляем «мяса» — модификаторов освещения и техники. Дописываем: «cinematic lighting, shot on 35mm lens, f/1.8, depth of field, sharp focus, 8k, highly detailed». Уже лучше.Чтобы придать снимку особый шарм и уйти от эффекта пластиковой куклы, можно добавить плёночного зерна и отсылки к аналоговой фотографии: «analog film grain, kodak portra 400, vintage style».В итоге полный промт может выглядеть так:

«Close-up portrait of a young woman with freckles, messy red hair, green eyes looking at camera, sunset lighting, soft shadows, detailed skin pores, hyperrealistic, shot on Sony A7R IV, 85mm lens, cinematic composition, masterpiece, best quality.»

Заметьте, здесь нет глаголов действия, только нанизывание характеристик через запятую. И, конечно же, не забываем про негативный промт: «cartoon, painting, illustration, 3d render, plastic skin, bad anatomy, deformed eyes, cross-eyed».

Фэнтези и концепт-арт

Здесь правила немного меняются. Нам уже не нужна фотореалистичность, нам нужен стиль, атмосфера и эпичность. В ход идут имена художников и названия игровых движков. Представим, что мы хотим увидеть древний замок на скале во время грозы.

Начинаем с описания сцены: «majestic dark fantasy castle on a cliff, stormy weather, lightning bolts, dark clouds».Добавляем атмосферу и стиль: «mysterious atmosphere, gothic architecture, intricate stone details, epic scale».Теперь вводим «тяжёлую артиллерию» для улучшения визуала: «concept art, digital painting, artstation trending, matte painting, hyperdetailed, unreal engine 5, octane render».И, наконец, приправляем именами художников для нужного стиля: «by Greg Rutkowski, by Makoto Shinkai» (если хотим добавить немного анимешной драматичности неба).Итоговый вариант:

«Gloomy gothic castle on a high mountain peak, thunderstorm, purple lightning, volumetric fog, dark fantasy concept art, intricate details, epic composition, trending on artstation, unreal engine 5 render, highly detailed, by Greg Rutkowski and H.R. Giger.»

Киберпанк и футуризм

Этот жанр требует своей лексики. Неон, дождь, хром и высокие технологии — вот наши киты. Попробуем создать киберпанк-улицу.Основной блок: «futuristic cyberpunk city street at night, neon signs, rain, reflections on wet asphalt, flying cars».Детализация: «holographic advertisements, crowd of cyborgs, high tech architecture, dystopian atmosphere».Технические параметры: «ray tracing, global illumination, photorealistic, 8k, cyberpunk 2077 style».Также отлично работает добавление конкретных цветовых палитр, например: «cyan and magenta color palette».Готовый промт:

«Night cyberpunk city street, neon lights reflecting in puddles, futuristic skyscrapers, holograms, heavy rain, blade runner vibe, detailed environment, cinematic lighting, ray tracing, photorealistic, 8k resolution, vibrant colors, neon blue and pink.»

Абстракция и сюрреализм

Иногда хочется чего-то странного, не поддающегося логике. Тут можно дать волю фантазии и использовать несочетаемые понятия.Основа: «mind-bending abstract fractal landscape, fluid shapes, melting clocks».Стиль: «surrealism, dreamlike, hallucination, psychedelic art».Модификаторы: «vibrant colors, intricate patterns, mathematically perfect, 4k».Пример запроса:

«Surreal dreamscape with floating islands made of liquid gold, melting clocks dripping into the sky, clouds made of flowers, Salvador Dali style, vivid colors, intricate abstract patterns, fantasy art, masterpiece, high quality.»

Текстовые инверсии и LoRA

Кстати, мир промтинга не ограничивается только словами. Существуют специальные надстройки — Textual Inversion и LoRA (Low-Rank Adaptation). Это небольшие файлы, натренированные на конкретных персонажах, стилях или позах. Подключая их в промт (обычно через специальный синтаксис вида <lora:name:1>), можно добиться невероятной стабильности результата. Например, если вы хотите генерировать персонажа из любимого аниме, проще скачать соответствующую LoRA, чем пытаться описать его внешность словами. Это экономит время и нервы. Впрочем, использование этих инструментов требует установки дополнительного софта, если вы работаете локально, но результат того стоит.

Ошибки новичков

Самая распространенная ошибка — попытка написать роман. Нейросеть — не учитель литературы, она не оценит красивые метафоры вроде «её глаза были глубоки, как океан в штормовую ночь». Скорее всего, она просто нарисует океан вместо глаз. Будьте конкретнее: «dark blue eyes».Вторая ошибка — противоречивые теги. Не стоит писать «sunny day» и «night» в одном промте (если только это не сюрреализм). Машина запутается, и результат будет непредсказуемым.Третий нюанс — перегрузка промта мусором. Копирование огромных «полотен» текста у других авторов без понимания смысла каждого тега часто приводит к ухудшению качества. Лучше начать с малого и добавлять детали постепенно, отслеживая, как они влияют на картинку.

Стоит ли использовать генераторы промтов?

В сети полно сервисов, которые обещают составить идеальный промт за вас. Полезны ли они? На первых порах — да. Они помогают выучить структуру и запомнить популярные теги. Однако слепо полагаться на них не стоит. Автоматический генератор не знает вашей задумки, он просто накидывает красивые слова в кучу. Настоящее мастерство приходит только через ручной перебор, эксперименты и анализ собственных ошибок. Ведь именно в процессе поиска той самой комбинации слов и рождается понимание того, как «мыслит» нейросеть.

Экспериментируйте, смешивайте несовместимое, играйте с весами и не бойтесь получать плохие результаты. Каждый неудачный кадр — это шаг к пониманию логики диффузных моделей. И однажды, введя очередную комбинацию символов, вы увидите на экране то, что заставит вас замереть от восторга. Творческий потенциал здесь ограничен лишь вашей фантазией и словарным запасом. Создавайте смело!