Готовые промты для генерации изображений (с примерами готовых промтов)

Создание визуального контента с помощью нейросетей давно перестало быть просто забавой для гиков и превратилось в полноценный инструмент для работы, творчества и бизнеса. Однако многие новички, впервые открыв Discord с Midjourney или веб-интерфейс Stable Diffusion, сталкиваются с тем, что ожидание и реальность, мягко говоря, не совпадают. Вместо шедевра на экране появляется нечто с тремя ногами или размытым лицом, а всё потому, что машина не понимает абстрактных желаний — ей нужны чёткие инструкции. Ирония в том, что умение формулировать эти самые инструкции, или промты, стало своеобразным искусством, сродни написанию кода. Но чтобы не тратить часы на эксперименты и не сливать лимиты генераций впустую, стоит разобраться в механике запросов и воспользоваться уже проверенными формулами, которые гарантированно дают достойный результат.

Что такое качественный промт?

Сложно ли составить запрос? Вроде бы нет, пиши, что видишь, и жди. На самом деле, нейросеть воспринимает текст не как предложение, а как набор токенов, каждый из которых имеет свой вес. Секрет успеха кроется в правильной структуре. Обычно она выглядит так: объект, действие, окружение, стилистика и технические параметры. И если с объектом всё довольно просто (кот, девушка, автомобиль), то именно технические “хвосты” превращают обычную картинку в произведение цифрового искусства. Стоит отметить, что порядок слов тоже играет роль: то, что стоит в начале, нейросеть считает более важным. Поэтому описание главного героя мы всегда выносим вперёд.

Фотореализм и портретная съёмка

Грезят ли пользователи о том, чтобы сгенерированное лицо нельзя было отличить от фотографии? Безусловно. Ведь именно портреты — самый востребованный жанр. Чтобы добиться эффекта присутствия и высокой детализации кожи, недостаточно написать “красивая девушка”. Здесь в игру вступают термины из мира профессиональной фотографии. К слову, указание конкретной модели камеры и объектива творит чудеса.

Попробуйте использовать такую конструкцию для создания женского портрета с естественным освещением. Сначала задаем основу: “Close-up portrait of a young woman with freckles and messy red hair looking at the camera”. Далее следует добавить атмосферу и свет: “soft morning light, cinematic lighting, window reflection in eyes”. Ну и, наконец, добиваем запрос техническими характеристиками, которые заставят ИИ прорисовать каждую пору:

“shot on Sony A7R IV, 85mm lens, f/1.8, ultra detailed, 8k resolution, photorealistic, texture skin”

Результат вас поразит. Это же правило касается и мужских портретов, где для брутальности можно добавить “hard shadows” или “dramatic lighting”.

Архитектура и интерьеры: Скандинавия и Лофт

А вот дизайнерам и архитекторам важна не столько эмоциональность, сколько точность геометрии и правильная передача материалов. Задача не из лёгких. Ведь нейросети часто “валят” перспективу. Чтобы получить добротный рендер гостиной, нужно четко обозначить стиль и движок рендеринга. Львиная доля успешных генераций в этой нише содержит упоминания программного обеспечения для 3D-моделирования.

Рассмотрим вариант уютной гостиной. Начинаем с описания: “Modern living room interior in Scandinavian style, beige sofa, wooden floor, large panoramic window with view on winter forest”. Затем насыщаем картинку деталями освещения и качества: “warm indoor lighting, cozy atmosphere, interior design photography”. И, конечно же, «полируем» результат техническими тегами:

“Unreal Engine 5 render, octane render, ray tracing, 8k, hyperrealistic, high fidelity”

Такой запрос выдаст картинку, которую обыватель легко спутает с фотографией из дорогого журнала. Если же нужен мрачный лофт, просто замените “warm lighting” на “cold neon light” и добавьте “brick walls, industrial pipes”, оставив техническую часть без изменений.

Фэнтези и концепт-арт

Где фантазии есть разгуляться, так это в создании несуществующих миров. Тут можно забыть о законах физики, но не стоит забывать о композиции. Чтобы получить эпичную сцену битвы или пейзаж другой планеты, нужно использовать слова, вызывающие у нейросети ассоциации с работами известных цифровых художников. Это довольно старый трюк, но он работает безотказно.

Для примера возьмем запрос на создание величественного замка. Основа может звучать так: “Majestic floating castle in the sky, clouds, waterfalls cascading down”. Чтобы добавить магии и объёма, вписываем: “fantasy art, epic scale, magical atmosphere, bioluminescent plants”. А завершаем промт ссылками на стилистику популярных платформ:

“trending on ArtStation, highly detailed, sharp focus, digital painting, concept art by Greg Rutkowski and Makoto Shinkai”

Упоминание конкретных художников (в данном случае Грега Рутковски) — это своего рода чит-код для получения живописного, насыщенного деталями стиля. Полученное изображение будет выглядеть внушительно и атмосферно.

Стилизация: От аниме до масла

Иногда хочется уйти от реализма и создать что-то более художественное. Нейросети отлично имитируют классические техники живописи. Главное — правильно назвать материал. Хотите масло? Пожалуйста. Акварель? Легко. Но простого слова “oil painting” часто бывает недостаточно для получения выразительного мазка.

Для создания портрета в стиле масляной живописи попробуйте такой вариант: “Portrait of an old fisherman with a beard, smoking a pipe”. Добавляем специфику техники: “oil painting on canvas, thick brushstrokes, textured, impasto style”. Чтобы усилить эффект классического искусства, можно добавить:

“in the style of Rembrandt, chiaroscuro lighting, dark background”

Результат будет выглядеть как музейный экспонат. А если душа тяготеет к чему-то более лёгкому и воздушному, то запрос меняется кардинально. Для акварельного пейзажа пишем: “Landscape of a blooming cherry orchard, watercolor painting, wet on wet technique, soft pastel colors, splatters and drips, white paper texture”. Такие нюансы, как “потёки” (drips) и “текстура бумаги”, добавляют работе ту самую изюминку и рукотворность.

Киберпанк и футуризм

Особый интерес вызывает стилистика будущего. Неоновые огни, дождь, хром и импланты — эстетика киберпанка требует особого подхода к освещению и цветовой палитре. Здесь важно сделать акцент на контрасте и отражениях. Ошибкой будет просто написать “future city”. Получится скучно.

Вместо этого используйте насыщенный деталями промт: “Cyberpunk street samurai girl, standing in a rainy street at night, neon signs reflections in puddles”. Усиливаем визуальный шум и технологичность: “futuristic armor, glowing katana, chromatic aberration, volumetric fog”. И финализируем техническими параметрами для максимальной сочности:

“blade runner style, cinematic composition, vivid colors, ray tracing, global illumination, 8k”

Картинка получится живой, с глубокими тенями и яркими акцентами, которые буквально бросаются в глаза.

Логотипы и векторная графика

Может ли нейросеть заменить дизайнера логотипов? Полностью — вряд ли, но набросать идей — вполне. Проблема в том, что генераторы любят добавлять лишние детали, тени и градиенты, которые в векторе не нужны. Поэтому здесь промт должен быть максимально сухим и ограничивающим.

Для создания минималистичного логотипа используйте такую структуру: “Minimalist logo of a fox head, flat design, vector graphics, white background”. Важно отсечь всё лишнее, поэтому добавляем: “simple lines, 2d, no shading, no gradients, clean edges”. Такой запрос выдаст чистый, графичный исходник, который потом довольно просто перевести в кривые в том же Illustrator. Если же нужно что-то в стиле эмблемы киберспортивной команды, добавляем “mascot logo style, bold outline, vibrant colors, aggressive look”.

Еда и фуд-фотография

Аппетитно снять еду сложно даже с камерой, а сгенерировать — тем более. Нейросеть часто путает текстуры, превращая суп в пластиковую жижу. Чтобы бургер выглядел сочным, а кофе — ароматным, нужно использовать «вкусные» слова и правильный свет. Освещение здесь играет даже большую роль, чем сам продукт.

Попробуйте такой промт для рекламного фото бургера: “Delicious cheeseburger with melting cheese, bacon, fresh lettuce and tomato, sesame bun”. Теперь самое важное — подача: “food photography, macro shot, steam rising, water droplets on vegetables, bokeh background”. И техническая часть для глянцевого блеска:

“studio lighting, professional color grading, ultra sharp, 8k, advertising shot”

Такое описание заставит слюнки течь даже у сытого человека. Кстати, упоминание “steam rising” (поднимающийся пар) добавляет динамики и свежести кадру.

Подводные камни и отрицательные промты

Можно ли испортить генерацию, даже имея хороший промт? Запросто. Нейросети свойственно галлюцинировать: добавлять лишние пальцы, искривлять зрачки или писать тарабарщину вместо текста. Спасательным кругом в этой ситуации выступают Negative Prompts — то, чего на картинке быть не должно.

В интерфейсах типа Stable Diffusion для этого есть отдельное поле, а в Midjourney используется параметр “–no”. Стандартный набор для “чистки” изображения выглядит примерно так:

“ugly, deformed, disfigured, extra limbs, extra fingers, missing limbs, blurry, low quality, watermarks, text, signature, bad anatomy, mutation”

Не стоит пренебрегать этим списком. Включение этих слов в отрицательный промт значительно повышает шансы на получение анатомически верного и чистого результата. Это своего рода фильтр, который отсекает мусорные данные.

Тонкости параметров и соотношения сторон

Текст — это ещё не всё. Формат изображения кардинально влияет на композицию. По умолчанию нейросети генерируют квадрат (1:1), но для пейзажа или кинокадра это не годится. В Midjourney за это отвечает параметр “–ar”. Для кинематографичной картинки стоит добавлять в конце промта “–ar 16:9”, а для портрета в полный рост (для сторис, например) — “–ar 9:16”.

Есть ещё один нюанс — стилизация. Параметр “–stylize” (или “–s”) определяет, насколько вольно ИИ может трактовать ваш запрос. Низкие значения (например, –s 50) заставят сеть строго следовать тексту, а высокие (до –s 1000) дадут ей творческую свободу. Разумеется, экспериментировать с этим нужно аккуратно, иначе результат может уйти слишком далеко от первоначальной задумки.

Советы по доработке запросов

Не стоит бояться заимствовать. Это нормальная практика. Увидели классную работу в галерее нейросети? Скопируйте промт, разберите его на части и замените объект на свой. Именно так происходит обучение. Вся суть в том, что готовых промтов на все случаи жизни не существует, но существуют шаблоны, которые мы разобрали выше.

Также полезно использовать веса слов. Если нейросеть упорно игнорирует какую-то деталь, например, красную шляпу, попробуйте поставить её в самое начало предложения или использовать синтаксис усиления (в разных нейросетях он разный, где-то скобки, где-то двоеточия с цифрами). Но не перегружайте запрос. Слишком длинный промт (более 50-60 слов) часто сбивает машину с толку, и она начинает “забывать” середину текста. Лаконичность в сочетании с точными терминами — вот ключ к успеху.

Финальный штрих

Генерация изображений — процесс захватывающий, но требующий терпения. Первый результат редко бывает идеальным. Обычно приходится делать несколько итераций (рероллов), слегка меняя формулировки. Однако, имея под рукой базу из качественных промтов для разных стилей — от фотореализма до киберпанка, — вы сэкономите кучу времени и нервов. Главное — помнить, что вы режиссёр, а нейросеть — лишь исполнитель, пусть и очень талантливый. Удачи в творческих поисках, и пусть каждая ваша генерация становится маленьким шедевром!