Промт для красивой картинки (с примерами готовых промтов)

Сколько раз вы, замирая от предвкушения, нажимали кнопку «Generate», а получали нечто несуразное с лишними пальцами, поплывшим лицом или вовсе пейзаж вместо обещанного портрета? В сети представлено множество галерей с шедеврами нейросетевого искусства, глядя на которые невольно задаёшься вопросом: «Как они это делают?». Кажется, что авторы этих работ обладают тайным знанием или используют какое-то особое программное обеспечение, недоступное простому смертному. На самом деле, всё упирается в умение правильно формулировать мысли, переводя их на понятный машине язык. Ведь искусственный интеллект — это не телепат, а скорее очень исполнительный, но невероятно буквальный художник, которому нужно самое подробное техническое задание. Устав от суеты и бесконечных попыток подобрать «то самое» слово, новички часто бросают это занятие, так и не раскрыв весь потенциал генеративных моделей. А начать стоит с понимания того, как именно алгоритм «видит» ваш текст.

Структура идеального запроса

Сложно ли составить грамотный промт? На первый взгляд — да, но если разобрать его на составляющие, магия превращается в технологию. Фундамент любого изображения — это объект. Кто или что должно быть в кадре? Однако одного существительного алгоритму мало. Ему нужны подробности. Сразу за объектом следует описание действия и контекста. Что делает персонаж? Где он находится? К слову, именно окружение задает настроение всему кадру. Если вы напишете просто «кот», нейросеть выдаст вам усредненного кота в вакууме. А вот «рыжий кот, сидящий на подоконнике в дождливый день» — это уже история.

Далее следует блок стилизации. Это, пожалуй, самая творческая часть работы. Здесь мы указываем художественное направление, материалы или даже конкретных авторов. Можно запросить имитацию масляной живописи, акварельный скетч или гиперреалистичное фото. И всё же, не стоит забывать о технических модификаторах. Это слова-крючки, которые подтягивают качество изображения: «4k», «high details», «unreal engine 5 render». Они работают как своеобразный знак качества для нейросети, заставляя её обращаться к более детализированным образцам из своей базы данных. Ну и, наконец, параметры кадра: освещение, ракурс и соотношение сторон. Без них картинка может получиться плоской и скучной.

Стилизация и художественные приёмы

Главное — угадать с палитрой и настроением. Выбор визуального стиля способен кардинально изменить восприятие одного и того же сюжета. Довольно часто пользователи хотят получить «просто красивую картинку», но красота — понятие растяжимое. К примеру, огромной популярностью пользуется стиль «Cyberpunk». Неоновые вывески, дождь, хром и мрачные городские пейзажи создают невероятно атмосферный антураж. Чтобы добиться такого эффекта, в промт стоит добавить слова: «cyberpunk», «neon lights», «futuristic», «high tech». Это сразу перенесет зрителя в мир будущего.

Совершенно иначе работает запрос на классическую живопись. Если ваша цель — создать портрет, достойный Лувра, используйте отсылки к старым мастерам или техникам. Фразы «oil painting», «renaissance style», «brush strokes», «chiaroscuro» творят чудеса. Особенно интересно работает упоминание конкретных художников. Разумеется, нейросеть не скопирует картину один в один, но она позаимствует манеру письма, цветовую гамму и работу со светом. Попробуйте добавить в конец запроса «by Vincent van Gogh» или «by Alphonse Mucha», и результат вас удивит. Стиль ар-нуво, характерный для Мухи, добавит изображению изысканности, плавных линий и цветочных орнаментов.

А что насчет фотореализма? Здесь в игру вступают термины из мира фотографии. Чтобы заставить ИИ генерировать картинку, неотличимую от снимка, нужно использовать такие маркеры, как «photorealistic», «shot on 35mm», «bokeh» (размытие фона), «sharp focus». Удивительно, но даже указание модели камеры, например «Canon EOS R5» или «Sony A7R IV», влияет на характер изображения, делая его более «цифровым» и четким.

Магия света и атмосферы

Свет. Без него нет объёма. Именно освещение превращает плоскую картинку в глубокую сцену. Профессиональные фотографы знают, что «золотой час» (время перед закатом) делает любые кадры шедевральными. Нейросеть тоже это знает. Добавьте в промт «golden hour», и вы получите мягкий, теплый свет и длинные тени. Хотите драмы? Используйте «cinematic lighting» или «dramatic lighting». Это создаст контрастную картинку с глубокими тенями, словно кадр из голливудского блокбастера.

Отдельно стоит упомянуть объемный свет и туман. Слова «volumetric lighting», «god rays» (лучи бога), «fog» или «mist» добавляют воздуху плотности. Лучи света, пробивающиеся сквозь листву или дымку, выглядят впечатляюще и придают работе эпичности. Для студийных портретов отлично подходят схемы освещения, принятые в индустрии: «studio lighting», «rim light» (контровой свет, очерчивающий силуэт), «softbox». Эти уточнения помогают избежать плоских лиц и неестественных теней под носом. Ну а для любителей мистики подойдет «bioluminescent» — биолюминесцентное свечение, идеальное для фэнтезийных лесов или инопланетных пейзажей.

Портретные запросы: от классики до киберпанка

Задача не из лёгких. Лицо человека — самый сложный объект для генерации, ведь наш глаз моментально считывает малейшую фальшь. Но готовые формулы существуют. Допустим, нам нужен реалистичный портрет девушки. Базовый шаблон может выглядеть так:

Portrait of a beautiful young woman with freckles, ginger hair, blue eyes, looking at camera, soft smile, natural lighting, highly detailed skin texture, 8k, photorealistic

Обратите внимание на деталь про текстуру кожи («highly detailed skin texture»). Без этого уточнения нейросети часто делают лица слишком гладкими, «пластиковыми».

А если хочется чего-то сказочного? Попробуем создать образ эльфийской принцессы. Промт будет звучать иначе:

Ethereal elven princess, intricate silver crown, long white hair, magic glowing forest background, fantasy art, digital painting, elegant, dreamy atmosphere, by Greg Rutkowski, artstation trend

Здесь мы уходим от фотореализма в сторону «digital painting» и добавляем имя Грега Рутковски — художника, чей стиль нейросети выучили на отлично. Это гарантирует эпичность и живописность.

Для фанатов научной фантастики подойдет такой вариант:

Cyborg woman profile, half face robotic parts, intricate wires and circuits, neon blue eyes, dark rainy cyberpunk city background, cinematic lighting, hyperrealistic, octane render

Словосочетание «octane render» здесь не случайно. Это название движка для 3D-рендеринга, и его упоминание заставляет ИИ делать картинку похожей на качественную компьютерную графику с правильными отражениями и материалами.

Природные и городские пейзажи

С пейзажами дело обстоит чуть проще, но и здесь есть свои нюансы. Чтобы получить захватывающий дух вид, нужно играть с масштабом. Слова «epic scale», «panoramic view», «wide angle» помогают «раздвинуть» границы кадра. Представьте себе величественные горы. Промт для них может быть таким:

Majestic snowy mountain peaks, epic landscape, morning mist, hyperrealistic, 8k, landscape photography, national geographic style

Упоминание National Geographic работает как фильтр качества, настраивая модель на создание документального, но художественно выверенного снимка.

Архитектура требует точности в описании стилей. Хотите готический замок? Пишите:

Gloomy gothic castle on a cliff, storm clouds, lightning, dark fantasy, highly detailed architecture, gargoyles, stone texture, ominous atmosphere

А вот для уютного домика в лесу подойдет другой набор слов:

Cozy wooden cottage in autumn forest, smoke from chimney, warm window light, fallen leaves, sunset, thomas kinkade style

Томас Кинкейд известен своими пасторальными, светящимися пейзажами, и нейросеть прекрасно имитирует эту «сказочность».

К слову, интересные результаты получаются при смешении несовместимого. Попробуйте совместить природу и технологии:

Futuristic city overgrown with giant jungle plants, solar punk, ruins of skyscrapers, waterfall from building, bright sunny day, vibrant colors

Стиль «Solar punk» (соларпанк) — это позитивный взгляд на будущее, где технологии гармонируют с природой, что дает очень свежую и яркую картинку.

Что такое негативный промт?

Бывает так: вы всё написали правильно, а результат всё равно удручающий. То рука лишняя вылезет, то картинка мутная, то цвета ядовитые. Здесь на помощь приходит негативный промт (Negative Prompt). Это поле, куда мы вписываем всё то, чего НЕ хотим видеть. Это своего рода фильтр грубой очистки. Для портретов стандартный набор исключений выглядит довольно внушительно:

deformed, bad anatomy, disfigured, poorly drawn face, mutation, extra limb, ugly, disgusting, missing limb, floating limbs, disconnected limbs, malformed hands, blurry, out of focus

Не скупитесь на перечисление дефектов. ИИ склонен к галлюцинациям, и лучше заранее запретить ему рисовать «bad hands» или «text» (текст и водяные знаки — бич многих генераций). Если вы хотите чистый рисунок без рамок, добавьте в негатив слова «frame», «border». А чтобы избежать эффекта карикатуры, впишите «cartoon», «3d», если стремитесь к фотореализму. Использование негативного промта — это не прихоть, а суровая необходимость для получения добротного результата, особенно в таких моделях, как Stable Diffusion.

Абстракция и сюрреализм

Иногда хочется простого человеческого… безумия. Абстрактные обои на рабочий стол или концептуальный арт — вот где фантазия может разгуляться. Здесь логика отходит на второй план, уступая место ассоциациям. Промт может состоять из набора чувств и цветов:

Abstract explosion of colors, fluid liquid shapes, swirling ink in water, blue and gold palette, macro photography, depth of field, 4k wallpaper

Результат, скорее всего, будет напоминать завораживающие заставки смартфонов.

Сюрреализм же требует парадоксов. Вспомните Сальвадора Дали. Запрос может звучать так:

Melting clocks on a dead tree in a desert, surrealism, dreamlike, mysterious, vivid colors, oil painting texture

Или что-то более современное:

Astronaut riding a horse on Mars, red dust, retro sci-fi poster style, vintage colors

Такие запросы заставляют нейросеть комбинировать понятия из разных кластеров, рождая порой гениальные, а порой пугающие образы. Но в этом и есть вся соль генеративного искусства.

Влияние соотношения сторон

Нюанс, о котором часто забывают новички. По умолчанию многие нейросети генерируют квадрат (1:1). Но для эпичного пейзажа квадрат — это, прямо скажем, «тесновато». В Midjourney за это отвечает параметр –ar. Для кинематографичной картинки лучше использовать формат 16:9 (–ar 16:9). Это сразу меняет композицию кадра, давая больше «воздуха» по бокам. А вот для портрета в полный рост идеально подойдет вертикальный формат 9:16 (–ar 9:16) или 2:3 (–ar 2:3).

Формат кадра влияет не только на обрезку, но и на содержание. В широком формате нейросеть с большей вероятностью дорисует детали фона или дополнительных персонажей, тогда как в вертикальном сосредоточится на центральном объекте. Экспериментируйте с этим параметром. Иногда один и тот же промт в разных пропорциях выдает совершенно разные по смыслу изображения. Это же правило касается и мобильных обоев — вертикаль здесь строго обязательна.

Распространённые ошибки

Казалось бы, чем больше слов, тем лучше? Вовсе нет. Перегруженный промт — это «каша» для алгоритма. Когда вы пытаетесь впихнуть в один запрос и «космос», и «подводный мир», и «киберпанк», и «средневековье», нейросеть теряется в приоритетах. Веса токенов размываются, и на выходе получается невнятное месиво. Лучше сосредоточиться на одной главной идее и 3-4 поддерживающих стилях.

Ещё одна ошибка — конфликт стилей. Требовать «чёрно-белое фото» и одновременно писать «vivid colors» (яркие цвета) — значит загнать ИИ в тупик. Он, конечно, попытается что-то выдать, но результат будет странным. Также стоит избегать слишком абстрактных понятий вроде «мысль о вечном» или «смысл жизни». Машина оперирует визуальными образами, поэтому любую абстракцию нужно переводить на язык предметов и света. Вместо «одиночество» напишите «маленькая фигура человека в огромном пустом зале».

Финальные штрихи

Получить идеальную картинку с первого раза — большая удача. Обычно это процесс перебора. Сгенерировали, посмотрели, подкрутили слова, сгенерировали снова. Меняйте порядок слов: то, что стоит в начале промта, имеет для нейросети больший вес. Если цвет глаз важнее фона, поставьте его ближе к началу. Используйте синонимы. Иногда замена «big» на «gigantic» или «massive» кардинально меняет масштаб сцены.

Не бойтесь заимствовать. Видите классную работу? Попробуйте разобрать её промт (многие сервисы позволяют смотреть метаданные). Это лучший способ обучения. Со временем у вас сформируется собственная библиотека «работающих» фраз и связок, которые вы будете использовать на автомате. Генерация изображений — это не просто нажатие кнопки, это диалог с цифровым разумом, где вы учитесь быть понятным, а он учится быть креативным.

Пусть ваши промты всегда попадают точно в цель, а результаты превосходят самые смелые ожидания. Создавайте свои миры, ведь теперь у вас есть для этого все необходимые инструменты. Удачи в творчестве!