Пример промта для фотографии (с примерами готовых промтов)

В сети представлено множество руководств по генерации изображений, и зачастую новичку кажется, что создание шедевра — это дело одной секунды и пары случайных слов. Однако суровая реальность быстро расставляет всё по местам: вместо глянцевого портрета получается сюрреалистичное нечто с лишними пальцами, а вместо уютного пейзажа — хаотичное нагромождение геометрических фигур. Многие бросают попытки уже на этом этапе, разочаровавшись в технологии. Но вся соль в том, что нейросеть — это не телепат, а исполнительный, но невероятно буквальный художник, которому нужно предельно точно объяснить задачу на его же языке. Поэтому перед нажатием кнопки «Generate» стоит не просто набросать идеи, а сконструировать запрос по определённым правилам, напоминающим заклинание.

С чего начинается работа?

С определения главного объекта. Кажется, что это элементарно, но именно здесь обыватель совершает первую ошибку. Написать просто «девушка» или «лес» — значит отдать инициативу на откуп рандому, который, кстати, довольно часто обладает специфическим чувством юмора. ИИ нуждается в конкретике. Поэтому первое правило — детализация субъекта. Вместо абстрактного понятия лучше использовать развёрнутое описание: «молодая женщина с веснушками и рыжими волосами» или «древний хвойный лес в тумане». Глагол здесь тоже играет не последнюю роль. Ведь статичная поза редко вызывает интерес. Куда лучше работает динамика: «бежит под дождем», «смеётся, глядя в камеру» или «склоняется над картой». А дополняет образ, разумеется, одежда и аксессуары, которые задают тон всему изображению.

Структура промта

Существует ли идеальная формула? Универсального рецепта нет, но есть каркас, на который нанизываются смыслы. Сперва идёт описание объекта (Subject), о котором мы уже говорили. Далее следует среда (Environment) — место действия, будь то киберпанк-мегаполис или уютная кофейня. Затем критически важно указать освещение (Lighting) и стиль (Style). Без указания стиля нейросеть выдаст усреднённый цифровой рисунок, лишённый шарма. А завершает эту конструкцию блок технических параметров (Parameters), включающий соотношение сторон, уровень детализации и версию движка. Именно такая последовательность позволяет машине «понять» приоритеты: сначала «кто», потом «где», а уже затем «как». К слову, порядок слов имеет значение: то, что стоит в начале, алгоритм считает наиболее важным.

Стилистика и камера

Как добиться фотореализма? Ответ кроется в использовании профессиональной терминологии фотографов. Нейросети обучены на миллионах снимков с метаданными, поэтому они прекрасно понимают, что такое фокусное расстояние или выдержка. Если вы хотите получить широкий угол и эпичный вид, стоит добавить в промт «wide angle», «16mm lens» или «GoPro footage». Для портретов же лучше подойдёт «85mm lens», «depth of field» или «bokeh», что обеспечит красивое размытие фона. Не стоит забывать и про тип плёнки. Указание «Kodak Portra 400» или «Fujifilm Velvia» придаст картинке характерное зерно и цветопередачу (довольно тёплую или, наоборот, насыщенную). Это же правило касается и указания конкретных моделей камер: «shot on Sony A7R IV» добавит резкости, а «Polaroid photo» — винтажной мягкости.

Освещение

Свет творит чудеса. Плоское освещение способно убить даже самую интересную композицию, тогда как грамотно выставленный свет превращает скучную сцену в драматичный кадр. Один из самых популярных вариантов — «cinematic lighting» (киношное освещение), которое добавляет объём и контраст. Если же цель — мягкость и романтика, то выручит «golden hour» (золотой час) или «soft natural light». Любителям драмы и нуара стоит обратить внимание на «rim light» (контровой свет) или «volumetric lighting» (объёмные лучи), пробивающиеся сквозь дымку. А для студийных портретов идеально подходит «studio lighting», «softbox» или «Rembrandt lighting». К тому же, игра с цветом света (например, «neon blue and pink lighting») позволяет создавать стильные футуристичные образы.

Примеры портретных запросов

Разберём конкретные сценарии. Допустим, нам нужен гиперреалистичный портрет пожилого человека с характером. Львиная доля успеха здесь будет зависеть от текстур кожи и освещения. Промт может выглядеть так:

«Ultra-realistic portrait of an elderly sea captain with a thick white beard, weathering skin texture, deep wrinkles, piercing blue eyes, wearing a yellow raincoat, stormy ocean background, dramatic dark lighting, rain droplets on face, shot on 85mm lens, f/1.8, extremely detailed, 8k resolution»

Здесь мы видим чёткую структуру: субъект, детали внешности, одежда, фон, свет и настройки камеры.

А теперь представим другую задачу — студийный женский портрет в стиле фэшн. Здесь акцент смещается на чистоту кадра и стиль. Запрос будет звучать иначе:

«Fashion photography of a beautiful young woman with sleek black hair, wearing haute couture red dress, studio gray background, soft professional lighting, sharp focus, elegant pose, shot on Hasselblad, high fashion magazine style»

В этом случае мы убираем лишние детали фона, чтобы сосредоточиться на модели и одежде.

Ну и, наконец, вариант с этническим колоритом. Это всегда выглядит выигрышно и самобытно. Пример запроса:

«Portrait of a tribal warrior with traditional face paint, colorful feathers in hair, jungle background with sun rays breaking through leaves, cinematic lighting, shallow depth of field, intense look, raw style, National Geographic photography»

Упоминание известного журнала здесь работает как стилевой якорь, подсказывая нейросети желаемую эстетику.

Городской пейзаж и архитектура

Снимать здания скучно? Вовсе нет. Если добавить атмосферы, то даже панельная застройка заиграет новыми красками. Представим себе дождливый киберпанк-город. Промт для такого изображения будет насыщен деталями:

«Futuristic cyberpunk city street at night, neon signs reflecting in puddles, towering skyscrapers with holograms, wet asphalt, crowd of people with umbrellas, mist, cyan and magenta lighting palette, cinematic composition, photorealistic, Unreal Engine 5 render style»

Заметьте, здесь добавлено упоминание игрового движка, что часто повышает детализацию 3D-объектов.

Другой полюс — уютная европейская улочка. Здесь мы ищем тепло и спокойствие. Запрос сформируем следующим образом:

«Cozy narrow street in Italy during sunset, cobblestone pavement, old buildings with flowers on balconies, warm orange sunlight, long shadows, no people, peaceful atmosphere, architectural photography, highly detailed, 4k»

Фраза «no people» (без людей) помогает избежать появления искажённых фигур на заднем плане, что довольно часто портит пейзажные генерации.

А если хочется чего-то грандиозного и мрачного? Готический собор в тумане станет отличным решением. Промт:

«Majestic gothic cathedral rising from thick fog, dark moody atmosphere, overcast sky, intricate stone carvings, gargoyles, wide angle shot, low angle view, epic scale, dark fantasy style, granular texture»

Уточнение «low angle view» (вид снизу) визуально увеличивает объект, делая его подавляющим и величественным.

Предметная съёмка и макро

Для рекламы или презентации товара нужен особый подход. Здесь нельзя допускать «визуального шума». Допустим, нам нужно сгенерировать изображение флакона духов. Промт будет строгим:

«Elegant glass perfume bottle with golden cap, standing on a black reflective surface, splashing water around, high speed photography, freeze motion, crisp details, studio lighting, advertising product shot, luxury vibe»

Ключевые слова «high speed photography» и «freeze motion» помогают «заморозить» воду, делая кадр динамичным, но чётким.

Макросъёмка — это отдельный вид искусства. Попробуем создать изображение глаза насекомого или капли росы. Пример:

«Macro photography of a dew drop on a green leaf, refraction of a flower inside the drop, extreme close-up, bokeh background, morning sunlight, vibrant colors, sharp focus on the drop, biological documentary style»

Тут важно указать «extreme close-up», иначе нейросеть может показать лист целиком, потеряв магию макромира.

Негативный промт

О чём молчат новички? О том, что важно не только то, что вы хотите видеть, но и то, чего видеть не желаете. Во многих интерфейсах (например, Stable Diffusion) есть поле «Negative Prompt». Это своеобразный спасательный круг. Туда стоит вписать всё, что портит картинку:

«ugly, deformed, noisy, blurry, low quality, watermark, text, bad anatomy, extra limbs, missing fingers, cropped, jpeg artifacts»

Это фильтр, который отсекает мусор и повышает шансы на получение достойного результата. Даже если вы используете Midjourney, где нет отдельного поля, можно добавить параметры «–no text» или «–no blur» в конце основного запроса.

Сюрреализм и абстракция

Иногда хочется уйти от реальности. Нейросети великолепно справляются с абстрактными понятиями, если дать им правильные метафоры. Попробуем визуализировать «время». Промт:

«Surreal concept art of time melting, Salvador Dali style, pocket watches dripping from dead trees, desert landscape, dreamlike atmosphere, vivid colors, oil painting texture, intricate details, philosophical mood»

Указание имени художника (Дали) мгновенно задаёт узнаваемый стиль.

А вот пример для создания фэнтезийного существа:

«Majestic phoenix bird made of fire and ashes, flying over a volcano, glowing feathers, smoke trails, epic fantasy art, dynamic pose, fierce eyes, digital painting, ArtStation trends, highly detailed»

Ссылка на «ArtStation trends» — это маленький лайфхак. Нейросеть подтянет стилистику топовых современных цифровых художников, сделав картинку более «трендовой» и проработанной.

Ошибки и нюансы

Стоит ли писать поэмы? Многие считают, что чем длиннее промт, тем лучше. Это заблуждение. Нейросеть имеет ограничение на количество токенов (смысловых единиц), которые она может обработать. Слишком длинный текст «размывает» внимание алгоритма. Лучше использовать короткие, но ёмкие фразы, разделённые запятыми. Не стоит писать «я хочу увидеть красивую картинку, где изображен…». Слова-паразиты вроде «я хочу» или «изобрази» не несут визуальной информации. Пишите сразу суть: «кот, космос, скафандр».

Ещё один подводный камень — противоречивые запросы. Если написать «солнечный день» и «ночное небо» одновременно, результат будет непредсказуемым и, скорее всего, пугающим. Логика должна присутствовать даже в фантастических сюжетах. Тем более, что алгоритм пытается смешать всё в одну кучу. Также не стоит перебарщивать с весами (коэффициентами значимости слов), если вы используете продвинутые интерфейсы. Слишком сильный акцент на одном слове может исказить всю композицию.

Различия нейросетей

Разные модели — разные языки. Midjourney, например, тяготеет к художественности и отлично понимает образные описания. Ей можно просто сказать «эпичная битва» — и она сделает красиво. Stable Diffusion же более технична и послушна, но требует более скрупулёзного подбора тегов и настроек. DALL-E 3, в свою очередь, прекрасно понимает естественный язык и сложные диалоговые конструкции, ей можно описывать сцену как в книге. Поэтому промт, идеально сработавший в одной сети, может выдать посредственный результат в другой. Это нормально, и к этому нужно быть готовым. Главное — понимать сильные стороны инструмента, который вы держите в руках.

Эксперименты и итерации

Получится ли шедевр с первого раза? Безусловно, иногда удача улыбается, и «слепой» запрос выдаёт нечто гениальное. Но чаще всего генерация — это процесс отбора. Вы создаёте вариации, меняете одно слово, добавляете уточнение по свету, убираете лишнюю деталь. Это похоже на огранку алмаза. Не бойтесь менять синонимы: вместо «big» напишите «gigantic» или «colossal» — и масштаб картинки изменится кардинально. Вместо «red» попробуйте «crimson» или «scarlet» — и цвет обретёт глубину.

Сложно ли научиться «промпт-инжинирингу»? Да, но это увлекательный путь. Это навык перевода визуальных образов из головы в текстовый код. Своеобразная поэзия цифровой эпохи. И чем богаче ваш словарный запас, чем больше вы знаете о живописи, кино и фотографии, тем выразительнее будут ваши работы. Ведь нейросеть — это всего лишь кисть, а художником по-прежнему остаётся человек.

Удачных вам экспериментов, и пусть каждая генерация попадает точно в цель, радуя глаз и вдохновляя на новые творческие поиски.