Подробный промт для генерации фото (с примерами готовых промтов)

Казалось бы, что может быть проще: ввел пару слов в строку, нажал кнопку и получил шедевр цифрового искусства? Разумеется, рекламные буклеты нейросетей обещают именно это, но реальность довольно часто разбивает розовые очки о суровые пиксельные скалы. Вместо ожидаемой фотореалистичной модели на экране появляется существо с семью пальцами, а вместо киберпанк-города — нагромождение неоновых коробок. Проблема здесь кроется не в отсутствии таланта у пользователя, а в банальном недопонимании механики общения с машиной. Искусственный интеллект — это невероятно эрудированный, но абсолютно лишённый интуиции исполнитель, которому нужно объяснять задачу с педантичной точностью. А начать стоит с фундаментальной архитектуры самого запроса.

Анатомия запроса

С чего начинается создание качественного промта? С определения объекта и субъекта. Львиная доля успеха зависит от того, насколько точно вы назовете то, что хотите увидеть. Однако простого существительного машине мало. Ей нужен контекст, причем описанный довольно скрупулёзно. Одно дело написать «кот», и совсем другое — «пушистый мейн-кун, сидящий на вельветовом кресле». Во втором случае нейросеть получает четкие якоря для генерации. Следом за объектом в дело вступают характеристики окружения. Здесь стоит указать не только место действия, но и атмосферу.

Далее следует блок стилизации. Это тот самый «соус», под которым будет подано основное блюдо. Именно здесь вы указываете, хотите ли вы видеть карандашный набросок, масляную живопись или чёткую фотографию. Для фотореализма критически важно использовать термины вроде «photorealistic», «8k», «high detail». Без них нейросеть вполне может решить, что вам нужен абстракционизм. Завершает композицию блок технических параметров, о которых новички часто забывают (а зря). Сюда входят настройки виртуальной камеры, освещение и соотношение сторон.

Фотореализм и настройки камеры

Можно ли обмануть глаз зрителя, заставив его поверить в реальность сгенерированного кадра? Да, но результат того стоит лишь при глубоком погружении в фототерминологию. Нейросети обучались на миллионах реальных снимков, поэтому они прекрасно понимают язык фотографов. Если вы хотите получить портрет с красивым размытием фона, обязательно укажите параметры диафрагмы. Фраза «f/1.8» или «f/2.8» даст машине команду сфокусироваться на лице и размыть задний план (эффект боке).

Не стоит забывать и про фокусное расстояние. Для портретов золотым стандартом считается 85mm или 50mm, так как они дают наиболее естественные пропорции лица. Если же ваша цель — эпичный пейзаж или интерьер, то здесь на сцену выходят широкоугольные значения: 16mm или 24mm. Указание конкретной модели камеры, например «Sony A7R IV» или «Canon EOS R5», также вносит свою лепту, добавляя изображению характерную резкость и цветопередачу, свойственную этим сенсорам. А вот для имитации старых снимков отлично подходят названия плёнок, такие как «Kodak Portra 400» или «Fujifilm Pro 400H». Эти маркеры добавляют зернистость и специфическую цветовую гамму, делая картинку «живой» и теплой.

Работа со светом

Свет. Без него даже самая детальная модель превратится в плоское пятно. Главное — угадать с палитрой. Освещение задает настроение и объем. Один из самых беспроигрышных вариантов для портретов — это «Rembrandt lighting» (рембрандтовский свет), который создаёт драматичные тени и объём на лице. Для более мягкой, коммерческой картинки стоит использовать «softbox lighting» или «studio lighting».

Естественное освещение тоже имеет свои градации. «Golden hour» (золотой час) зальет кадр тёплым, закатным солнцем, что идеально подходит для романтических сцен и пейзажей. «Blue hour» (синий час), наоборот, создаст холодную, мистическую атмосферу предрассветных сумерек. А если вы стремитесь к киберпанку или научной фантастике, то здесь солирует «volumetric lighting» (объёмный свет) в сочетании с «neon lights». Лучи, пробивающиеся сквозь дым или туман, добавляют сцене невероятную глубину. Сложно ли настроить такой свет? Довольно просто, если знать правильные слова-триггеры.

Портретная съёмка: готовые сценарии

Разберём конкретный пример качественного промта для создания женского портрета. Задача не из лёгких. Ведь нам нужно получить живую кожу, выразительные глаза и естественную позу.
Вот как может выглядеть рабочий вариант:

«Hyper-realistic portrait of a young Scandinavian woman with freckles, messy bun hairstyle, looking directly at camera, natural makeup. Shot on 85mm lens, f/1.8, bokeh background of a busy city street cafe, soft afternoon sunlight, highly detailed skin texture, pores visible, eyes reflection, cinematic lighting, 8k resolution, raw photo style.»

Разложим по полочкам. Мы указали тип внешности, детали (веснушки, причёску), технические настройки камеры и освещения. Важный нюанс — фраза «skin texture, pores visible». Она страхует от эффекта пластиковой кукольной кожи, которым часто грешат базовые настройки.

А вот пример для мужского портрета в более суровом стиле:

«Close-up portrait of an old fisherman with a white beard, wearing a yellow raincoat, face weathered by wind and sea, rain drops on face. Stormy ocean background, dramatic gloomy lighting, volumetric fog, high contrast, shot on 35mm lens, sharp focus, rugged features, intricate details, photorealism, Magnum photography style.»

Здесь мы используем отсылку к стилю агентства Magnum, что подразумевает репортажность, высокую контрастность и эмоциональную глубину.

Архитектура и интерьеры

Интерьерный дизайн — это ещё одна сфера, где нейросети творят чудеса. Однако здесь требуется совсем иной подход к лексике. Вместо текстуры кожи на первый план выходят материалы: дерево, мрамор, стекло, бетон.
Пример запроса для современной гостиной:

«Luxury modern living room interior, panoramic windows overlooking a snowy mountain forest, fireplace, beige leather sofa, scandinavian minimalist style. Interior design photography, architectural digest style, symmetrical composition, daylight, hyper-detailed textures of wood and fabric, 8k, Unreal Engine 5 render vibe.»

Упоминание «Architectural Digest style» сразу задает планку качества композиции — кадр будет выглядеть журнально и выверенно. А «Unreal Engine 5 render vibe» добавляет ту самую глянцевую чёткость компьютерной графики высокого уровня.

Стилизация под киберпанк

Этот жанр по-прежнему будоражит умы и является настоящим клондайком для экспериментов с цветом.
Пример промта:

«Futuristic cyberpunk samurai standing in a rainy neon city, holding a glowing katana. Wet asphalt reflections, holograms, towering skyscrapers, purple and teal color palette. Cinematic shot, low angle, volumetric lighting, ray tracing, highly detailed armor, dystopian atmosphere, Blade Runner 2049 aesthetic.»

Здесь ключевую роль играют цветовая палитра (purple and teal) и отсылка к фильму «Blade Runner 2049», который является эталоном визуального стиля для нейросетей. «Low angle» (нижний ракурс) придаёт герою величественность и угрожающий вид.

Негативный промт: отсекаем лишнее

Существует ли способ гарантированно избавиться от артефактов? Волшебной палочки нет, но есть надёжный инструмент — негативный промт (negative prompt). Это поле, куда вы вписываете всё то, чего на картинке быть не должно. Многие игнорируют эту функцию, однако именно она часто спасает изображение от провала.

В негативный промт стоит обязательно включить стандартный набор «мусора»: «ugly, deformed, noisy, blurry, low quality, distortion, extra limbs, bad anatomy, watermarks, text, signature, cropped, worst quality». Если вы генерируете фотореализм, добавьте туда же «cartoon, illustration, painting, drawing», чтобы нейросеть случайно не ушла в стилизацию. Это своего рода фильтр грубой очистки, который отсекает заведомо провальные варианты генерации.

Важность весовых коэффициентов

В продвинутых нейросетях, таких как Midjourney или Stable Diffusion, можно регулировать значимость отдельных слов. Это настоящий спасательный круг, когда машина упорно игнорирует важную деталь. В Midjourney это делается через двойное двоеточие (::). Например, «cat::2» будет для сети в два раза важнее, чем «red hat::1».
В Stable Diffusion используются скобки. ((word)) усиливает влияние слова, а [[word]] — ослабляет.
Допустим, вы хотите видеть лес, но туман в нем должен быть едва заметным. Промт может выглядеть так: «Dark forest, ((tall pine trees)), [fog], moon light». Такое манипулирование вниманием искусственного интеллекта позволяет добиваться очень тонких результатов, расставляя акценты именно там, где это необходимо автору.

Распространённые ошибки новичков

Чего делать не стоит? В первую очередь, не стоит писать эссе. Нейросеть воспринимает первые 5-7 слов как основные, а всё, что написано в конце огромного абзаца, имеет исчезающе малый вес. Краткость — сестра таланта, но только если она не идет в ущерб смыслу. Также избегайте абстракций. Слова вроде «любовь», «счастье» или «успех» машина интерпретирует крайне своеобразно и часто совсем не так, как вы ожидаете. Лучше заменить их на визуальные маркеры: «улыбка», «солнечный свет», «объятия».

Ещё один подводный камень — противоречивые команды. Если вы напишете «minimalism» и тут же добавите «intricate details, ornate decoration», нейросеть войдет в ступор. Результатом станет визуальная каша. Логика запроса должна быть последовательной. И, конечно же, не пренебрегайте английским языком. Даже если интерфейс поддерживает русский, львиная доля моделей обучалась именно на английских датасетах, поэтому перевод через качественный переводчик (например, DeepL) даст куда более точный и предсказуемый результат.

Предметная съёмка и еда

Отдельная ниша — это генерация изображений еды или товаров для рекламы. Здесь важна «аппетитность».
Пример для фуд-фотографии:

«Juicy gourmet burger with melting cheese and bacon, steam rising, fresh lettuce, sesame bun. Macro photography, shallow depth of field, dark wooden background, professional food styling, studio lighting, delicious, 8k, sharp focus on the meat.»

Слово «steam rising» (поднимающийся пар) добавляет жизни, а «macro photography» позволяет рассмотреть текстуру продуктов. Такой добротный коммерческий кадр вполне может заменить реальную фотосессию для меню.

Макросъёмка природы

Хотите рассмотреть мир насекомых или капли росы? Макро — это тот режим, где нейросети показывают поразительную детализацию.
Пример промта:

«Extreme close-up macro shot of a blue eye of a dragonfly, faceted eye structure visible. Morning dew drops, blurred green background, soft sunlight, iridescent colors, national geographic photo contest winner style, high detail, sharp focus.»

Отсылка к конкурсу National Geographic — это хитрый трюк. Нейросеть подтягивает паттерны лучших фотографий природы, делая изображение композиционно безупречным.

Сюрреализм и абстракция

Иногда задача состоит в том, чтобы создать нечто невообразимое. Сюрреализм позволяет нарушать законы физики.
Пример:

«A floating island made of books in the sky, waterfalls cascading down, clouds shaped like letters. Dreamlike atmosphere, surrealism, Salvador Dali style inspired, vibrant colors, magical realism, fantasy art, intricate details, wide angle.»

Здесь мы смешиваем несовместимые объекты, но задаём чёткий стиль. Это позволяет избежать хаоса и получить осмысленную, хоть и фантастическую картину.

Вместо заключения

Генерация изображений — это процесс, который находится на стыке программирования и чистого творчества. Не стоит бояться экспериментировать с порядком слов, добавлять неожиданные стили или смешивать несовместимое. Идеальный промт рождается не сразу. Это результат десятков итераций, проб и ошибок. Но теперь, вооружившись знанием о структуре запроса, типах освещения и технических нюансах, вы сможете превратить этот процесс из лотереи в управляемое искусство. Пусть ваши генерации всегда будут четкими, а количество пальцев на руках персонажей — правильным!