Промт для фотографа (с примерами готовых промтов)

Создание изображения без камеры? Ещё буквально десятилетие назад это звучало как научная фантастика или бред сумасшедшего, но сейчас генерация визуального контента стала обыденностью, доступной каждому обладателю мощной видеокарты или платной подписки. Мир фотографии перевернулся: теперь не обязательно ждать «золотой час» или арендовать студию за бешеные деньги, чтобы получить шедевр. Однако простого нажатия кнопки «Сгенерировать» недостаточно. Искусственный интеллект — это не телепат, а, скорее, исполнительный, но невероятно буквальный художник, который не понимает намёков. Он требует чётких инструкций, точных определений и знания специфического синтаксиса. Умение составить грамотный запрос — промт — превратилось в отдельный навык, сравнимый с умением выставлять свет в реальной студии. Но чтобы результат не разочаровал, а заставил зрителя усомниться в реальности картинки, нужно понимать внутреннюю логику алгоритмов.

Что такое промт?

По сути, промт — это текстовое описание того, что нейросеть должна «увидеть» в своём цифровом шуме и собрать в единое целое. Сложно ли это? На первый взгляд — нет, но дьявол, как водится, кроется в деталях. Обыватель напишет: «Красивая девушка в лесу». Профессионал же, понимающий механику процесса, создаст конструкцию, напоминающую заклинание из гримуара, где каждое слово имеет вес. Ведь именно от порядка слов, их коннотации и технических параметров зависит, получите ли вы фотореалистичный портрет или пластиковую куклу с тремя руками. Промт — это техническое задание, сжатое до нескольких строк, где вы одновременно выступаете и заказчиком, и арт-директором, и оператором.

Анатомия запроса

Любой добротный промт строится по определенной логике, которую стоит соблюдать, если вы хотите стабильного результата. Начинать всегда нужно с главного объекта (Subject). Это может быть человек, животное или архитектурное сооружение. Затем, как правило, описывается действие или состояние объекта. А вот дальше начинается самое интересное — среда и контекст. Львиная доля успеха зависит от того, насколько точно вы опишете окружение. Но и этого мало. Чтобы картинка «заиграла», необходимо добавить технические модификаторы: тип освещения, модель камеры, фокусное расстояние и даже тип плёнки. Без этих уточнений нейросеть выдаст усредненный результат, который выглядит довольно скучно. Завершает композицию стилизация — указание на конкретных художников, эпоху или настроение.

Освещение и атмосфера

Свет в генерации изображений играет ту же роль, что и в реальной фотографии — он лепит форму. Если оставить этот пункт без внимания, вы рискуете получить плоское, невыразительное изображение. Довольно часто новички используют простые эпитеты вроде «bright light», но это ошибка. Куда эффективнее работают профессиональные термины. Например, «cinematic lighting» (кинематографичное освещение) сразу добавляет драматизма и глубины. «Volumetric lighting» (объемный свет) создает красивые лучи, пробивающиеся сквозь туман или пыль. А если нужна мягкость и нежность, то на помощь приходит «softbox lighting» или «natural light». К слову, время суток тоже имеет значение: «golden hour» (золотой час) зальет сцену тёплым закатным светом, а «blue hour» (синий час) создаст мистическую, предрассветную атмосферу.

Технические параметры: имитация реальности

Как заставить ИИ имитировать работу настоящей камеры? Достаточно просто указать ему на это. В промт стоит внедрять названия конкретных камер и объективов. Фраза «shot on Sony A7R IV» дает сигнал алгоритму о высокой детализации и резкости. Упоминание «85mm lens» размоет фон, создавая красивое боке, идеальное для портретов, тогда как «35mm» или «wide angle» захватит больше пространства. Не стоит забывать и про диафрагму: «f/1.8» обеспечит малую глубину резкости, а «f/8» сделает резким всё изображение. Отдельного упоминания заслуживает имитация плёнки. Добавив в запрос «Kodak Portra 400» или «Fujifilm Superia», вы получите характерное зерно и цветопередачу, свойственную аналоговой фотографии. Это же касается и разрешения: магические слова «8k», «ultra-detailed», «Unreal Engine 5» (хоть это и игровой движок) заставляют нейросеть прорисовывать мельчайшие детали, избавляя картинку от «мыла».

Портретная съёмка

Работа с лицами — самый сложный и кропотливый процесс. Тут всплывают все подводные камни генерации: неестественная кожа, странные глаза, лишние зубы. Чтобы избежать эффекта зловещей долины, описание должно быть скрупулезным. Важно указать текстуру кожи («skin texture», «pores»), чтобы лицо не выглядело пластиковым. Пример готового промта для реалистичного женского портрета может выглядеть так:

«Close-up portrait of a young woman with freckles, ginger hair, wind blowing hair, natural makeup, highly detailed skin texture, visible pores, intense eye contact, shot on Canon EOS R5, 85mm f/1.2 lens, soft natural lighting, bokeh background, photorealistic, 8k.»

Здесь каждое слово работает на результат: «freckles» (веснушки) добавляют живости, «intense eye contact» (интенсивный зрительный контакт) приковывает внимание, а технические параметры камеры обеспечивают качество.

Уличная фотография и киберпанк

Городские пейзажи требуют иного подхода. Здесь солирует атмосфера и детализация окружения. Стиль киберпанк, столь любимый нейросетями, раскрывается через неон, дождь и отражения. Промт для такого сюжета может быть следующим:

«Futuristic Tokyo street at night, raining, neon signs reflecting in puddles, cyberpunk aesthetic, blade runner style, solitary figure in a raincoat, volumetric fog, cinematic lighting, shot on 35mm film, grainy texture, high contrast, teal and orange color palette.»

Обратите внимание на цветовую палитру: сочетание бирюзового и оранжевого («teal and orange») — классический голливудский приём, который делает картинку визуально приятной и «дорогой». Ну и, конечно же, «grainy texture» (зернистая текстура) помогает скрыть мелкие артефакты генерации, выдавая их за художественный замысел.

Еда и предметная съёмка

Сгенерировать аппетитное блюдо иногда сложнее, чем портрет. Еда должна вызывать желание её съесть, а не ужас. Тут важна сочность, пар, блеск. Ключевые слова — «delicious», «steaming», «gourmet». Пример для фуд-фотографии:

«Professional food photography of a juicy burger on a wooden board, melting cheese, steam rising, fresh lettuce, sesame bun, dark moody background, studio lighting, softbox, macro shot, 100mm lens, ultra realistic, sharp focus, 4k.»

Макросъёмка («macro shot») здесь критически важна, она позволяет показать текстуру мяса и хлеба. А «dark moody background» (тёмный атмосферный фон) помогает выделить главный объект, не отвлекаясь на детали интерьера.

Негативные промты

Иногда важнее объяснить нейросети, чего вы НЕ хотите видеть, чем то, что вам нужно. Для этого существуют негативные промты (negative prompts). Это своего рода спасательный круг, отсекающий мусор. В этот список обычно вносят: «ugly», «deformed», «blur», «bad anatomy», «extra fingers», «watermark», «text». Не стоит пренебрегать этим инструментом. Он существенно очищает выдачу, экономя вам время и нервы (да и кредиты на генерацию). Ведь нейросеть, обученная на миллионах картинок из интернета, может по привычке «приклеить» к вашему шедевру водяной знак стокового фотобанка или сделать руку с шестью пальцами просто потому, что в обучающей выборке было много неудачных артефактов.

Стилизация под художников и эпохи

Искусственный интеллект — это кладезь знаний об истории искусств. И грех этим не воспользоваться. Добавление имени конкретного фотографа или художника кардинально меняет стилистику. Если вы хотите получить чёрно-белый, драматичный снимок, стоит упомянуть Хельмута Ньютона или Анселя Адамса (для пейзажей). Для сюрреализма подойдет упоминание Сальвадора Дали или, в контексте фотографии, Мана Рэя. Пример промта в стиле винтажного хоррора:

«Eerie abandoned mansion in the fog, silhouette of a ghost, vintage photography style, 1920s, sepia tone, scratches, dust, damaged film effect, low contrast, mysterious atmosphere, inspired by Alfred Hitchcock.»

Такие слова, как «scratches» (царапины) и «dust» (пыль), добавляют антураж старой фотографии, найденной на чердаке.

Ошибки и заблуждения

Многие считают, что чем длиннее промт, тем лучше результат. На самом деле это не так. Перегруженный запрос часто сбивает алгоритм с толку. Нейросеть начинает «забывать» начало фразы, пытаясь уместить в картинку все детали из конца. Лучше придерживаться золотой середины — 4–6 предложений, описывающих суть. Ещё одна ошибка — противоречивые команды. Нельзя требовать одновременно «sunny day» (солнечный день) и «night atmosphere» (ночную атмосферу), если только вы не добиваетесь сюрреализма. Также не стоит надеяться, что ИИ поймёт сложные метафоры. Фраза «одиночество в большом городе» для него слишком абстрактна. Лучше разложить это понятие на визуальные составляющие: «одинокий человек», «пустая улица», «холодный свет».

Влияние соотношения сторон

Формат кадра — это не просто размер картинки, это инструмент композиции. В большинстве нейросетей (Midjourney, Stable Diffusion) соотношение сторон задается параметром (например, —ar 16:9). Широкий формат (16:9 или 21:9) автоматически подталкивает алгоритм к созданию кинематографичных, эпических сцен. Вертикальный формат (9:16) идеален для портретов в полный рост или контента для социальных сетей. Квадрат (1:1), который часто стоит по умолчанию, хорош для композиционно центрированных объектов, но может «обрезать» воздух по краям. Эксперименты с этим параметром могут кардинально изменить восприятие одной и той же сцены.

Стоит ли использовать готовые пресеты?

В сети полно баз данных с готовыми промтами. Стоит ли их копировать? Безусловно, как отправную точку. Но слепое копирование лишает вас уникальности. Чужой промт — это чужое видение. Разумнее брать структуру и заменять переменные. Понравился свет? Оставьте описание света, но поменяйте модель и локацию. Понравилась композиция? Используйте ее для своего сюжета. Это как конструктор: детали одни и те же, но собрать из них можно и замок, и звездолет. К тому же, разные версии нейросетей по-разному реагируют на одни и те же слова. То, что работало в Midjourney v4, может дать совершенно иной результат в v6.

Практическое применение

Где всё это использовать? Спектр огромен. Дизайнеры создают референсы для съёмок, чтобы показать клиенту идею «на пальцах». Маркетологи генерируют уникальный контент для соцсетей, который не нарушает авторских прав. Иллюстраторы используют ИИ для создания фонов или поиска вдохновения. Более того, фотографы (настоящие, с камерами) используют генерацию для планирования кадров (прешутинга). Проще сгенерировать эскиз, чем объяснять модели словами, как должна падать тень. Это мощный инструмент, который не заменяет творца, а усиливает его возможности. Экономия времени и ресурсов колоссальная, а результат, при должном умении, впечатляет даже скептиков.

Будущее промт-инжиниринга

Технологии развиваются с пугающей скоростью. Уже сейчас появляются модели, понимающие естественный язык гораздо лучше, и потребность в сложных «заклинаниях» постепенно снижается. Однако понимание основ композиции, света и стиля останется востребованным всегда. Машина может нарисовать всё что угодно, но именно человек решает, что рисовать. Вкус, насмотренность и умение формулировать мысли — вот главные навыки современного цифрового художника.

Освоение искусства написания промтов — это увлекательное путешествие, полное проб и ошибок. Не бойтесь экспериментировать, смешивать стили и нарушать правила. Иногда самые безумные сочетания слов рождают настоящие шедевры, которые невозможно придумать специально. Пусть ваш внутренний диалог с искусственным интеллектом будет продуктивным, а каждая генерация становится маленьким открытием. Удачи в творческих поисках, и пусть ваши промты всегда попадают точно в цель, создавая миры, от которых захватывает дух.