Естественные промты для фото (с примерами готовых промтов)

Лента социальных сетей сегодня напоминает бесконечную выставку достижений пластической хирургии и цифрового глянца, где каждое лицо сияет неестественным светом, а кожа лишена даже намёка на текстуру. Пользователь, пролистывая сотни идеально сгенерированных изображений, начинает испытывать так называемый эффект «зловещей долины», когда чрезмерное совершенство вызывает не восхищение, а подсознательное отторжение и тревогу. Искусственный интеллект по умолчанию тяготеет к симметрии, гладкости и правильному освещению, но именно эти характеристики убивают в кадре жизнь, превращая его в стерильную картинку. Обыватель часто не понимает, почему один кадр цепляет за живое, а другой, технически безупречный, оставляет равнодушным. А ведь секрет кроется в ошибках, случайностях и несовершенствах, которые присущи настоящей фотографии. И чтобы получить такой результат от нейросети, нужно научиться говорить с ней на языке фотографов-документалистов, а не 3D-художников. Но чтобы вдохнуть душу в цифровой код, стоит начать с понимания того, как именно ломать алгоритмы идеальности.

Что такое «естественность» в генерации?

Сложно ли объяснить машине, что такое плохой кадр? Довольно сложно. Ведь нейросети обучались на миллионах изображений с тегами «best quality» и «masterpiece», поэтому любой запрос они пытаются докрутить до абсолюта. Естественность же подразумевает наличие дефектов. Это могут быть случайные блики, расфокус, зернистость плёнки или даже смазанное движение. В представлении многих новичков хороший промт должен состоять из эпитетов вроде «gorgeous» или «stunning», однако на деле такие слова лишь усиливают «пластмассовый» эффект. Реализм рождается там, где мы имитируем физику света и оптические ограничения реальных камер. Сюда же относится и работа с кожей: она должна иметь поры, морщинки, неровности пигментации и пушковые волосы. Иначе вместо портрета вы получите манекен.

Техническая база: Плёнка и оптика

Основа любого реалистичного запроса — это указание оборудования. Если вы не зададите конкретную модель камеры или плёнки, ИИ выдаст усреднённое цифровое изображение. Львиная доля успеха зависит от выбора плёночного профиля. Одним из самых популярных решений остаётся Kodak Portra 400. Эта плёнка славится своей тёплой цветопередачей и деликатным отношением к оттенкам кожи, поэтому добавление этого названия в промт сразу делает картинку мягче и живее. Далее следует Fujifilm Pro 400H, которая, напротив, тяготеет к холодным, зеленоватым и пастельным тонам, создавая воздушную атмосферу. Для любителей более жёсткого, контрастного и зернистого изображения отлично подойдёт Cinestill 800T (особенно для ночных сцен) или чёрно-белая классика Ilford HP5.

Не стоит забывать и об оптике. Упоминание конкретного фокусного расстояния меняет геометрию кадра. Например, 35mm lens даёт эффект присутствия, лёгкое искажение перспективы и включает в кадр больше окружения, что свойственно репортажной съёмке. А вот 85mm lens или 105mm сжимают перспективу и идеально подходят для портретов, отделяя объект от фона. К слову, параметр диафрагмы тоже играет роль. Указав f/1.8 или f/2.8, вы получите малую глубину резкости (боке), что свойственно профессиональным портретам. А если написать f/8 или f/11, то в резкости окажется весь кадр, что характерно для уличной или пейзажной фотографии. Именно эти технические нюансы, прописанные в тексте запроса, заставляют нейросеть имитировать работу физической линзы, добавляя те самые желанные оптические несовершенства.

Работа со светом

Свет — это кисть фотографа. Но в генерациях он часто бывает слишком «студийным». Чтобы избежать этого, нужно использовать описания сложного, неидеального освещения. Стандартный «soft lighting» часто делает картинку плоской. Гораздо интереснее выглядит harsh sunlight (жёсткий солнечный свет), который создаёт глубокие, резкие тени и высокий контраст. Это сразу придаёт снимку документальный характер. Другой вариант — window light (свет от окна), который даёт мягкий, но направленный рисунок, характерный для домашних съёмок.

Особый интерес вызывает использование вспышки. Фразы вроде camera flash, direct flash или harsh flash имитируют эффект любительской «мыльницы» или модной репортажной съёмки. Лицо становится плоским, фон проваливается в темноту, появляются жёсткие тени за объектом. Это выглядит не всегда «красиво» в классическом понимании, но безусловно выглядит правдоподобно. Атмосферности добавляют и условия съёмки: overcast (пасмурно), golden hour (золотой час), blue hour (сумерки) или dimly lit (тусклое освещение). К тому же, игра с тенями с помощью промтов shadow play или dappled light (свет сквозь листву) помогает разбить идеальную симметрию лица и добавить изображению глубины.

Детализация и текстура кожи

Это самый болезненный момент для большинства генераций. Чтобы кожа не выглядела как отполированный мрамор, нужно буквально запрещать нейросети ретушь. В промт стоит включать такие маркеры, как skin texture, pores, freckles, moles, imperfections, uneven skin tone. Фраза raw photo (сырое фото) даёт сигнал алгоритму не применять пост-обработку. Также полезно добавлять detailed skin, но с осторожностью, чтобы не получить эффект перешарпа (чрезмерной резкости).

Важно понимать, что «естественность» — это не всегда про красоту. Это про жизнь. Реальные люди имеют морщинки вокруг глаз, когда улыбаются (crow’s feet), у них могут быть растрепаны волосы (messy hair, windblown hair), а одежда может сидеть не идеально. Уточнение no makeup или minimal makeup также помогает снизить градус гламура. И всё же, даже с этими словами нейросети порой пытаются приукрасить действительность, поэтому приходится экспериментировать с весом токенов или порядком слов в запросе.

Живые эмоции и сюжеты

Статичная поза «лицом в камеру» — верный признак искусственности. Люди в жизни редко замирают в идеальных ракурсах. Сюжетные промты должны содержать действие. Candid shot (случайный кадр) — один из самых мощных инструментов. Он подразумевает, что человек не позирует, а занят своим делом. Например, looking away (смотрит в сторону), laughing out loud (громко смеётся), eating (ест), adjusting hair (поправляет волосы).

Эмоция должна быть читаемой, но не гипертрофированной. Smirk (ухмылка), frowning (хмурится), bored look (скучающий вид) часто выглядят убедительнее, чем голливудская улыбка. Включение в кадр посторонних объектов на переднем плане (foreground blur, objects in foreground) создаёт ощущение подглядывания, глубины сцены. Это может быть плечо собеседника, ветка дерева или часть интерьера. Такие нюансы превращают просто картинку в историю, которая могла произойти на самом деле.

Готовые решения: Портрет

Теория — это хорошо, но практика требует конкретики. Рассмотрим построение запроса для создания максимально живого портрета девушки в кафе. Мы хотим уйти от глянца и получить атмосферный снимок, будто сделанный другом на плёнку.

Первым делом описываем объект и действие, не забывая про детали внешности. «Half-body portrait of a young woman with messy bun hair, laughing sincerely, covering mouth with hand, wearing oversized grey sweater, sitting in a cozy cafe». Здесь мы задали позу, эмоцию и одежду. Свитер «oversized» добавляет уюта и небрежности.

Далее задаем свет и атмосферу. «Natural window light, rainy day outside, reflection in the glass, moody atmosphere, soft shadows on face». Свет от окна в дождливый день обеспечит мягкий, но драматичный рисунок, а отражения добавят сложности.

И, наконец, технический блок, который «склеит» всё в реалистичную фотографию. «Shot on Kodak Portra 400, 35mm lens, f/2.0, film grain, raw photo, realistic skin texture, slight motion blur». Зерно плёнки и лёгкий смаз (motion blur) скроют цифровую природу изображения.

Итоговый промт будет выглядеть так:

Half-body portrait of a young woman with messy bun hair, laughing sincerely, covering mouth with hand, wearing oversized grey sweater, sitting in a cozy cafe, natural window light, rainy day outside, reflection in the glass, moody atmosphere, soft shadows on face, shot on Kodak Portra 400, 35mm lens, f/2.0, film grain, raw photo, realistic skin texture, slight motion blur –v 6.0 –style raw

Уличная фотография

Уличная съёмка требует динамики и многоплановости. Здесь главные враги — пустота фона и чистота улиц. Чтобы получить добротный стрит-кадр, нужно насытить его деталями.

Начнем с сюжета. «Candid street photography of an elderly man reading a newspaper on a park bench, pigeons around on the ground, autumn leaves, people walking in the blurred background». Мы создали сцену с главным героем и активным фоном.

Добавляем технические параметры для имитации старой камеры. «Shot on Leica M6, black and white film, Ilford HP5 Plus 400, high contrast, gritty texture, sharp focus on the man, bokeh background». Чёрно-белая плёнка Ilford — это классика жанра, которая прощает многие огрехи генерации и добавляет художественности.

Финальный промт:

Candid street photography of an elderly man reading a newspaper on a park bench, pigeons around on the ground, autumn leaves, people walking in the blurred background, shot on Leica M6, black and white film, Ilford HP5 Plus 400, high contrast, gritty texture, sharp focus on the man, bokeh background, street photography vibe, 1990s style –ar 3:2 –style raw

Эстетика “случайного кадра” (Flash Photography)

Особый шик сейчас — это имитация фотографий с вечеринок 90-х или нулевых. Это так называемая эстетика flash photography. Она подразумевает пересвеченные лица, красные глаза (иногда), тёмный фон и ощущение полного хаоса.

Описываем сцену. «Group of friends taking a selfie at a night party, holding red cups, chaotic composition, messy hair, joyful expressions, night club background». Хаотичная композиция здесь играет ключевую роль.

Техническая часть должна быть специфической. «Direct harsh flash, disposable camera aesthetic, Fujifilm QuickSnap, hard shadows, vignette, amateur shot, overexposed highlights». Упоминание одноразовой камеры (disposable camera) творит чудеса, сразу снижая качество до правдоподобного уровня.

Итоговый промт:

Group of friends taking a selfie at a night party, holding red cups, chaotic composition, messy hair, joyful expressions, night club background, direct harsh flash, disposable camera aesthetic, Fujifilm QuickSnap, hard shadows, vignette, amateur shot, overexposed highlights, noise, film grain –ar 9:16 –stylize 250

Пейзаж и интерьер

В съёмке без людей тоже важна естественность. Интерьеры от ИИ часто грешат идеальным порядком, которого не бывает в жизни. Нужно добавлять «следы присутствия».

Сюжет: «Messy bedroom in the morning, unmade bed with crumpled white sheets, open book on the pillow, cup of coffee on the bedside table, sun rays hitting the dust particles in the air». Пылинки в воздухе (dust particles) — это тот самый нюанс, который продает реализм.

Техника: «Wide angle shot, 24mm lens, natural lighting, airy feel, interior design magazine style but lived-in, highly detailed texture of fabric».

Финальный промт:

Messy bedroom in the morning, unmade bed with crumpled white sheets, open book on the pillow, cup of coffee on the bedside table, sun rays hitting the dust particles in the air, wide angle shot, 24mm lens, natural lighting, airy feel, interior design magazine style but lived-in, highly detailed texture of fabric, 8k resolution, photorealistic –ar 16:9

Нюансы использования негативных промтов

Негативный промт (параметр –no в Midjourney или отдельное поле в Stable Diffusion) — это спасательный круг, отсекающий лишнее. Однако и здесь не стоит перебарщивать. Часто люди копируют огромные «полотна» негативных промтов из интернета, которые только путают нейросеть. Достаточно указать самые критичные вещи.

Разумеется, стоит исключить cartoon, illustration, 3d render, painting, drawing. Это база. Чтобы убрать пластиковость кожи, добавляем в негатив retouched, airbrushed, smooth skin, makeup, doll. Для композиции полезно исключить symmetry, centered, если вы хотите более динамичный кадр. Но не перегружайте этот список. Иногда нейросеть, пытаясь избежать «уродства» (ugly), делает лицо слишком красивым, что противоречит нашей цели создать естественный, живой образ.

Стоит ли усложнять?

Иногда возникает вопрос: нужно ли писать трактаты на пять строк, чтобы получить фото? На самом деле, краткость часто работает лучше. Перегруженный промт сбивает фокус внимания нейросети. Она начинает смешивать понятия, и вместо «девушки в свитере с кофе» вы можете получить «девушку из кофе в свитере». Лучшие результаты часто получаются при использовании простых, но ёмких фотографических терминов. Ведь главное — задать стиль и атмосферу, а детали ИИ дорисует сам.

Эксперимент — вот главный двигатель прогресса в промпт-инжиниринге. Попробуйте убрать слово «photorealistic» и заменить его на «phone photo» или «CCTV footage» (кадр с камеры наблюдения). Результат может вас удивить своей пугающей правдоподобностью. Меняйте плёнки, играйте с годами (например, photo from 2005), добавляйте погодные условия. И помните, что первый результат редко бывает идеальным. Генерация изображений — это процесс перебора, поиска того самого «зерна» (seed), из которого вырастет настоящий шедевр.

Поиск своего стиля в промтах — занятие увлекательное и, безусловно, творческое. Не бойтесь «портить» кадры, добавлять грязь, шум и ошибки. Ведь именно в несовершенстве кроется настоящая, живая красота, которой нам так не хватает в цифровом мире. Пусть ваши генерации вызывают эмоции и заставляют зрителя на секунду усомниться: а не реальное ли это фото? Удачных вам экспериментов и вдохновляющих кадров!