Промты для фото через ии (с примерами готовых промтов)

«Почему у неё шесть пальцев?» — именно этот вопрос чаще всего срывается с губ новичка, впервые открывшего Discord или веб-интерфейс популярной нейросети. Кажется, что искусственный интеллект, обладая всей суммой знаний человечества, должен понимать нас с полуслова, но на практике всё выглядит иначе. Вместо шедевра на экране появляется нечто сюрреалистичное, кривое и порой откровенно пугающее. Обыватель в этот момент разочарованно вздыхает, обвиняя «глупую машину» в некомпетентности. Однако проблема кроется вовсе не в алгоритмах, а в неумении оператора сформулировать задачу. Ведь нейросеть — это не художник-телепат, а исполнительный, но крайне буквальный джинн. И чтобы этот джинн исполнил желание в точности, нужно освоить его язык.

Сложно ли составить запрос?

На первый взгляд, задача кажется тривиальной. Достаточно написать «красивая девушка» и нажать кнопку генерации. Но результат вас, скорее всего, не впечатлит. Дело в том, что понятие красоты у машины слишком усреднённое, сформированное на миллионах картинок из интернета. Чтобы получить добротный результат, нужно действовать как режиссёр на съёмочной площадке. Вы должны задать не только объект, но и освещение, тип камеры, объектив, стиль и даже настроение кадра. С чего начинается построение грамотного промта? С определения главного героя и его окружения. Это фундамент. Без него остальные «украшательства» просто рассыплются.

Анатомия идеального промта

Структура качественного запроса напоминает слоёный пирог. Первый и самый важный слой — это сам объект (Subject). Здесь важна конкретика. Вместо абстрактного dog (собака), лучше написать fluffy Golden Retriever puppy (пушистый щенок золотистого ретривера). Чем точнее вы опишете объект, тем меньше «свободы творчества» останется у алгоритма. А свободы этой, уж поверьте, лучше давать поменьше.

Следующий слой, который часто игнорируют новички, — это среда (Environment). Где находится наш герой? В лесу? В космосе? На кухне? Если не указать фон, нейросеть заполнит его случайным шумом или размытыми пятнами. К слову, описание фона может кардинально изменить восприятие картинки. Попробуйте добавить busy cyberpunk street background (оживленная киберпанк-улица на фоне), и настроение снимка мгновенно изменится.

Далее следует техническая часть. Это та самая изюминка, которая превращает цифровую мазню в фотореализм. Здесь мы указываем тип съёмки. Хотите портрет крупным планом? Пишите close-up shot. Нужен эпичный общий план? Подойдёт wide angle shot. Не стоит забывать и про характеристики оборудования. Упоминание конкретных камер, таких как shot on Sony A7R IV или плёночной классики Kodak Portra 400, творит чудеса. ИИ знает, как выглядит зернистость плёнки или цифровая резкость, и послушно имитирует эти эффекты.

Освещение

Свет — это кисть фотографа, даже если этот фотограф виртуальный. Без правильного света изображение будет плоским и скучным. Самый простой и беспроигрышный вариант — natural lighting (естественное освещение). Оно подходит для большинства сцен. Но если хочется драмы, стоит поэкспериментировать. Cinematic lighting (кинематографичное освещение) добавит контраста и глубины. Golden hour (золотой час) зальёт кадр тёплым закатным солнцем, создавая уютную атмосферу. А вот для студийных портретов идеально подойдёт studio lighting или rembrandt lighting (свет Рембрандта), который создаёт характерный треугольник света на щеке модели. Главное — не перегружайте запрос противоречивыми терминами. Нельзя одновременно требовать dark night (тёмная ночь) и bright sunny day (яркий солнечный день), иначе нейросеть сойдёт с ума и выдаст серую кашу.

Детализация и стилистика

Чтобы картинка не выглядела как рисунок пятиклассника, нужно добавить маркеры качества. Это своеобразные заклинания, заставляющие нейросеть стараться лучше. Слова highly detailed, 8k resolution, ultra-realistic, sharp focus — это must-have для любого фотореалистичного запроса. Они работают как фильтр, отсеивая низкокачественные варианты генерации. Интересный нюанс: упоминание движка Unreal Engine 5 часто добавляет изображению объёма и реалистичности текстур, хотя, казалось бы, речь идёт об игровом движке.

Примеры готовых промтов: Портрет

Теория — это хорошо, но без практики она мертва. Давайте разберем конкретные примеры. Допустим, нам нужен гиперреалистичный портрет пожилого мужчины с характером. Простой запрос old man даст нам скучную картинку. А теперь взгляните на этот вариант:

Hyper-realistic portrait of an old weathered sailor with a white beard, wearing a yellow raincoat, storm background, rain droplets on face, intense look, shot on 35mm lens, f/1.8, bokeh, cinematic lighting, 8k, highly detailed texture.

Здесь мы видим чёткую структуру: объект (моряк), одежда (дождевик), среда (шторм), детали (капли дождя), технические параметры (35мм, боке) и маркеры качества.

А вот пример для женского портрета в нежном стиле. Задача — получить лёгкость и воздушность:

Close-up portrait of a young woman with red curly hair and green eyes, freckles, soft morning light, standing in a field of lavender, blurred background, shot on Canon EOS R5, 85mm lens, sharp focus on eyes, natural skin texture.

Обратите внимание на уточнение natural skin texture. Это критически важно. Без него ИИ часто делает кожу «пластиковой», слишком гладкой, что сразу выдаёт искусственное происхождение фото.

Городские пейзажи и архитектура

Снимать города и здания проще, чем людей, ведь у домов нет пальцев, которые можно перепутать. Однако и здесь есть свои подводные камни. Если вы хотите получить фотореалистичный город будущего, не ограничивайтесь словом city.

Пример промта для футуристического мегаполиса:

Futuristic cityscape at night, neon lights, flying cars, towering skyscrapers made of glass and steel, reflections in puddles, cyberpunk atmosphere, volumetric fog, wide angle view, photorealistic, 8k resolution, detailed architecture.

Слова reflections (отражения) и volumetric fog (объёмный туман) добавляют сцене глубины и реализма.

Если же душа тяготеет к уютной классике, попробуйте такой вариант:

Cozy old European street in autumn, cobblestone pavement, fallen leaves, warm street lamps, evening atmosphere, wet ground, realistic photo, shot on Fujifilm XT-4.

Здесь настроение создают детали: брусчатка, опавшие листья, тёплый свет фонарей.

Еда и предметная съёмка

Фуд-фотография в исполнении ИИ может выглядеть аппетитнее, чем реальные блюда. Главное — передать текстуру и сочность.

Вот промт для идеального бургера:

Juicy delicious beef burger with melted cheese, lettuce, tomato, and bacon, sesame bun, wooden table, dark background, professional food photography, studio lighting, macro shot, steam rising, ultra detailed, mouth-watering.

Steam rising (поднимающийся пар) — маленькая деталь, которая оживляет картинку. А macro shot позволяет рассмотреть каждую кунжутную семечку.

Стилевые модификаторы

Иногда фотореализм надоедает, и хочется чего-то более художественного. Нейросети — настоящий кладезь стилей. Хотите фото в стиле 90-х? Добавьте vintage polaroid style или VHS aesthetic.

Пример промта для ретро-снимка:

Group of friends at a beach party in the 1990s, sunset, laughing, vintage clothing, film grain, polaroid aesthetics, slightly blurred, flash photography.

Словосочетание flash photography (съёмка со вспышкой) придает кадру тот самый эффект любительской мыльницы, который так ценится любителями ностальгии.

Негативные промты: отсекаем лишнее

В большинстве продвинутых интерфейсов (например, Automatic1111 для Stable Diffusion) есть отдельное поле для того, чего на картинке быть НЕ должно. Это так называемый Negative Prompt. Игнорировать его — большая ошибка. Сюда мы отправляем всё, что может испортить кадр.

Стандартный набор «спасательного круга» выглядит примерно так:

ugly, deformed, noisy, blurry, low quality, distortion, extra limbs, bad anatomy, watermark, text, signature.

В Midjourney это реализуется через параметр –no. Например, –no blur уберет размытие. Это особенно полезно, когда нейросеть упорно пытается добавить ненужные объекты, например, вторую голову или лишние пальцы.

ИИ-галлюцинации и как с ними бороться

Бывает, что даже с идеальным промтом результат удручающий. Лица плывут, глаза смотрят в разные стороны. В чём причина? Часто дело в слишком длинном и запутанном запросе. Нейросеть теряет нить повествования. Если вы напишете эссе на три страницы, ИИ ухватит только начало и конец, а середину перемешает в винегрет. Поэтому правило «краткость — сестра таланта» здесь работает лишь отчасти. Лучше использовать принцип «важное — в начало». Чем ближе слово к началу промта, тем больший вес оно имеет для алгоритма. Если цвет глаз критичен, пишите об этом в первой строке, а не в конце.

Ещё один нюанс — веса токенов. В некоторых системах можно усилить влияние конкретного слова, поставив его в, что рыжие волосы — это супер-важно. Но не стоит перебарщивать. Слишком высокие веса могут «выжечь» картинку, сделав цвета кислотными и неестественными.

Специфика разных нейросетей

Стоит отметить, что промт, который идеально сработал в Midjourney, может выдать полную ерунду в Stable Diffusion или DALL-E 3. У каждой модели свой «диалект». Midjourney более художественна, она понимает абстракции и часто сама додумывает красоту. Ей можно скармливать короткие, поэтичные фразы. Stable Diffusion — более техничная махина. Она любит точность, токены через запятую и подробные негативные промты. DALL-E 3, встроенный в ChatGPT, лучше всего понимает естественный человеческий язык. С ним можно общаться как с собеседником: «Нарисуй мне кота, который сидит на заборе, но сделай так, чтобы было похоже на фото».

Двойные экспозиции и сложные техники

Высший пилотаж — это создание сюрреалистичных эффектов, таких как двойная экспозиция. Это когда один образ накладывается на другой.

Пример промта:

Double exposure portrait of a woman and a forest, silhouette, nature combined with human, dreamy atmosphere, soft colors, white background, highly detailed artwork.

Результат обычно получается завораживающим. Такие изображения выглядят как дорогие постеры к фильмам или обложки музыкальных альбомов.

Выбор формата

Не забывайте про соотношение сторон. По умолчанию большинство сетей выдают квадрат (1:1). Но для кинематографичных кадров нужен широкий формат. В Midjourney это делается командой –ar 16:9. В Stable Diffusion вы вручную выставляете разрешение, например, 1920×1080. Вертикальные форматы (9:16) идеальны для портретов в полный рост или контента для социальных сетей. Казалось бы, мелочь, но композиция кадра напрямую зависит от границ холста. В узком вертикальном кадре нейросеть построит композицию совершенно иначе, чем в широком горизонтальном.

Это же касается и ракурсов. Low angle (вид снизу) делает объект монументальным и величественным. High angle (вид сверху) или drone shot (съёмка с дрона) позволяет показать масштаб локации. Eye level (на уровне глаз) — классический вариант для портретов, создающий эффект присутствия и контакта со зрителем.

Влияние художников

Даже если мы стремимся к фотореализму, упоминание имён известных фотографов может послужить отличным ориентиром для стиля. Если добавить в промт by Annie Leibovitz, мы получим драматичный, хорошо поставленный свет и глубокие цвета. By Steve McCurry направит генерацию в сторону ярких, живых портретов с акцентом на глаза и эмоции. By Ansel Adams гарантирует вам потрясающий чёрно-белый пейзаж с невероятной контрастностью и детализацией. Это легальный способ заимствования стиля, который не считается плагиатом, но значительно улучшает эстетику результата.

Не бойтесь ошибок

Путь промпт-инженера (да, теперь есть такая профессия) устлан сотнями неудачных генераций. И это нормально. Не стоит удалять «бракованные» варианты сразу. Анализируйте их. Почему здесь вылезла третья рука? Ага, возможно, слово hands в промте сбило сеть с толку. Почему лицо в тени? Забыли добавить источник света. Метод проб и ошибок — самый действенный учитель. К тому же, сообщество энтузиастов огромно. Подглядывать за чужими промтами не стыдно, а полезно. Копируйте, меняйте детали, смотрите, как изменение одного слова влияет на целое.

И всё же, главный секрет успеха кроется не в знании тысячи терминов, а в наличии воображения. Нейросеть — всего лишь инструмент, мощный, но бездушный. Она не может придумать идею за вас. Она лишь визуализирует ваши мысли. Поэтому, прежде чем пальцы коснутся клавиатуры, представьте картинку у себя в голове. Почувствуйте атмосферу, увидьте свет, рассмотрите детали. И только потом начинайте переводить эти образы на язык алгоритмов.

Ваш идеальный кадр уже ждет где-то в цифровом небытии. Осталось лишь подобрать правильные слова, чтобы извлечь его на свет. Дерзайте, экспериментируйте, и пусть ваши промты всегда попадают точно в цель.