Образец промта для фото (с примерами готовых промтов)

Казалось бы, что может быть проще: вбил пару слов в строку генерации, нажал кнопку и получил шедевр цифрового искусства? Ведь в сети представлено множество галерей с невероятными изображениями, созданными нейросетями, и создаётся иллюзия, что компьютер понимает нас с полуслова. На деле же новичок довольно часто сталкивается с разочарованием: вместо фотореалистичного портрета на экране появляется нечто пластиковое, с нарушенной анатомией или вовсе галлюциногенное месиво. Проблема здесь кроется не в “глупости” алгоритма, а в неумении оператора чётко сформулировать задачу на языке, понятном машине. А начать стоит с осознания того факта, что промт — это не просто описание, а набор команд, где каждое слово имеет свой вес.

Что такое промт и почему он важен?

По своей сути, текстовый запрос к нейросети напоминает техническое задание для очень исполнительного, но абсолютно лишённого воображения художника. Поймёт ли он фразу «красивая девушка»? Безусловно, но его понятие о красоте сформировано на миллионах картинок из интернета, и результат может оказаться усреднённым и скучным. Сложно ли добиться конкретики? Да, но именно детализация превращает серую массу пикселей в произведение искусства. Промт выступает тем самым мостиком между вашей фантазией и математическими алгоритмами генерации. Игнорирование правил построения запроса — это верный путь к потере платных генераций, что, согласитесь, бьёт по бюджету, если вы пользуетесь коммерческими тарифами Midjourney или DALL-E.

Анатомия идеального запроса

Структура качественного промта для фотореализма всегда подчиняется определённой логике, и хаос здесь неуместен. Начинать описание всегда стоит с главного объекта (Subject). Это может быть человек, животное или архитектурное сооружение. Сразу после этого необходимо указать действие или состояние объекта, ведь статика часто выглядит неестественно. Далее следует описание окружения (Environment), которое задаёт контекст и атмосферу кадра. Нельзя не упомянуть и про освещение (Lighting) — пожалуй, это самый важный инструмент для создания объёма и настроения. Ну и, наконец, технические параметры и стилизация (Style & Camera settings), превращающие картинку в имитацию фотографии.

Разберём этот процесс подробнее. Если мы просто напишем «cat» (кот), нейросеть выдаст случайного кота. А вот если добавить детализацию, результат изменится кардинально. Сначала мы уточняем породу и цвет: «A fluffy ginger Maine Coon cat» (пушистый рыжий мейн-кун). Затем добавляем действие: «sitting on a wet cobblestone street» (сидящий на мокрой брусчатке). После этого вводим атмосферу и свет. Завершает композицию технический блок. Именно такая последовательность позволяет алгоритму «разложить по полочкам» все требования и собрать пазл воедино.

A fluffy ginger Maine Coon cat, sitting on a wet cobblestone street, during heavy rain, neon lights reflecting in puddles, cinematic lighting, shot on 35mm lens, f/1.8, highly detailed, 8k, photorealistic

Образцы для портретной съёмки

Портрет — это жанр, где нейросети достигли невероятных высот, однако и ошибок здесь совершается львиная доля. Главное — избежать эффекта «зловещей долины», когда лицо выглядит почти как живое, но вызывает подсознательный страх своей искусственностью.

Для создания классического студийного портрета стоит использовать следующую конструкцию. Начинаем с героя, добавляем детали одежды и взгляда, описываем свет (так как именно он создаёт драму) и фиксируем техническими тегами. Такой запрос даст добротный, проработанный результат с высокой детализацией кожи:

Close-up portrait of an elderly fisherman with a weathered face and deep wrinkles, wearing a yellow raincoat, looking directly at the camera with intense blue eyes, dramatic side lighting, Rembrandt lighting, dark background, shot on Sony A7R IV, 85mm lens, sharp focus, hyper-realistic texture

А вот если задача стоит иначе — создать стильный фэшн-снимок, то акценты смещаются. Здесь важна поза и окружение. Результат, скорее всего, поразит своей эстетикой и глянцевым лоском:

Full body shot of a fashion model in a futuristic silver dress, walking on a runway made of glass, surrounded by tropical plants, soft pink and blue fog, softbox lighting, ethereal glow, fashion photography, Vogue style, high resolution

Как выбрать освещение?

Свет в генерации изображений творит чудеса. Один и тот же персонаж может выглядеть угрожающе или ангельски невинно только благодаря смене схемы освещения. Довольно часто новички игнорируют этот параметр, полагаясь на случайность. Это ошибка.

Для тёплых, уютных кадров отлично подходит «Golden hour» (золотой час) — время перед закатом. Если же нужна таинственность и объём, используйте «Volumetric lighting» (объёмный свет) или «God rays» (лучи бога). А для жёсткого, контрастного изображения в стиле нуар незаменим «Hard shadows» или «Chiaroscuro» (кьяроскуро).

Ancient temple ruins in the jungle, god rays breaking through the canopy, dust particles in the air, mystical atmosphere

Архитектура и интерьеры

Генерация зданий и помещений требует скрупулёзного подхода к геометрии и стилистике. Часто нейросеть пытается искривить прямые линии, поэтому стоит использовать слова-стабилизаторы.

Допустим, нам нужен современный интерьер. Важный нюанс — указание движка рендера, так как это подсказывает нейросети, как работать со светом и текстурами. Слово «symmetrical» здесь помогает выровнять кадр.

Interior design of a luxury penthouse living room, minimalist style, white leather sofa, marble floor, panoramic windows overlooking the night city skyline, Unreal Engine 5 render, architectural visualization, interior photography, symmetrical composition

С экстерьерами дело обстоит похожим образом. Использование широкоугольного объектива в описании (wide angle) позволяет захватить больше пространства и показать масштаб постройки.

Brutalist concrete house on a cliff edge, cloudy storm sky, rainy mood, wet concrete texture, brutalism architecture, wide angle shot, 16mm lens

Технические параметры и «магия» цифр

Многие считают, что достаточно красивых слов, но на самом деле технические параметры играют решающую роль в итоговом качестве. Особенно это касается соотношения сторон и версии алгоритма.

В Midjourney, например, важнейшим параметром является соотношение сторон (–ar). По умолчанию сеть генерирует квадрат, что не всегда подходит для кинематографичных сцен. Добавление «–ar 16:9» в конце промта превращает картинку в кадр из фильма. А для портретов в полный рост лучше использовать «–ar 2:3» или «–ar 9:16». Ещё один полезный параметр — стилизация (–s или –stylize). Значения варьируются от 0 до 1000. Высокое значение (например, –s 750) даёт больше художественной вольности нейросети, но может увести от первоначальной задумки. Низкое значение (–s 50) заставляет алгоритм строго следовать тексту, хотя изображение может выйти суховатым.

В Stable Diffusion же есть свои постулаты. Здесь огромное значение имеет «CFG Scale» (насколько сильно нейросеть слушается промта) и «Sampling steps» (количество шагов генерации). Обычно золотой серединой считается 20-30 шагов и CFG Scale в районе 7-9. Превышение этих значений часто приводит к «пережарке» изображения — появлению артефактов и неестественных цветов.

Ошибки, которые портят всё

Самая распространённая ошибка обывателя — это создание «винегрета» из слов. Не стоит пытаться впихнуть в один запрос все известные вам красивые прилагательные. Фраза «beautiful amazing stunning fantastic best quality 8k masterpeace» лишь создаёт шум. Нейросеть теряется и не понимает, что именно ей нужно выделить. Лучше использовать 2-3 точных определения, чем десяток синонимов.

Ещё один подводный камень — противоречивые команды. Если вы пишете «sunny day» (солнечный день) и тут же добавляете «dark gloomy atmosphere» (тёмная мрачная атмосфера), алгоритм войдёт в ступор. Результатом станет странная, неестественно освещённая картинка. Также стоит отказаться от слишком сложных грамматических конструкций и отрицаний. Нейросети плохо понимают частицу «не». Вместо «no beard» (без бороды) лучше написать «clean shaven» (чисто выбрит).

Стилевые модификаторы для фотореализма

Чтобы фото выглядело именно как фото, а не как 3D-рендер или рисунок, нужно использовать специфический лексикон фотографов. Эти слова служат своего рода маркерами качества для нейросети.

Первая группа — это названия плёнок и камер. Упоминание «Kodak Portra 400» придаст снимку характерное зерно и мягкие цвета, свойственные плёночной фотографии. Тег «Polaroid» добавит винтажности, размытости и специфическую рамку. Если же нужна предельная чёткость, используйте «shot on Hasselblad» или «Phase One XF IQ4» — это камеры с огромным разрешением, и нейросеть попытается сымитировать их детализацию.

Вторая группа — оптические эффекты. «Bokeh» или «Depth of field» (глубина резкости) размоют фон, отделив от него объект съёмки. «Motion blur» (смаз в движении) добавит динамики, если вы снимаете едущий автомобиль или бегущего человека. «Macro lens» (макрообъектив) позволит рассмотреть каждую ворсинку на теле насекомого или текстуру радужки глаза. Использование этих терминов сразу поднимает уровень генерации на ступень выше.

Нужно ли знать английский?

С этим вопросом сталкивается каждый. Разумеется, большинство топовых нейросетей обучались на англоязычном датасете. Можно ли писать на русском? В некоторых моделях да, но качество понимания будет заметно ниже. Ведь при переводе теряются нюансы. Слово «коса» на русском может означать причёску, инструмент или отмель, а в английском это три разных слова (braid, scythe, spit). Поэтому для стабильного результата лучше использовать английский язык. Даже базового уровня и переводчика будет вполне достаточно. Главное — понимать логику построения фразы, о которой мы говорили выше.

Стоит ли копировать чужие промты?

Натыкаешься на шедевр и думаешь: «Скопирую промт и получу то же самое». Сработает ли это? И да, и нет. Дело в том, что в генерации всегда присутствует элемент случайности (Seed). Даже с абсолютно идентичным запросом вы получите немного другое изображение. Однако копирование — это отличный способ обучения. Разбирая чужие удачные запросы, вы находите интересные связки слов, новые стили и технические приёмы. Это настоящий кладезь знаний для новичка. Но слепо копировать не стоит — лучше адаптировать под свои задачи, добавляя свою изюминку.

Подытоживая тему промтинга, хочется сказать, что это процесс не столько технический, сколько творческий. Не бойтесь экспериментировать, менять местами слова, добавлять неожиданные эпитеты и смешивать несмешиваемое. Иногда ошибка в слове или странная ассоциация рождает новый визуальный стиль. Ваш идеальный кадр уже ждёт своего оператора, нужно лишь подобрать к нему правильный ключ. Удачи в творческих поисках и пусть каждая генерация радует глаз!