Казалось бы, что может быть проще: вводишь пару слов в строку генерации, нажимаешь кнопку и получаешь шедевр, достойный обложки глянцевого журнала? Однако на практике обыватель довольно часто сталкивается с пластмассовыми лицами, странной анатомией и светом, который нарушает все законы физики. Многие новички грезят о создании гиперреалистичных кадров, но вместо этого получают лишь отдалённо напоминающие реальность картинки, пропитанные «цифровым шумом». Разочарование наступает мгновенно, а кредиты на генерацию тают на глазах. Но чтобы не ошибиться и получить действительно качественный результат, нужно научиться говорить с нейросетью на языке профессионального фотографа.
С чего начинается реализм?
С определения базы. Фундамент любого промта — это не просто описание объекта, а контекст, в который он помещён. Скупой запрос «девушка в парке» нейросеть поймет буквально, выдав усреднённый и довольно скучный образ. А вот если добавить деталей, результат изменится кардинально. Сначала стоит определить главного героя снимка. Кто это? Какого возраста? Во что одет? Но одного героя мало. Ведь окружение играет не меньшую роль.
И тут на сцену выходит детализация. Львиная доля успеха зависит от того, насколько скрупулёзно вы опишете сцену. Это не значит, что нужно писать роман в трёх томах. Нет. Важно задать правильные векторы. К примеру, описание текстуры кожи (skin texture), наличие пор (pores), мелких морщинок или веснушек мгновенно оживляет портрет. Нейросети нужно прямо сказать, что вы хотите видеть «высокую детализацию» (highly detailed) и «реалистичность» (photorealistic). К слову, использование слова «masterpiece» (шедевр) хоть и стало клише, но всё же иногда помогает подтянуть общее качество картинки. Впрочем, полагаться только на эпитеты не стоит. Куда важнее технические параметры.
Технические параметры: Камера и объектив
Сложно ли имитировать работу реальной оптики? Да, но результат того стоит. Нейросеть обучена на миллионах фотографий, и она прекрасно знает, как выглядит кадр, снятый на определенную технику. Если вы хотите получить классический портрет с красивым размытием фона (боке), укажите фокусное расстояние 85mm или 100mm. Это золотой стандарт портретной фотографии. Апертура, или диафрагма, тоже имеет значение. Значение f/1.8 или f/1.4 даст мягкий фокус и отделит объект от фона.
А если нужен пейзаж или архитектура? Тут выручит широкоугольный объектив. Укажите 24mm или даже 16mm для захвата большего пространства. Не стоит забывать и о брендах камер, ведь каждая из них имеет свой цветовой профиль. Упоминание «Sony A7R IV» добавит резкости и холодных тонов, а «Canon EOS R5» сделает картинку более теплой и мягкой. Для любителей винтажа и плёночной эстетики спасательным кругом станут названия плёнок: «Kodak Portra 400» для естественных скинтонов или «Fujifilm Superia» для насыщенных зелёных оттенков. Это же правило касается и формата. Указание «shot on 35mm» (снято на 35мм плёнку) добавит характерное зерно и антураж старого кино.
Свет и атмосфера
Без хорошего света даже самая дорогая камера выдаст посредственный результат. В мире генеративной графики это правило работает безотказно. Свет формирует настроение. Хотите драмы? Используйте «cinematic lighting» (кинематографичное освещение) или «rembrandt lighting» (свет Рембрандта) с глубокими тенями и контрастом. Это придаст объём лицу и сделает кадр выразительным. Для нежных женских портретов лучше подойдёт «soft box lighting» (свет софтбокса) или «natural window light» (естественный свет из окна).
Отдельно стоит упомянуть время суток. «Golden hour» (золотой час) зальёт кадр тёплым закатным солнцем, создавая романтичную атмосферу. «Blue hour» (синий час) добавит загадочности и холода, идеально подходя для городских пейзажей. А вот если вы хотите получить эффект студийной съёмки, смело пишите «studio lighting», «rim light» (контровой свет) и «volumetric lighting» (объёмный свет). Последний, кстати, создает красивые лучи, пробивающиеся сквозь дымку или пыль. Тем более, что правильная работа со светом позволяет скрыть огрехи генерации и сфокусировать внимание зрителя на главном.
Композиция кадра
Как расположить объект в кадре? Можно довериться случаю, но лучше взять управление в свои руки. Самый простой и надёжный вариант — «centered composition» (центральная композиция). Объект будет находиться ровно посередине, что создает ощущение стабильности и симметрии. Но если хочется динамики, стоит попробовать «rule of thirds» (правило третей). Сдвинув героя чуть в сторону, вы получите более живой и естественный кадр.
Ракурс тоже играет огромную роль. «Low angle» (нижний ракурс) сделает объект визуально больше и величественнее, придаст ему значимости. «High angle» (верхний ракурс), наоборот, заставит героя выглядеть беззащитным или маленьким. Для макросъёмки насекомых или деталей глаз используйте «macro shot» (макросъёмка) и «extreme close-up» (экстремально крупный план). А если нужно показать масштаб сцены, выручит «wide shot» (широкий план) или «aerial view» (вид с воздуха). И всё же, не стоит перегружать промт противоречивыми командами композиции. Лучше выбрать один чёткий вектор.
Одежда и стиль
Наряды персонажей — это отдельная песня. Чтобы избежать «наляпистости» и странных фасонов, описывайте одежду конкретно. Вместо простого «платье», напишите «red silk evening gown» (красное шёлковое вечернее платье) или «vintage leather jacket» (винтажная кожаная куртка). Указание материалов (шёлк, деним, кожа, хлопок) помогает нейросети правильно прорисовать текстуры и складки.
Стиль самого изображения тоже можно задать. «Street style photography» (уличная фотография) даст живые, случайные кадры. «Fashion photography» (фэшн-фотография) предполагает модельные позы, экстравагантную одежду и идеальный макияж. «Documentary photography» (документальная фотография) сделает акцент на реализме, эмоциях и повествовании без прикрас. Ну и, конечно же, «black and white photography» (чёрно-белая фотография) — бессмертная классика, которая добавляет драматизма и убирает отвлекающие цвета. Кстати, стилизация под известные журналы, например «Vogue editorial» или «National Geographic style», тоже работает отлично, задавая высокую планку качества.
Структура идеального промта
Собирать промт нужно как конструктор. Хаотичный набор слов редко дает добротный результат. Логика здесь проста: сначала главное, потом детали. Начать нужно с типа изображения (фотография). Далее следует описание субъекта (кто или что). Затем идёт описание действия (что делает). После этого добавляем окружение (где находится). Следом прописываем освещение и атмосферу. И в самом конце добавляем технические параметры (камера, объектив, стиль).
Такой подход позволяет разложить всё по полочкам и дать нейросети четкую инструкцию. Примерная схема выглядит так: [Тип изображения] of [Субъект] wearing [Одежда], doing [Действие], in [Окружение], [Освещение], [Ракурс], [Технические детали]. Разумеется, порядок может слегка варьироваться, но суть остается неизменной. Важное всегда стоит в начале. Ведь нейросеть уделяет первым словам наибольшее внимание.
Примеры готовых решений: Портрет
Перейдем от теории к практике. Допустим, вам нужен классический, глубокий портрет пожилого мужчины. Мы хотим видеть каждую морщинку, мудрость в глазах и кинематографичный свет. Промт будет выглядеть примерно так:
“Hyper-realistic portrait of an elderly fisherman with a white beard, wearing a yellow raincoat, standing on a stormy pier, rain drops on face, intense gaze looking at camera, dramatic cinematic lighting, gloomy atmosphere, ocean waves in background, shot on Sony A7R IV, 85mm lens, f/1.8, highly detailed skin texture, 8k resolution, raw photo.”
Здесь мы указали профессию (рыбак), одежду (дождевик), погоду (шторм), эмоцию (интенсивный взгляд) и технические параметры. Результат будет внушительным.
А теперь попробуем создать нежный женский портрет. Нам нужна лёгкость, весна и мягкость.
“Close-up portrait of a young woman with freckles and messy red hair, wearing a white linen dress, surrounded by blooming cherry blossom trees, soft natural sunlight filtering through leaves, bokeh background, dreamy atmosphere, shot on Canon EOS R5, 50mm lens, f/1.4, soft focus, film grain, Kodak Portra 400 style.”
Этот запрос даст воздушную картинку с красивым размытием и тёплыми цветами.
Примеры готовых решений: Пейзаж и архитектура
Представьте, что вы хотите получить фото футуристичного города, но чтобы он выглядел как настоящий, а не как рисунок.
“Futuristic cyberpunk city street at night, neon lights reflecting in puddles on asphalt, heavy rain, towering skyscrapers with holograms, people walking with transparent umbrellas, realistic atmosphere, volumetric fog, shot on 24mm wide angle lens, high contrast, ray tracing, unreal engine 5 render style, photorealistic, 8k.”
Упоминание «ray tracing» и «unreal engine» часто помогает добавить технологичной реалистичности.
Для любителей природы и спокойствия подойдёт следующий вариант. Представьте туманное утро в горах.
“Majestic mountain landscape at sunrise, fog rolling over a pine forest, calm lake reflection, snow-capped peaks, golden hour lighting, hyper-realistic, wide angle shot, high dynamic range (HDR), nature photography, National Geographic style, sharp details, no people.”
Такой промт создаст детализированный пейзаж, который можно смело ставить на рабочий стол.
Примеры готовых решений: Предметная съёмка
Иногда нужно красиво снять еду или товар. Нейросети отлично справляются и с этим. Например, аппетитный бургер.
“Professional food photography of a juicy gourmet beef burger with melted cheese, lettuce, and tomatoes, on a wooden rustic table, dark moody background, steam rising, delicious, appetizing, studio lighting, macro shot, 100mm lens, shallow depth of field, sharp focus on meat, 4k.”
Обратите внимание на слова «juicy» (сочный), «steam rising» (поднимающийся пар) и «studio lighting». Они создают тот самый «вкусный» вид.
Или, скажем, флакон дорогих духов.
“Elegant glass perfume bottle on a black marble podium, surrounded by white orchid flowers, luxury product photography, dramatic rim lighting, reflection, gold accents, sophisticated atmosphere, clean composition, high resolution, advertising shot.”
Слова «luxury» (роскошь) и «podium» (подиум) сразу задают премиальный тон изображению.
Нюансы и подводные камни
Однако не всё так гладко в датском королевстве. Генерация рук и пальцев — это давняя боль всех любителей нейросетей. Махинации с конечностями происходят постоянно: то шесть пальцев, то рука растёт из спины. Чтобы минимизировать этот эффект, старайтесь либо не включать руки в кадр (close-up portrait), либо использовать негативный промт. Это специальное поле, куда вписывается то, чего быть НЕ должно.
Текст на изображениях — ещё одна беда. Нейросети пока плохо «умеют» в буквы. Вместо осмысленных надписей вы, скорее всего, получите тарабарщину. Поэтому лучше избегать промтов, требующих конкретных вывесок или надписей на футболках. Глаза тоже могут получиться косыми или асимметричными. Слова «symmetrical eyes» (симметричные глаза) и «detailed iris» (детализированная радужка) в основном промте немного спасают ситуацию. Да и артефакты в виде лишних ног у прохожих на заднем плане — явление нередкое. Тут поможет только перегенерация (reroll) или последующая ретушь в фоторедакторе.
Стоит ли использовать негативный промт?
Безусловно. Это ваш надёжный щит от уродства. В поле Negative Prompt (часто обозначается как параметр –no в Midjourney) стоит вписать стандартный набор «стоп-слов». К слову, многие опытные пользователи копируют один и тот же негативный промт из раза в раз. Он обычно выглядит так:
“ugly, deformed, noisy, blurry, distorted, out of focus, bad anatomy, extra limbs, poorly drawn face, poorly drawn hands, missing fingers, mutation, mutated, low resolution, watermark, text, signature.”
Этот список отсекает львиную долю брака. Он говорит нейросети: «Не делай размыто, не делай криво, убери водяные знаки». Использование негативного промта — это не прихоть, а необходимость, если вы цените своё время и нервы. Ведь гораздо проще сразу запретить ошибки, чем потом пытаться исправить их в фотошопе. Тем более, что это совершенно бесплатно и не требует особых усилий. Просто скопируйте и вставьте.
Реализм или стилизация?
Вопрос, на который нет однозначного ответа. Гиперреализм поражает воображение, заставляя зрителя гадать: фото это или цифра? Но иногда излишняя детализация убивает художественность. Фотография становится сухой и техничной. Стилизация же позволяет передать эмоцию, настроение, идею. Имитация старой плёнки, царапины, засветы — всё это «несовершенства», которые делают кадр живым.
Не бойтесь экспериментировать. Смешивайте стили. Попробуйте снять киберпанк-самурая на плёнку 1950-х годов. Или поместить викторианскую даму в интерьеры космического корабля. Нейросети — это инструмент для творчества, а не просто ксерокс реальности. Иногда именно неожиданное сочетание несочетаемого становится той самой изюминкой, которая приковывает внимание и заставляет разглядывать изображение часами.
Финальные штрихи
После того как изображение сгенерировано, работа не всегда заканчивается. Часто кадр требует цветокоррекции или лёгкого кадрирования (кропа). Иногда имеет смысл прогнать картинку через апскейлер (upscaler) — программу для увеличения разрешения. Это добавит четкости деталям и уберет мыльность. Но база закладывается именно в промте. Чем точнее и красочнее вы опишете свою идею словами, тем ближе к ней будет результат.
Мир промпт-инжиниринга огромен и постоянно меняется. Новые модели выходят чуть ли не каждый месяц, меняя правила игры. Но постулаты композиции, света и описательной части остаются неизменными. Понимание основ фотографии — это тот самый ключ, который открывает дверь в мир качественного AI-арта. Практикуйтесь, пробуйте разные связки слов, меняйте объективы и свет. И рано или поздно вы нащупаете свой уникальный стиль, который будет радовать глаз. Перевоплощение завершено.