Почему вместо живого человека нейросеть упорно рисует пластиковую куклу с безжизненным взглядом, даже если вы попросили «максимальное качество»? Этот вопрос задаёт себе каждый, кто хоть раз пытался сгенерировать портрет или пейзаж, надеясь обмануть зрителя. В сети представлено множество руководств, обещающих золотые горы, но на практике мы часто получаем перешарплённые, неестественно гладкие изображения, которые за версту отдают компьютерной графикой. Проблема кроется не в самой технологии, а в том, как мы формулируем свои желания. Ведь ИИ, по своей сути, — это джинн, исполняющий приказы буквально, и понятие «красиво» у него весьма специфическое, часто тяготеющее к усреднённому глянцу. Но чтобы получить результат, от которого по спине пробегут мурашки узнавания, нужно научиться говорить на языке оптики, физики света и плёночного зерна.
Стоит ли усложнять запрос?
Многие полагают, что чем длиннее промт, тем лучше результат. Это довольно распространённое заблуждение. Нагромождение эпитетов часто сбивает алгоритм с толку, превращая картинку в кашу из стилей. Секрет фотореализма кроется не в количестве слов, а в их точности. Нам нужно имитировать процесс реальной съёмки. С чего начинается работа фотографа? С выбора камеры и плёнки. Именно эти параметры задают тон всему изображению. Если вы просто напишете «photo of a girl», нейросеть выдаст усреднённый цифровой снимок. А вот если уточнить технические детали, магия начнёт работать. К первой группе обязательных уточнений относится тип плёнки. Например, упоминание «Kodak Portra 400» мгновенно добавит тёплых, естественных оттенков коже и приятное зерно. Далее следует оптика. Указание «85mm lens» сообщит системе, что это портрет с правильными пропорциями лица, а не искажённое селфи, снятое на широкий угол. Ну и, наконец, диафрагма. Значение «f/1.8» обеспечит то самое красивое размытие фона (боке), которое так ценится в профессиональной среде.
Свет и атмосфера
Сложно ли выставить свет в виртуальной студии? Да, но результат того стоит. Плоский, фронтальный свет убивает объём. Это аксиома. Чтобы избежать эффекта «паспорта», стоит использовать схемы освещения из реальной жизни. Один из самых выигрышных вариантов — «cinematic lighting» или «dramatic lighting». Это сразу создаёт глубину. Но можно пойти дальше и использовать естественные источники. Словосочетание «golden hour» (золотой час) зальёт кадр тёплым закатным светом, создавая длинные тени и объём. А если хочется чего-то более мрачного и фактурного, отлично подойдет «overcast» (пасмурная погода) или «volumetric lighting» (объёмный свет), который прорисовывает лучи в тумане или пыли. Разумеется, не стоит забывать и про направление света. «Backlighting» (контровой свет) создаст светящийся контур вокруг объекта, отделяя его от фона. К слову, именно работа со светом часто отличает любительский промт от профессионального.
Текстура кожи
Идеальная кожа — главный враг реализма. В природе не существует лиц без пор, микроморщинок или родинок. Глянцевая гладкость, которую так любят нейросети по умолчанию, мгновенно выдаёт искусственное происхождение кадра. Чтобы сбить этот «пластиковый» лоск, нужно принудительно вводить несовершенства. В промт стоит добавить такие маркеры, как «skin texture», «highly detailed pores», «freckles» (веснушки) или даже «skin imperfections». Это довольно просто, но эффект колоссальный. Зритель, видя неровности кожи, подсознательно верит в реальность происходящего. Тем более, что современные модели (вроде Midjourney v6 или Flux) научились отрисовывать эти нюансы с пугающей достоверностью. Однако здесь важно не переборщить. Если перегрузить запрос деталями, лицо может превратиться в карту лунной поверхности. Баланс — вот что действительно важно.
Промты для женского портрета
Разберём конкретный пример, чтобы теория не висела в воздухе. Допустим, нам нужен атмосферный портрет девушки у окна в дождливый день. Если написать просто «девушка у окна, дождь», мы получим скучную картинку. А теперь попробуем собрать конструктор, используя знания о плёнке и свете.
Начнём с объекта и действия: «Candid photo of a young woman looking out a window with raindrops». Слово «candid» (случайный кадр) очень важно — оно убирает неестественное позирование.
Добавляем технические параметры: «shot on 35mm Fujifilm Superia 400, 50mm lens, f/2.8». Плёнка Fujifilm даст приятный зелёновато-холодный оттенок, уместный для дождя.
Уточняем детали внешности и текстуры: «natural skin texture, messy hair, cozy oversized knitted sweater». «Messy hair» (растрепанные волосы) добавляют жизни.
И, наконец, свет и атмосфера: «gloomy day lighting, soft shadows, melancholic atmosphere, cinematic composition».
Итоговый промт будет выглядеть так:
«Candid photo of a young woman looking out a window with raindrops, natural skin texture, messy hair, wearing a cozy oversized knitted sweater, shot on 35mm Fujifilm Superia 400, 50mm lens, f/2.8, gloomy day lighting, soft shadows, melancholic atmosphere, cinematic composition –style raw –v 6.0»
Параметр --style raw (для Midjourney) здесь критически важен. Он отключает встроенную «украшалку» нейросети, делая фото более честным и менее художественным.
Мужской портрет и возрастные детали
С мужскими портретами история немного другая. Здесь мы можем позволить себе более жёсткий свет и резкие текстуры. Возьмем задачу: портрет пожилого рыбака. Нам нужно передать историю через морщины и взгляд.
Основа: «Close-up portrait of an old bearded fisherman looking at the horizon».
Детализация: «weathered skin, deep wrinkles, detailed eyes, salt in beard». Слово «weathered» (обветренная) творит чудеса при генерации текстуры кожи стариков.
Техника: «shot on Kodak Tri-X 400 (black and white film), high contrast, Hasselblad camera, 80mm lens». Чёрно-белая плёнка с высоким контрастом подчеркнёт драматизм.
Свет: «harsh sunlight, side lighting, dramatic shadows». Жёсткий боковой свет выявит каждую морщинку, создавая тот самый фактурный рельеф.
Готовый вариант:
«Close-up portrait of an old bearded fisherman looking at the horizon, weathered skin, deep wrinkles, detailed eyes, salt in beard, wearing a wool beanie, shot on Kodak Tri-X 400 black and white film, high contrast, Hasselblad camera, 80mm lens, harsh sunlight, side lighting, dramatic shadows, hyperrealistic details –ar 4:5 –style raw»
Обратите внимание на соотношение сторон (--ar 4:5). Вертикальный кадр для портрета выглядит привычнее и естественнее.
Предметная съёмка и еда
А что, если нам нужны не люди? Фуд-фотография — это отдельный жанр, где реализм достигается за счёт аппетитности и микродеталей. Нейросети часто рисуют еду слишком идеальной, пластиковой. Наша задача — добавить «съедобности». Здесь на помощь приходят слова, описывающие физическое состояние продукта: «steam» (пар), «melting» (тающий), «crumbs» (крошки), «condensation on glass» (конденсат на стекле).
Представим утренний кофе с круассаном.
Объект: «Freshly baked croissant and a cup of cappuccino on a wooden table».
Детали: «flaky texture, steam rising, crumbs on the table, latte art».
Техника: «macro photography, shot on Canon R5, 100mm macro lens, depth of field». Макро-объектив размоет фон и сфокусируется на текстуре выпечки.
Свет: «morning sunlight through blinds, warm tones, cozy atmosphere».
Собираем всё вместе:
«Macro photography of a freshly baked croissant and a cup of cappuccino on a rustic wooden table, flaky texture, steam rising from coffee, crumbs on the table, condensation on the spoon, shot on Canon R5, 100mm macro lens, depth of field, morning sunlight through blinds, warm tones, cozy atmosphere, photorealistic food photography –v 6.0»
Кстати, упоминание конкретной камеры (Canon R5) иногда помогает задать определённый цветовой профиль, свойственный этому бренду, хотя это и не всегда срабатывает на 100%.
Городские пейзажи и стрит-фото
Уличная фотография требует динамики. Здесь статика губительна. Город должен жить. Машины должны ехать (с размытием в движении), люди — спешить. Один из приёмов — использование «motion blur» (размытие в движении). Также отлично работает ночная съёмка с неоном.
Попробуем создать киберпанк-атмосферу, но реалистичную, как будто это кадр из фильма 80-х, а не компьютерная игра.
Сцена: «Night street in Tokyo, wet asphalt reflecting neon signs».
Детали: «crowd of people with umbrellas, blurred cars passing by, steam from street food stalls».
Техника: «Cinestill 800T film, ISO 800, grainy texture, halation effect». Плёнка Cinestill 800T знаменита своим эффектом «halation» (ореолы вокруг источников света), что придаёт ночным снимкам особый шарм.
Промт:
«Night street in Tokyo, wet asphalt reflecting neon signs, crowd of people with umbrellas, blurred cars passing by with motion blur, steam from street food stalls, shot on Cinestill 800T film, ISO 800, grainy texture, halation effect around lights, cinematic street photography, realistic lighting –ar 16:9 –style raw»
Формат 16:9 сразу отсылает нас к кинематографу, заставляя воспринимать кадр как стоп-кадр из фильма.
Архитектура и интерьеры
С интерьерами дела обстоят сложнее из-за геометрии. Нейросети часто путаются в прямых линиях и перспективе. Однако правильный промт может исправить ситуацию. Главное здесь — «imperfect realization». Идеально убранная комната выглядит как 3D-рендер для каталога IKEA. Жилая комната всегда имеет следы жизни.
Пример запроса для гостиной в стиле «лофт».
Объект: «Spacious loft living room with brick walls and large industrial windows».
Детали жизни: «scattered magazines on coffee table, wrinkled throw blanket on sofa, dust particles in sunbeams». Вот они, наши маркеры реальности — смятый плед и пылинки в лучах света.
Свет: «natural soft lighting, shadows from window frames».
Техника: «wide angle shot, 24mm lens, architectural photography, hyperrealistic texture».
Итоговый вариант:
«Spacious loft living room with brick walls and large industrial windows, scattered magazines on coffee table, wrinkled throw blanket on leather sofa, dust particles in sunbeams, plants in corners, wide angle shot, 24mm lens, architectural photography, hyperrealistic texture, natural soft lighting, shadows from window frames –v 6.0»
Такой подход превращает стерильную картинку в уютное помещение, где хочется находиться.
Распространённые ошибки
Чего не стоит делать? Во-первых, не стоит смешивать несовместимое. Запрос «realistic photo, oil painting style» (реалистичное фото, стиль масляной живописи) введёт нейросеть в ступор. Вы получите ни то, ни другое. Во-вторых, избегайте слов-паразитов вроде «4k», «8k», «Unreal Engine» при попытке создать именно фотографию. Эти токены тяготеют к стилистике компьютерной графики (CGI). Они дают чёткость, но убивают фотореализм. Нам же нужна «фотографическая» чёткость, а она всегда чуть мягче. Ну и, конечно же, не стоит забывать про параметр веса (если платформа позволяет) или порядок слов. То, что стоит в начале промта, имеет для алгоритма наибольший вес. Поэтому, если вам важен свет, не ставьте его описание в самый конец после перечисления цвета шнурков на ботинках.
Стиль «Found Footage»
Отдельно стоит упомянуть стиль «найденной плёнки» или любительского фото. Это высший пилотаж реализма, так как такие кадры намеренно несовершенны. Они могут быть не в фокусе, с заваленным горизонтом или засветами. Для достижения такого эффекта используются такие слова, как «GoPro footage», «CCTV footage» (камера наблюдения), «disposable camera» (одноразовая камера) или «Polaroid».
Пример для имитации старого снимка с вечеринки:
«Flash photography from a 90s house party, group of friends laughing, red eyes effect, motion blur, harsh flash shadow, shot on disposable Kodak camera, vintage aesthetic, slightly out of focus, candid moment –ar 4:3»
Именно «harsh flash shadow» (жёсткая тень от вспышки) — визитная карточка любительской съёмки «мыльницей». Этот приём мгновенно продаёт мозгу идею о том, что фото настоящее.
Итоговый чек-лист
Запомнить все комбинации невозможно, да и не нужно. Главное — уловить логику построения. Сначала определяем сюжет. Затем выбираем «оборудование» (камеру, плёнку, объектив). После этого выставляем свет. И обязательно, слышите, обязательно добавляем «грязь» — текстуры, несовершенства, случайные детали. Именно эти мелочи делают изображение живым. Ведь в реальном мире нет ничего абсолютно идеального. И именно в этом его красота.
Ваши промты — это не просто набор слов, а режиссёрский сценарий. Пробуйте разные плёнки, играйте с фокусным расстоянием, меняйте время суток. Иногда замена одного слова, например, «sunlight» на «moonlight», полностью меняет восприятие кадра. Удачный кадр часто рождается из ошибки или смелого эксперимента, так что не бойтесь нарушать правила и смешивать стили. Пусть каждый сгенерированный кадр станет маленьким открытием.