Знакома ли вам ситуация, когда вместо живого, дышащего снимка нейросеть выдает «пластиковую» картинку с безжизненным взглядом? Сеть буквально наводнена изображениями, которые с первого взгляда выдают своё искусственное происхождение: слишком гладкая кожа, неестественный блеск, странная анатомия и свет, которого не бывает в природе. Многие пользователи, впервые открыв тот же Midjourney или Stable Diffusion, грезят о шедеврах уровня National Geographic, но натыкаются на стену непонимания алгоритмов. Казалось бы, достаточно написать «красивая девушка» или «закат в горах», но машина воспринимает эти слова совсем не так, как человеческий мозг. Ведь для алгоритма красота – понятие математическое, усреднённое, а потому часто скучное и рафинированное. А вся суть в том, что реализм кроется в несовершенствах, текстурах и правильном техническом описании, словно вы ставите задачу не художнику, а профессиональному оператору. Поэтому перед генерацией стоит глубоко погрузиться в технические нюансы фотоискусства.
Стоит ли учить матчасть?
Безусловно. Без понимания основ фотографии получить добротный результат довольно сложно. ИИ обучался на миллионах снимков, у которых были метаданные: модель камеры, объектив, настройки диафрагмы и тип пленки. Если вы не укажете эти детали, нейросеть выберет их сама, и, поверьте, её выбор вас вряд ли обрадует. Она тяготеет к усреднённым, «коммерческим» вариантам. Поэтому первое правило реализма – говорить на языке фотографов. Не пишите просто «фото», пишите, на что это снято. Разница между снимком на смартфон и кадром, сделанным на полнокадровую зеркальную камеру, для нейросети колоссальна.
Технические параметры: Камера и оптика
Выбор оборудования здесь играет первую скрипку. Хотите получить резкий, детализированный портрет, где видна каждая пора? Используйте в промте названия топовых камер. Отлично работает связка «Sony A7R IV» или «Canon EOS R5». Эти камеры ассоциируются в базе данных нейросети с высоким разрешением и бритвенной резкостью. А вот если ваша цель – уличная фотография с налетом репортажности, то лучшим решением станет упоминание «Leica M10» или «Fujifilm X-T4». Сразу меняется характер картинки: появляются, возможно, лёгкие шумы, но атмосфера становится более живой.
Но одной камеры мало. Ключевую роль играет объектив. Нужен классический портрет с размытым фоном (боке)? Укажите фокусное расстояние «85mm» или «100mm». Апертура при этом должна быть широкой, например, «f/1.8» или даже «f/1.2». Это даст ту самую малую глубину резкости, которая отделяет объект от фона. Для пейзажей же стоит выбирать «wide angle», «16mm» или «24mm» с закрытой диафрагмой «f/8» или «f/11», чтобы все планы были в фокусе. Впрочем, иногда хочется экспериментов. Попробуйте вписать «fisheye lens» для создания искажённой, но эффектной перспективы.
Как работать со светом?
Свет – это кисть фотографа, и в генерациях он солирует. Довольно часто новички игнорируют описание освещения, получая плоскую картинку. А ведь вариантов здесь – настоящий кладезь. Самый простой и беспроигрышный вариант – «natural lighting» (естественное освещение). Но он может быть скучным. Чтобы добавить драмы, используйте «cinematic lighting» (кинематографичное освещение) или «rembrandt lighting» (свет Рембрандта), который создаёт характерный треугольник света на щёке модели в портрете.
Для уличных кадров прекрасно подходит «golden hour» (золотой час) – время перед закатом, когда свет становится мягким и тёплым. Противоположность ему – «blue hour» (синий час), сумерки, дающие холодную, мистическую атмосферу. Если же вы хотите получить студийный эффект, смело пишите «studio lighting», «softbox» или «rim light» (контровой свет), который очерчивает силуэт. И не стоит забывать про «volumetric lighting» (объёмный свет) – это те самые красивые лучи, пробивающиеся сквозь пыль или туман. Выглядит впечатляюще.
Живая кожа и текстуры
Самый главный маркер ИИ – пластиковая кожа. Избавиться от неё – задача не из лёгких. Но решаемая. Здесь нужно буквально заставить нейросеть рисовать несовершенства. Слова-маркеры, которые творят чудеса: «skin texture» (текстура кожи), «detailed skin» (детализированная кожа), «pores» (поры), «wrinkles» (морщины), «freckles» (веснушки), «moles» (родинки). Не бойтесь добавлять «hyperrealistic», но с этим термином нужно быть осторожным, иногда он уводит в гипертрофированную, нарисованную 3D-графику.
Лучше использовать термин «raw photo» (сырое фото). Это даёт команду сети не применять встроенные «улучшайзеры» и фильтры постобработки. Картинка становится честнее. Ещё один нюанс – макияж. Если не указать «no makeup» или «natural look», ИИ по умолчанию накрасит модель так, словно она собралась на красную дорожку. А для мужских портретов отлично подходят уточнения вроде «stubble» (щетина) или «scar» (шрам), добавляющие брутальности и истории образу.
Примеры готовых промтов: Портрет
Перейдём от теории к практике. Допустим, нам нужен атмосферный портрет девушки в кафе. Обыватель напишет: «Girl in cafe drinking coffee, realistic». Результат будет посредственным. А вот как это сделает профи. Начать нужно с главного объекта, затем добавить окружение, технику и свет.
Промт: «Close-up portrait of a young woman with freckles looking out of a window in a cozy cafe, rain on glass, holding a cup of steaming coffee, shot on 35mm film, Kodak Portra 400, soft natural lighting, depth of field, detailed skin texture, cinematic mood, 8k».
Здесь мы указали плёнку (Kodak Portra 400), которая даёт приятные, тёплые скин-тоны и лёгкое зерно. Упоминание дождя на стекле (rain on glass) создаёт антураж и добавляет деталей переднему плану.
А если нужен мужской портрет?
Промт: «Portrait of an elderly fisherman with a white beard, wearing a yellow raincoat, storm at sea background, rough weathered skin, deep wrinkles, intense gaze, shot on Sony A7R IV, 85mm f/1.8, dramatic lighting, gloomy atmosphere, hyper-detailed, sharp focus».
В этом случае акцент сделан на текстурах (rough weathered skin, deep wrinkles) и драматичном освещении. Результат гарантированно будет фактурным, а не «замыленным».
Уличная фотография и репортаж
Сложно ли имитировать случайный кадр? Да, но именно случайность делает фото живым. Тут на помощь приходят параметры размытия и движения.
Промт: «Busy Tokyo street crossing at night, neon lights reflecting in puddles, crowd of people walking with umbrellas, motion blur, bokeh, shot on Leica M10, street photography style, vibrant colors, candid shot, high contrast».
Слово «candid shot» (случайный кадр) здесь ключевое. Оно заставляет ИИ избегать постановочных поз, когда модели смотрят прямо в камеру. А «motion blur» (размытие в движении) добавляет динамики, ведь в реальности люди и машины не замирают по стойке смирно.
Еда и предметная съёмка
Фуд-фотография – это отдельный вид искусства. Блюдо должно вызывать аппетит, а не подозрение. Главное здесь – макросъёмка и свет.
Промт: «Gourmet burger on a wooden board, melting cheese, steam rising, fresh lettuce, macro photography, shot on Canon EOS 5D Mark IV, 100mm macro lens, studio lighting, shallow depth of field, food styling, delicious, 8k resolution».
Обратите внимание на детали: «melting cheese» (плавящийся сыр) и «steam rising» (поднимающийся пар). Именно такие мелочи продают кадр. «Shallow depth of field» (малая глубина резкости) размоет задний план, сосредоточив внимание зрителя на фактуре еды.
Плёночная эстетика: Ретро
Сейчас в моде 90-е и плёночные цвета. Чтобы получить такой эффект, не обязательно накладывать фильтры потом. Можно сгенерировать сразу «под плёнку».
Промт: «Group of friends laughing at a beach bonfire party, sunset, vintage clothing, 1990s aesthetic, shot on Polaroid camera, flash photography, harsh shadows, film grain, vignette, nostalgic vibe, slightly blurry».
В этом запросе «flash photography» (съёмка со вспышкой) и «harsh shadows» (резкие тени) создают тот самый эффект любительской мыльницы, который так ценится за свою искренность. А «slightly blurry» (слегка размытый) уберёт цифровую стерильность.
Что портит реализм?
Нередко пользователи сами загоняют нейросеть в тупик. Львиная доля ошибок приходится на перегруженные промты. Не стоит писать «4k, 8k, 16k, 32k, best quality, masterpiece» всё подряд через запятую по десять раз. Это создаёт шум. Достаточно одного-двух уточнений качества. Ещё один враг – противоречивые команды. Нельзя требовать одновременно «sunny day» (солнечный день) и «midnight» (полночь), если только вы не снимаете на Аляске или в сюрреализме. Но мы ведь говорим о реализме.
Также избегайте абстракций. Слова «beautiful», «amazing», «cool» для ИИ слишком размыты. Лучше описать, что именно делает объект красивым: симметрия, цвета, освещение. И, конечно же, не забывайте про негативные промты (Negative Prompts). В большинстве интерфейсов есть специальное поле, куда стоит вписать то, чего вы НЕ хотите видеть: «cartoon, drawing, illustration, 3d render, plastic skin, deformed hands, extra fingers, blur, low quality». Это своего рода спасательный круг, отсекающий мусорные варианты.
Стиль и композиция
Композиция кадра влияет на восприятие не меньше, чем свет. Правило третей, золотое сечение – эти постулаты работают и здесь. Можно прямо указывать: «rule of thirds» (правило третей) или «centered composition» (центрированная композиция).
Угол обзора тоже важен.
«Low angle shot» (съёмка с нижнего ракурса) делает объект величественным, визуально увеличивая его.
«High angle shot» (съёмка сверху) может показать уязвимость или общий план местности.
«Drone shot» или «Aerial view» (вид с дрона) незаменимы для архитектуры и пейзажей.
Кстати, если вы хотите получить фото конкретного здания или места, добавьте год постройки или стиль. Например, «Soviet brutalism architecture» (советский архитектурный брутализм) даст совершенно иную текстуру бетона и формы, чем просто «concrete building».
Пейзажи: От Исландии до Марса
Природа в исполнении ИИ часто грешит излишней насыщенностью. Трава становится кислотно-зелёной, а небо – неестественно синим. Чтобы приземлить картинку, используйте эпитеты вроде «desaturated colors» (ненасыщенные цвета), «moody» (мрачный/атмосферный), «foggy» (туманный).
Пример промта для пейзажа: «Majestic mountains in Iceland, black sand beach, overcast sky, stormy ocean waves, mist, mossy rocks, shot on Fujifilm GFX 100, wide angle lens, landscape photography, realistic colors, highly detailed».
Словосочетание «overcast sky» (пасмурное небо) даёт мягкий, рассеянный свет, который выглядит гораздо реалистичнее, чем яркое солнце в зените с жёсткими тенями.
Важен ли порядок слов?
Да, это имеет значение. В начале промта должны стоять самые важные объекты и характеристики. Нейросеть уделяет больше внимания первым словам. Если вы напишете «мужчина в шляпе» в конце длинного описания леса, шляпа может и не появиться. Поэтому структура «Объект -> Действие -> Окружение -> Технические детали» работает наиболее стабильно. Но это не догма, а скорее рекомендация. Экспериментировать никто не запрещает.
И всё же, почему получается плохо?
Бывает, что вы использовали все правильные слова, камеру указали, свет выставили, а результат всё равно удручающий. Дело в том, что генерация – это рандом. Иногда нужно нажать кнопку «Generate» десять, двадцать раз, чтобы алгоритм сложил пазл правильно. Не стоит опускать руки после первой попытки. Изменяйте веса слов (в Midjourney это делается через двоеточие, например «fog::2»), меняйте сиды (seed) или слегка перефразируйте запрос. Процесс не быстрый, но увлекательный. К тому же, современные модели обновляются регулярно, и то, что было сложно месяц назад, сегодня делается в один клик.
Маленькие хитрости для большого реализма
Есть пара приёмов, которые используют профи, но о которых редко говорят.
Первое – добавление шума. Промт «film grain» или «iso 800» (и выше) добавляет картинке зернистость. Идеальная чистота цифры выдаёт подделку, а лёгкий шум обманывает мозг, заставляя верить в аналоговое происхождение кадра.
Второе – хроматические аберрации. Звучит страшно, но промт «chromatic aberration» добавляет лёгкие цветовые искажения по краям объектов, что свойственно реальной оптике. Это тот самый нюанс, который отличает рендер от фото.
Ну и, наконец, глубина резкости. Управляйте фокусом. Размытый фон скрывает огрехи генерации заднего плана, которые часто всплывают при детальном рассмотрении. Промт «bokeh» или «depth of field» – ваши лучшие друзья в портретной съёмке.
Подводные камни
Не стоит забывать и про этические моменты, а также ограничения самих нейросетей. Они всё ещё плохо рисуют руки, текст и сложные взаимодействия множества людей. Если промт предполагает переплетение пальцев или сложную позу йоги, готовьтесь к анатомическим курьёзам. В таких случаях лучше упростить задачу или генерировать изображение по частям (Inpainting), исправляя ошибки точечно. Также нейросети имеют встроенные фильтры цензуры, поэтому некоторые запросы могут быть заблокированы. Но для создания художественного реалистичного фото это редко становится проблемой.
Смешивание стилей
Интересные результаты получаются при смешивании несовместимого. Попробуйте объединить «cyberpunk» и «1950s fashion». Или «medieval knight» и «paparazzi shot». Такой контраст часто рождает уникальные образы, которые выглядят пугающе реалистично именно за счёт своей абсурдности, поданной в фотореалистичной обёртке. Главное – сохранять техническую часть промта (камера, свет) неизменной, меняя только сюжетную составляющую.
Эксперимент – двигатель прогресса
В конечном счёте, идеального промта не существует. Есть лишь бесконечное поле для экспериментов. Копируйте чужие промты, разбирайте их на части, меняйте переменные и смотрите, как реагирует нейросеть. Это похоже на обучение игре на музыкальном инструменте: сначала вы играете гаммы, а потом начинаете импровизировать. Ваша цель – нащупать тот стиль и тот набор ключевых слов, который будет выдавать стабильный результат именно для ваших задач. И помните, что нейросеть – это всего лишь инструмент, мощный, но безвольный. Душа фотографии по-прежнему исходит от человека, который формулирует запрос.
Секрет успеха кроется в деталях, насмотренности и терпении. Не бойтесь тратить время на подбор параметров. Каждый неудачный кадр приближает вас к пониманию логики машины. А когда вы увидите на экране изображение, которое невозможно отличить от работы профессионального фотографа, вы поймёте, что магия существует. И эта магия – в ваших руках и словах. Удачных вам генераций, и пусть каждый ваш промт превращается в маленький визуальный шедевр, который удивит даже самых придирчивых критиков.