Пластиковая кожа, пустой взгляд, неестественный блеск и пальцы, количество которых порой не поддаётся никакой логике, – знакомая картина? С генерацией изображений сталкивался сегодня практически каждый, но получить действительно живой, дышащий кадр удается единицам. Новички часто грешат тем, что просто пишут «красивая девушка» или «реалистичное фото», надеясь на чудо, а в ответ получают глянцевый манекен из витрины магазина одежды. Искусственный интеллект, обученный на миллионах отретушированных снимков, по умолчанию тяготеет к идеализации, сглаживая текстуру и удаляя любые несовершенства, которые как раз и делают нас людьми. Однако спектр возможностей нейросетей не ограничивается созданием «пластиковых кукол», и чтобы добиться пугающей правдоподобности, нужно научиться говорить с машиной на языке профессиональной фотографии.
Что делает портрет живым?
Вопрос отнюдь не риторический. Ведь дело вовсе не в количестве пикселей или разрешении изображения. Весь секрет кроется в несовершенствах. Идеально гладкая кожа существует только на страницах глянца двухтысячных годов, но никак не в реальной жизни. Обыватель, глядя на сгенерированный портрет, подсознательно ищет знакомые маркеры реальности: поры, микроморщинки, пушок на щеках, неравномерный тон кожи или даже лёгкую асимметрию. Если глаз их не находит, мозг моментально вешает ярлык «фейк». Сложно ли убедить нейросеть добавить эти дефекты? Довольно просто, если знать правильные токены. Начинать стоит с отказа от слов вроде perfect, smooth или retouched. Вместо них в ход должны идти raw photo, skin texture, pores, imperfections и detailed skin. Это своего рода сигнал для алгоритма: «Не старайся сделать слишком красиво, сделай правдиво».
Технические параметры
Фотографы годами учатся работать с настройками камеры, а промпт-инженеру достаточно выучить пару строк текста. Но знать их нужно назубок. К слову, простого упоминания «4k» или «8k» уже давно недостаточно для получения фотореализма. Машина должна понимать, на что именно «снят» кадр. Здесь на сцену выходят конкретные модели камер и параметры оптики. Львиная доля успешных портретов генерируется с упоминанием полнокадровых монстров вроде Sony A7R IV или Canon EOS R5. Это задает определенный стандарт резкости и цветопередачи. А вот с объективами история ещё интереснее. Широкий угол (например, 35mm) может исказить черты лица, сделав нос визуально больше, что, впрочем, подходит для комедийных или гротескных образов. Для классического портрета золотым стандартом считается фокусное расстояние 85mm или 100mm. Такой выбор обеспечивает правильные пропорции и красивое размытие фона. Кстати, о размытии. Чтобы отделить модель от заднего плана, стоит добавить параметр диафрагмы, например, f/1.8 или f/2.8. Это добавит глубину, ту самую изюминку, которая отличает профессиональный снимок от фото на паспорт.
Освещение
Свет решает всё. Без грамотного освещения даже самая детализированная модель будет выглядеть плоской. Часто новички забывают прописывать свет, полагаясь на случайность, и получают скучное, равномерное освещение. А ведь вариантов – масса. Хотите драмы? Используйте rembrandt lighting (свет Рембрандта) – это классическая схема с характерным треугольником света на щеке, которая придаёт лицу объём и выразительность. Нужно что-то более мягкое и коммерческое? Тогда ваш выбор – softbox lighting или studio lighting. Естественно, нельзя не упомянуть и натуральный свет. Golden hour (золотой час) подарит тёплые, медовые оттенки, идеально подходящие для романтичных образов на природе, а overcast (пасмурно) обеспечит мягкий рассеянный свет без резких теней, что отлично подходит для мужских брутальных портретов. Интересный нюанс: если добавить cinematic lighting и volumetric lighting, можно получить атмосферные лучи, пробивающиеся сквозь пыль или дымку. Это сразу повышает художественную ценность кадра.
Фокус на деталях: Женский портрет
Давайте перейдём от теории к практике и разберем конкретные сценарии. Представьте, что вам нужно создать портрет молодой девушки, который невозможно отличить от снимка. Задача не из легких. Ведь кожа должна дышать. Здесь нам поможет комбинация описания внешности и технических токенов. Довольно часто пользователи забывают про глаза, а ведь именно они – зеркало души. В промт стоит включить detailed eyes, iris texture и reflection in eyes. Без этих уточнений взгляд может получиться стеклянным.
Если, например, мы хотим получить нежный, утренний образ, запрос может выглядеть следующим образом (внимание на структуру):
Close-up portrait of a young woman with freckles, messy bun hairstyle, wearing a cozy oversized sweater, morning light coming from the window, natural skin texture, visible pores, soft focus, shot on Fujifilm GFX 100, 85mm lens, f/1.8, realistic photography, –v 6.0
Заметьте, здесь нет слова beautiful или sexy, которые часто портят реализм, превращая картинку в арт. Мы описываем факты: веснушки, причёску, свет. Нейросеть сама сделает это красиво, но, главное, правдоподобно.
А что, если задача стоит иначе? Нужно фото пожилой женщины, передающее мудрость и опыт. Здесь мы намеренно усиливаем акцент на текстурах. Промт может трансформироваться в такую конструкцию:
Portrait of an elderly woman, deep wrinkles, weathered skin, kind eyes, wearing traditional shawl, rural background, natural lighting, sharp focus on eyes, highly detailed texture, raw photography, Nikon D850, 50mm lens, –style raw
Использование параметра –style raw (актуально для Midjourney) отключает внутренние «украшательства» нейросети, выдавая максимально честный результат.
Мужской портрет: Характер и брутальность
С мужскими портретами ситуация обстоит несколько проще, так как нейросети охотнее рисуют текстурную мужскую кожу, чем женскую. Однако и здесь есть свои подводные камни. Главное – не скатиться в карикатурную маскулинность. Если переборщить с токенами вроде muscle или strong, можно получить персонажа видеоигры, а не живого человека. Хороший мужской портрет часто строится на контрастах света и тени.
Предположим, мы создаем образ рыбака или путешественника. Здесь уместно добавить грязи, пота или капель дождя. Это сразу добавляет истории. Пример запроса:
Medium shot of a bearded man with a scar on his cheek, wearing a wet raincoat, rainstorm background, raindrops on face, intense look, dark cinematic lighting, high contrast, skin pores, gritty texture, shot on Sony A7R IV, 35mm lens, f/2.8, photorealistic, hyper-detailed
Обратите внимание на gritty texture – это отличный маркер для мужских портретов, добавляющий изображению зернистости и осязаемости. Такой добротный мужской портрет будет выглядеть так, словно его сняли для обложки National Geographic.
Еще один интересный вариант – студийный деловой портрет. Тут уже не нужна грязь, но нужна фактура ткани и кожи. Запрос может звучать так:
Headshot of a confident businessman in a tailored navy blue suit, white shirt, studio grey background, professional lighting, rembrandt lighting, sharp focus, detailed skin texture, pores, beard stubble, 85mm lens, Canon EOS R5, realistic photo
Слово stubble (щетина) работает отлично, создавая естественную небритость, которая выглядит куда натуральнее, чем гладко выбритое пластиковое лицо.
Сложно ли стилизовать под пленку?
Цифра – это хорошо, но плёночная фотография обладает особым шармом, который сейчас снова в моде. Бомонд фотографии сходит с ума по зерну и специфической цветопередаче. Имитировать плёнку в нейросетях – одно удовольствие. Главное достояние плёнки – это зерно и несовершенство цвета. Чтобы получить такой эффект, не нужно придумывать велосипед, достаточно указать название конкретной плёнки. Kodak Portra 400 даст приятные тёплые скинтоны (оттенки кожи) и мягкое зерно. Kodak Gold 200 уведёт цвета в ностальгическую желтизну. А если хочется чёрно-белой классики, то Ilford HP5 Plus – ваш лучший друг.
Попробуем собрать это в единый промт для атмосферного кадра:
Candid photo of a couple laughing in a cafe, through the window glass, reflection of city lights, vintage atmosphere, film grain, noise, shot on Kodak Portra 400, analog photography, slight motion blur, emotional, realistic colors
Токены candid (случайный кадр) и slight motion blur (легкое размытие в движении) творят чудеса. Они убирают статичность, свойственную ИИ. Картинка перестает быть застывшей, в ней появляется динамика жизни. Ведь в реальности мы редко замираем в идеальных позах.
Ошибки, которых стоит избегать
Казалось бы, чем больше слов, тем лучше результат. Но это заблуждение. Проблема «словесного салата» довольно распространена. Не стоит перегружать промт противоречивыми командами. Если вы пишете studio lighting и одновременно natural sunlight, нейросеть может запутаться и выдать нечто среднее и невнятное. Также лучше отказаться от абстрактных понятий вроде feelings of joy (чувство радости), заменив их на конкретные физические проявления: smiling, laughing, tears. Машина понимает визуальные образы, а не философские категории.
Ещё один нюанс – порядок слов. То, что стоит в начале промта, имеет для нейросети больший вес. Поэтому начинать стоит с главного объекта (кто на фото?), затем описывать окружение и детали внешности, а технические параметры камеры и стиля оставлять в хвосте. Если поменять местами камеру и человека, результат может быть неожиданным, вплоть до изображения самой камеры вместо портрета.
Ну и, конечно же, не стоит забывать про соотношение сторон. По умолчанию многие модели выдают квадрат, что не всегда подходит для портрета. Добавление параметра –ar 2:3 (для вертикального) или –ar 16:9 (для кинематографичного горизонтального) существенно меняет восприятие композиции. Вертикальный кадр сразу считывается как классический портрет, а широкий формат отсылает зрителя к кадрам из фильмов.
Эстетичны ли недостатки?
Безусловно. Шрамы, родинки, веснушки, выбившиеся пряди волос, неидеальные зубы – всё это делает персонажа живым. Не скупитесь на описание этих мелочей. Можно добавить gap teeth (щель между зубами) или messy eyebrows (неаккуратные брови). Это может показаться странным, но именно такие детали заставляют зрителя верить в то, что перед ним реальный человек, а не цифровой код. К тому же, это придает характеру уникальность. Промт с токеном perfect symmetrical face (идеальное симметричное лицо) почти гарантированно выдаст скучную, “мёртвую” картинку, которую мы видели тысячи раз. А вот asymmetrical face features (асимметричные черты лица) заставит алгоритм работать интереснее.
Стилизация и окружение
Фон играет не меньшую роль, чем само лицо. White background – это безопасно, но скучно. Попробуйте поместить героя в среду. Busy street background (оживленная улица) добавит динамики и боке (размытия) от городских огней. Old library background создаст интеллектуальную, спокойную атмосферу. При этом важно указать глубину резкости. Если вы не хотите, чтобы фон отвлекал внимание, обязательно используйте depth of field или blurred background. Это отделит модель от окружения, сделав акцент на глазах и эмоциях.
Впрочем, иногда фон должен взаимодействовать с героем. Например, солнечные лучи, проходящие сквозь листву (dappled light), могут создавать красивый узор на лице. Это сложный, но очень эффектный приём. Запрос для такого кадра мог бы звучать так:
Portrait of a girl under a tree, dappled sunlight on face, summer vibe, closed eyes, enjoying the sun, natural skin texture, soft shadows, 50mm lens, f/1.8, dreamy atmosphere
Помните, что создание промта – это не строгая наука, а скорее алхимия. Здесь нет единственно верного рецепта, но есть проверенные ингредиенты, смешивая которые, можно получить золото. Не бойтесь экспериментировать, удалять и добавлять слова, менять настройки виртуальной камеры. Иногда одна случайная опечатка или неожиданное слово могут привести к созданию шедевра, который украсит ваше портфолио. Фотореализм в нейросетях – это уже не будущее, это настоящее, которое доступно каждому, кто готов потратить немного времени на изучение «магических слов». Пусть ваши портреты вызывают у зрителя вопрос: «Неужели это не фото?» – ведь именно это и есть высшая похвала для цифрового художника.