Знакома ли вам ситуация, когда взгляд на собственное фото в паспорте вызывает лишь желание спрятать документ подальше и никому никогда его не показывать? В сети представлено множество шуток о том, что если вы похожи на своё фото в паспорте, то вам пора в отпуск, однако за этим юмором скрывается реальная проблема: студийный свет часто бывает безжалостен, а фотографы — не всегда внимательны к деталям. Довольно часто мы получаем снимки, где выглядим уставшими, испуганными или странно асимметричными, при этом заплатив за услугу деньги и потратив время на поход в ателье. С приходом генеративных нейросетей у обывателя появился шанс взять этот процесс под полный контроль, создав идеальное изображение, которое не стыдно будет показать на таможне или при трудоустройстве. Удивительно, но чтобы получить качественный результат, не нужно быть профессиональным промпт-инженером, а начать стоит с понимания базовых принципов построения запроса.
Сложно ли обмануть систему?
Казалось бы, чего проще — попросить искусственный интеллект нарисовать лицо на белом фоне. Задача не из лёгких. Нейросети, будь то Midjourney или Stable Diffusion, тяготеют к художественности, драматичному освещению и сложным текстурам. Документальное фото — это скука, возведенная в абсолют. Здесь нет места творчеству, теням на половину лица или загадочному прищуру. Главное — четкость, равномерность и нейтральность. Справится ли ИИ? Безусловно, но только если вы загоните его в жёсткие рамки технического задания. Ведь именно излишняя креативность алгоритма чаще всего становится той самой ложкой дёгтя, которая портит, казалось бы, идеальный портрет.
Анатомия правильного запроса
Любой добротный промт для таких целей строится на трёх китах: объект, освещение и технические параметры. Игнорирование хотя бы одного из этих элементов приведёт к тому, что на выходе вы получите красивый арт для аватарки в соцсетях, но никак не фото для визы. Сперва стоит описать самого человека. Указывать нужно не только пол и возраст, но и этническую принадлежность, цвет волос и даже одежду. К слову, нейросети довольно часто «любят» добавлять очки или украшения, поэтому если они не нужны, об этом стоит упомянуть отдельно (или использовать параметр negative prompt).
Далее следует блок освещения. Это, пожалуй, самый щепетильный момент. Никакого «cinematic lighting» или «dramatic shadows». Нас интересует скучный, плоский свет. В промтах лучше всего работают формулировки «flat lighting», «softbox lighting», «studio lighting» и «even illumination». Свет должен заливать лицо равномерно, не оставляя глубоких теней под носом или глазами. Ну и, наконец, техническая часть. Здесь мы требуем от машины фотореализма. Слова-маркеры вроде «ultra realistic», «8k», «high details», «shot on 50mm lens» творят чудеса. Они заставляют алгоритм забыть о живописи и переключиться в режим имитации оптического оборудования.
Как выбрать фон?
Имеет ли значение задний план? Колоссальное. Для большинства документов требуется чистый белый или светло-серый фон. Однако нейросети иногда воспринимают слово «white background» слишком буквально и могут засветить само лицо, сделав его неестественно бледным. Тут есть небольшой нюанс. Опытные пользователи советуют использовать конструкции типа «solid white background» или «clean simple background», чтобы дать понять алгоритму: фон должен быть отделен от объекта. А если результат всё равно не устраивает, фон всегда можно удалить в графическом редакторе, благо инструментов для этого сейчас предостаточно.
Примеры промтов: Паспорт РФ
Перейдём к конкретике. Допустим, вам нужно фото мужчины средних лет для внутреннего паспорта. Простой, но эффективный запрос может выглядеть так:
«passport photo of a 30 year old man, slavic appearance, short brown hair, neutral expression, looking directly at camera, wearing dark shirt, solid white background, soft studio lighting, flat lighting, no shadows on face, ultra realistic, 8k, high definition –ar 3:4»
Обратите внимание на соотношение сторон (–ar 3:4). Оно наиболее близко к требуемому формату, хотя кадрировать изображение всё равно придётся.
Если же мы говорим о женском портрете, то промт может претерпеть некоторые изменения. Стоит добавить детали про макияж, чтобы он не был слишком вызывающим. Вот пример рабочего варианта:
«ID photo of a young woman, natural makeup, blonde hair tied back, ears visible, neutral facial expression, closed mouth, looking straight at the camera, wearing formal grey jacket, white background, even lighting, professional photography, sharp focus, f/8 aperture –ar 3:4»
Здесь фраза «ears visible» (уши видны) добавлена не случайно. Многие стандарты требуют, чтобы овал лица был полностью открыт, а нейросети любят прятать уши за пышными локонами. Это же правило касается и чёлки — лучше сразу указать «forehead visible».
Виза и международные стандарты
Требования к визовым снимкам могут отличаться в зависимости от страны. Например, для шенгенской визы часто просят светло-серый фон, а не кипенно-белый. В США же требования к белому фону и отсутствию очков довольно строгие. Для создания универсальной заготовки под европейскую визу можно использовать следующий скрипт:
«biometric passport photo of a man, european standard, light grey background, neutral face, eyes open and visible, no glasses, formal attire, symmetrical face, soft lighting from front, photorealistic, raw photo style –no shadows –ar 3:4»
А вот для американской визы стоит попробовать такую конструкцию, сделав упор на квадратный формат и белый фон:
«US visa photo compliant, portrait of a woman, dark hair, ears showing, direct gaze, neutral expression, plain white background, no retouching, realistic skin texture, studio flash lighting, sharp details, 8k resolution –ar 1:1»
К слову, параметр «realistic skin texture» здесь играет важную роль. Нейросети часто «мылят» кожу, делая ее похожей на пластик. Визовый офицер такую «куклу» может и не пропустить, посчитав снимок чрезмерно отретушированным.
Что насчёт корпоративных бейджей?
Здесь можно позволить себе немного больше свободы. Нужна ли тут каменная серьёзность? Вовсе нет. Легкая полуулыбка на корпоративном бейдже располагает к себе и выглядит куда приятнее. Да и одежда может быть менее формальной. Для создания дружелюбного образа сотрудника подойдёт такой вариант:
«professional headshot for corporate ID card, man in blue polo shirt, friendly slight smile, looking at camera, office lighting, blurred office background, depth of field, high quality, canon r5 photography –ar 2:3»
Другой пример, если компания требует строгого дресс-кода, но допускает эмоции:
«business portrait for ID badge, woman in black blazer, white shirt, confident look, slight smile, grey gradient background, studio lighting, rim light, professional retouching, 4k –ar 2:3»
Тут добавлено «rim light» (контровой свет). Он отделяет фигуру от фона, придавая снимку объём и тот самый «дорогой» вид, который так ценят в бизнес-среде. Однако не стоит перебарщивать с эффектами, чтобы бейдж оставался читаемым.
Стиль одежды и ошибки генерации
Одежда — это отдельная головная боль при генерации. Почему? Потому что нейросети обожают сливать белую рубашку с белым фоном. Получается «говорящая голова», парящая в пустоте. Зрелище удручающее. Поэтому в промте всегда стоит указывать контрастную одежду. «Dark blue suit», «black turtleneck», «dark grey jacket» — эти словосочетания спасут ваш снимок. Тем более, что тёмная одежда визуально выглядит строже и собраннее. А вот от пёстрых узоров и клетки лучше отказаться. На маленьком фото они могут создать неприятную рябь (эффект муара), да и выглядят часто аляповато.
Ещё один подводный камень — это аксессуары. ИИ нередко пытается нацепить на генерацию серьги, бусы или шарфы. В промте negative prompt (если интерфейс позволяет) обязательно стоит прописать: «glasses, jewelry, hats, scarf, makeup, beard» (если борода не нужна). Особенно коварны очки. Даже если вы носите их в жизни, на фото для документов блики на линзах недопустимы. Добиться прозрачных стёкол без бликов в генерации — задача почти невыполнимая. Проще сгенерировать лицо без очков, а потом, если это критично, смириться с тем, что на фото вы будете без них. Впрочем, большинство регламентов сейчас допускают фото без очков даже для слабовидящих.
Пост-обработка
Не стоит надеяться, что нейросеть выдаст готовый файл, который можно сразу нести в печать. Сырая генерация — это лишь полуфабрикат. Во-первых, разрешение. Даже с параметрами 8k лицо может занимать лишь малую часть кадра. Потребуется кадрирование (crop). Обрезать фото нужно так, чтобы лицо занимало примерно 70-80% площади снимка (в зависимости от требований). Во-вторых, апскейлинг. Для печати нужно высокое разрешение. Встроенные в Midjourney апскейлеры работают неплохо, но иногда стоит прогнать картинку через специализированные сервисы улучшения качества.
Отдельно стоит упомянуть замену фона. Если нейросеть нарисовала идеальное лицо, но фон получился с пятнами или тенями, не спешите выбрасывать результат. Сервисы вроде Remove.bg или инструменты в Photoshop справляются с удалением фона за секунды. После этого достаточно подложить под слой с портретом ровный белый или серый цвет. Это, кстати, даже надёжнее, чем пытаться заставить нейросеть сгенерировать идеально чистый цвет сразу. Махинации эти не займут много времени, а результат станет на порядок профессиональнее.
Распространённые проблемы
С чем еще может столкнуться цифровой энтузиаст? Асимметрия глаз. Это бич генеративных моделей. На портретах крупным планом разница в размере или форме глаз сразу бросается в глаза. Лечится это только повторной генерацией (reroll) или использованием функции Inpaint, чтобы перерисовать конкретную область. Также всплывут артефакты на волосах. Иногда пряди волос сливаются с кожей или выглядят как пластиковая шапка. В таком случае стоит добавить в промт слова «detailed hair texture», «strands of hair».
Бывает и так, что нейросеть упорно поворачивает голову модели в три четверти. Вроде бы красиво, но для паспорта непригодно. Слова «looking straight», «front view», «symmetrical face» должны быть в начале промта. Вес этих слов для алгоритма выше. Ну и, конечно же, эмоции. Нейросети сложно понять концепцию «нейтрального выражения лица». Часто получается либо угрюмая гримаса, либо лёгкая ухмылка. Поиск баланса может потребовать десятка попыток. Но не стоит отчаиваться, ведь каждая новая генерация приближает вас к цели.
Взгляд в будущее
Сейчас мы находимся на том этапе, когда отличить качественную генерацию от реального фото становится всё сложнее. Бьёт ли это по бюджету фотоателье? Безусловно. Но для пользователя это открывает двери в мир, где он сам творец своего образа. Конечно, пока еще существуют юридические нюансы, и не во всех странах принимают сгенерированные фото (биометрия — вещь серьёзная). Тем не менее, для пропусков, студенческих билетов, внутренних удостоверений и виз (там, где подача идёт онлайн) этот метод уже работает. Главное — подходить к процессу скрупулёзно, не жалеть времени на перебор вариантов и внимательно читать требования к конкретному документу. Пусть ваше новое фото станет отличным решением и радует глаз долгие годы, а паспортный контроль проходит без лишних вопросов. Перевоплощение завершено.