Знакомо ли вам чувство лёгкого разочарования, когда сотрудник паспортного стола протягивает готовый документ, а с фотографии на вас смотрит угрюмый незнакомец с сероватым оттенком лица? В сети представлено множество шуток о том, что если вы похожи на своё фото в паспорте, то вам пора в отпуск, однако в каждой шутке, как известно, лишь доля шутки. Плохой свет, спешка фотографа в ближайшем подвале-студии или просто неудачный ракурс часто превращают важный документ в источник комплексов на долгие годы. Но сейчас, когда нейросети шагнули далеко вперёд, появилась возможность взять ситуацию в свои руки. Сгенерировать идеальную основу для документального фото, выставив нужный свет и ракурс, теперь можно не выходя из дома. А начать стоит с понимания того, как объяснить бездушному алгоритму, что именно от него требуется, ведь понятие «красиво» у искусственного интеллекта и у сотрудника миграционной службы кардинально различается.
Зачем вообще генерировать базу?
Казалось бы, проще сходить в ателье. Но это довольно поверхностный взгляд. Использование нейросетей позволяет экспериментировать с освещением, одеждой и выражением лица бесконечное количество раз, не тратя при этом ни копейки (или тратя сущие копейки). К тому же, если вы владеете навыками FaceSwap (замены лица), вы можете создать идеальный шаблон с правильным студийным светом, в который затем просто «вклеите» свои черты. Это спасательный круг для тех, кто не умеет выставлять профессиональный свет дома. Главное — получить от ИИ технически безупречный исходник: с ровной осанкой, прямым взглядом и отсутствием теней.
Анатомия правильного запроса
Создание промта для такой утилитарной задачи — процесс не сложный, но кропотливый. Здесь не нужны эпитеты вроде «волшебный» или «атмосферный». Напротив, требуется сухой, технический язык. Основу любого успешного запроса составляет жёсткая структура. Сначала вы описываете объект (пол, возраст, детали внешности), затем задаёте ракурс (это критически важно), после чего переходите к освещению и фону. Завершает композицию блок технических параметров, отвечающих за реализм. Если упустить хоть одну деталь, нейросеть начнёт фантазировать, добавляя то драматичные тени, то художественный размытый фон, который в документах совершенно недопустим.
Свет и фон: Технические требования
Освещение — это тот самый подводный камень, о который разбиваются надежды новичков. Для художественного портрета хорош контраст, но для паспорта он губителен. В промте обязательно должны фигурировать слова, указывающие на мягкость и равномерность света. Если вы напишете просто «studio lighting», результат может оказаться слишком театральным. Стоит использовать уточнения вроде «flat lighting» (плоское освещение) или «even lighting» (равномерное освещение). Это гарантирует, что на лице не будет глубоких теней под носом или глазами, которые автоматика при проверке документов может счесть искажением черт.
С фоном дело обстоит ещё строже. Любые узоры, градиенты или посторонние предметы — это табу. В запросе необходимо чётко прописывать:
solid white background, pure white background
И всё же, даже при таком указании нейросети любят добавлять лёгкую серую виньетку. Это не страшно, так как убрать однотонный фон в графическом редакторе — дело пары минут. Главное достояние сгенерированного изображения — это правильный контраст фигуры по отношению к заднему плану.
Как составить промт?
Давайте перейдём к конкретике. Чтобы нейросеть (будь то Midjourney, Stable Diffusion или другие аналоги) выдала фотореалистичный результат, нужно использовать специальный лексикон фотографов. Упоминание конкретной техники творит чудеса. Фразы вроде «shot on Sony A7R IV» или «85mm lens» заставляют алгоритм подтягивать текстуры высокого разрешения и выстраивать правильную геометрию лица без искажений, свойственных широкоугольным объективам.
Также стоит отметить важность ключевых слов, отвечающих за детализацию кожи. Пластиковые лица времён ранних нейросетей уже не в моде. Чтобы портрет выглядел живым, добавляйте в промт «detailed skin texture», «pores», «hyperrealistic». Однако не стоит перебарщивать. Слишком высокая детализация иногда превращает лицо в карту морщин и дефектов, которых на самом деле нет. Баланс здесь — наше всё.
Примеры запросов: Мужской портрет
Предположим, нам нужна заготовка для мужского фото на паспорт. Задача — получить строгое изображение мужчины в деловом стиле. Конструкция промта будет строиться от общего к частному. Начинаем с главного героя.
Passport photo of a man, 30 years old, wearing a dark formal suit and white shirt
Здесь мы задали базу. Далее следует самый важный блок — позиционирование.
Front view, looking directly at camera, neutral face expression, closed mouth
Это железное правило биометрии: никаких улыбок и поворотов головы. Затем мы «включаем» свет. Добавляем в строку:
flat studio lighting, softbox, no shadows on face, even illumination
Ну и, наконец, техническая «обвязка» для реализма и фона:
solid white background, ultra realistic, 8k, sharp focus, high resolution, –ar 3:4
В случае с Midjourney параметр соотношения сторон (–ar 3:4) особенно актуален, так как он ближе всего к формату документов. Такой запрос с высокой долей вероятности выдаст результат, который не стыдно показать даже самому придирчивому паспортисту, разумеется, после того как вы замените лицо сгенерированного персонажа на своё.
Примеры запросов: Женский образ
С женскими портретами нюансов обычно больше. Нейросети очень любят добавлять яркий макияж, украшения или пышные причёски, перекрывающие овал лица. А ведь требования к фото на документы запрещают, чтобы волосы закрывали глаза или брови. Поэтому промт должен быть более ограничивающим. Начать нужно с описания внешности:
Passport photo of a woman, 25 years old, natural makeup, blonde hair tied back, visible ears
Упоминание убранных волос и видимых ушей часто спасает от необходимости переделывать генерацию десяток раз. Одежду лучше выбирать контрастную, чтобы плечи не сливались с фоном. Продолжаем запрос:
wearing a black blouse, front view, symmetrical face, looking straight at camera
Блок про свет и качество остаётся неизменным, так как стандарты едины.
Bright even lighting, soft shadows, white background, photorealistic, raw photo, 8k –ar 3:4
К слову, добавление тега «raw photo» часто помогает убрать эффект чрезмерной «отфотошопленности», делая снимок более похожим на настоящий кадр с камеры.
Примеры запросов: Детское фото
Сфотографировать ребёнка на документы — задача не из лёгких даже для опытного фотографа. Чадо вертится, моргает и отказывается смотреть в объектив. Нейросеть же генерирует спокойного ребёнка за три миллисекунды. Если вам нужен референс для подстановки лица своего ребёнка, запрос будет выглядеть примерно так.
Passport photo of a 5 year old boy, wearing a casual t-shirt, front view, head straight, looking at camera
Важно добавить уточнение про нейтральное выражение, так как ИИ по умолчанию пытается заставить детей улыбаться.
Neutral expression, mouth closed, calm face
Далее прописываем уже знакомые нам световые схемы.
Soft lighting, bright white background, sharp focus on eyes, highly detailed –ar 3:4
Кстати, в случае с детьми можно добавить тег «cute», но с осторожностью, чтобы не получить мультяшного персонажа вместо реального мальчика.
Пройдёт ли такое фото проверку?
Тут мы подходим к самому щепетильному моменту. Примет ли МФЦ или визовый центр такое творчество? Формально, использование полностью сгенерированного лица несуществующего человека — это подделка документов, что преследуется по закону. Промты, которые мы разбираем, предназначены в первую очередь для создания идеального «шаблона» (тела, света, фона), в который с помощью технологий FaceSwap переносится ваше реальное лицо. Или же для улучшения вашего реального фото через режим Image-to-Image, где нейросеть лишь повышает качество и правит свет, сохраняя узнаваемость.
Биометрические системы в аэропортах сканируют расстояние между зрачками, форму скул и ушей. Малейшее искажение геометрии лица при генерации может привести к тому, что вас просто не выпустят за границу. Поэтому используйте ИИ как помощника для ретуши и подготовки фона, но не как инструмент для создания новой личности. Ваше лицо должно оставаться вашим на сто процентов.
Сложно ли это?
Многим кажется, что написание промта — это какое-то тайное знание для избранных. На самом деле, это просто навык чёткого формулирования мыслей на английском языке (так как большинство моделей понимают его лучше). Вам придётся потратить некоторое время на перебор вариантов. Возможно, первый результат будет далёк от идеала: то ухо «поплывёт», то свет упадёт не так. Это нормальная часть процесса. Довольно часто приходится добавлять в промт так называемые негативные подсказки (negative prompts) — список того, чего на фото быть не должно. Например:
shadows, glasses, hats, teeth, smile, asymmetry
Это помогает отсечь лишний мусор и сфокусировать алгоритм на задаче.
Типичные ошибки новичков
Самая распространённая оплошность — попытка сделать «красиво». Документальное фото не должно быть красивым в художественном смысле. Оно должно быть чётким. Излишняя художественность, боке (размытие фона), драматичный свет — всё это враги биометрии. Также часто забывают про одежду. Белая рубашка на белом фоне — классическая ошибка, превращающая человека в парящую голову. Выбирайте тёмные или цветные вещи для контраста. Ну и, конечно же, забывают про глаза. Взгляд должен быть направлен строго в объектив. Если зрачки скошены, фото забракуют мгновенно.
Пост-обработка: шлифовка результата
Даже самый лучший промт редко выдаёт результат, готовый к печати на 100%. Скорее всего, вам придётся открыть фотошоп или простой онлайн-редактор, чтобы подогнать размер головы под стандарты (обычно лицо должно занимать 70-80% кадра). Также может потребоваться лёгкая цветокоррекция. Нейросети иногда уводят тон кожи в красноту или желтизну. Но это мелочи по сравнению с тем, сколько времени вы сэкономили на походе в фотосалон. Тем более, что навык работы с генерацией изображений пригодится вам ещё не раз.
Создание фото на паспорт с помощью ИИ — это отличный пример того, как высокие технологии входят в наш быт, избавляя от рутины и лишних трат. Попробуйте поэкспериментировать с описанными промтами, подставляя свои параметры. Возможно, следующая фотография в вашем документе станет не поводом для смущения, а предметом гордости, демонстрирующим вашу технологическую подкованность. Удачных генераций и лёгкого прохождения паспортного контроля!