В сети можно найти множество нейросетей, способных за пару секунд нарисовать практически любую сцену, от милых домашних питомцев до сложнейших архитектурных комплексов. Однако спектр генерируемых объектов не ограничивается только искусством, пейзажами или отвлечённой фантастикой. Буквально десятилетие назад создание реалистичного макета официальной бумаги требовало долгих часов кропотливой работы в графических редакторах, но сейчас с этой рутиной легко справляются алгоритмы. Многие считают генерацию подобных канцелярских картинок пустяковым баловством, но на самом деле они жизненно необходимы для кино, дизайна интерфейсов, прототипирования или создания реквизита в квестах. Но чтобы не ошибиться и получить на выходе добротный реалистичный результат, нужно правильно составить текстовый запрос.
Зачем вообще генерировать документы?
Скучная канцелярская эстетика. Именно с неё начинается любая серьёзная работа над реквизитом. Зачем обычному обывателю может понадобиться искусственное удостоверение личности? Чаще всего львиная доля подобных запросов оседает в студиях разработки компьютерных игр (особенно независимых инди-проектов) или среди организаторов живых квестов. Ведь именно там правдоподобный антураж творит чудеса, с головой погружая человека в выдуманную историю. К тому же, веб-дизайнерам довольно часто требуются визуальные заглушки для сайтов, где пользователи впоследствии должны загружать свои сканы. Разумеется, использовать реальные развороты с личной информацией категорически нельзя из-за строгих законов о конфиденциальности. И вот тут настоящим спасательным кругом становятся генеративные сети, выдающие абсолютно безопасные, но визуально достоверные картинки. Стоит отметить, что процесс формулирования такого задания не слишком тяжёлый, но требует скрупулёзного подхода. Дело в том, что искусственный интеллект отчаянно тяготеет к излишней наляпистости, пытаясь украсить сухой бланк вензелями, золотыми рамками или десятком лишних печатей.
Базовая структура текстового запроса
С чего начинается выбор правильных слов? С определения композиции и ракурса. В кадре всегда должен солировать сам предмет, мирно лежащий на ровной поверхности, деликатно освещённый мягким студийным светом. К первой группе обязательных параметров относится указание угла зрения — вид строго сверху или лёгкая изометрия. Далее следует прописать материал обложки, например, потёртая тёмно-бордовая кожа, дополненная выдавленным серебряным гербом. Следующий важный критерий напрямую затрагивает схему освещения и фотографическое качество рендера. Фотореалистичный макрообъектив с фокусным расстоянием восемьдесят пять миллиметров отлично справится с задачей красивого размытия заднего плана. Последним в перечне идёт упоминание специфических мелких деталей, таких как защитные голограммы, водяные знаки на страницах, микрошрифты. Впрочем, иногда машина выдаёт пугающе идеальную, стерильную картинку. А ведь в реальной жизни страницы всегда слегка помяты, уголки неизбежно затёрты, да и штампы таможни ставятся криво. Чтобы избежать ощущения пластиковой ненатуральности, стоит обогащать текст словами «изношенный», «винтажный» или «с мелкими царапинами».
Сложно ли составить рабочий промт?
Задача не из лёгких. Ведь нужно заставить непокорный алгоритм напрочь забыть о творческом полёте. Для успешной генерации в Midjourney или Stable Diffusion отлично сработает последовательный англоязычный скрипт. Сначала мы задаём твёрдую основу, прося систему создать реалистичную фотографию раскрытого удостоверения гражданина вымышленного государства. Затем, используя инструментальный подход, описываем бумажные страницы, плотно заполненные случайным нечитаемым текстом, щедро украшенные официальными печатями, дополненные блёклой фотографией человека средних лет. Обязательно нужно уточнить окружающую среду, написав, что бумажная книжечка лежит на тяжёлом дубовом столе, освещённая тёплым светом настольной лампы из-за кадра. В самом конце стоит добавить технические фотографические параметры вроде восьми килобайт разрешения (8k resolution), высокой детализации (highly detailed) и гиперреализма (hyperrealistic). Безусловно, это лишь черновой каркас. Натыкаешься на неудачный вариант — просто меняй направление света или цвет внутренних листов. Не стоит забывать, что нейросети пока ещё отвратительно справляются с конкретными буквами, поэтому ожидать читаемых фамилий точно не приходится.
Достоверность деталей: голограммы и печати
Мерцающая тонкая плёнка. Часто именно она приковывает внимание на настоящих бланках, надёжно защищая их от подделок. Эстетичны ли такие элементы на сгенерированных картинках? Сама по себе радужная клякса не отличается красотой, но она добавляет колоссальный процент достоверности. Естественно, чтобы получить внушительный результат, придётся изрядно поиграть со светом. Вся суть в том, что голографические элементы видны только при определённом преломлении лучей. Поэтому в запрос стоит аккуратно вплести фразу о жёстком свете, падающем под углом в сорок пять градусов, создающем радужные переливы на глянцевой ламинированной странице. К слову, синие чернильные штампы тоже требуют весьма щепетильного подхода. Они совершенно не должны выглядеть так, будто их только что напечатали на дорогом лазерном принтере. Слегка размытые неровные края, неравномерное распределение краски по волокнам бумаги, частичное наложение оттиска на фотографию владельца — все эти нюансы вносят свою лепту в общую картину. А если ещё вспомнить про лазерную перфорацию с номером на краю страниц, то кошелёк заказчика дизайна точно станет легче от радости за качественно выполненную работу.
Исторические документы в ретро-стиле
Пожелтевшие хрупкие листы. Они всегда вызывают трепет и неподдельный интерес. Создание винтажных проездных бумаг начала двадцатого века требует применения совершенно иного лексикона. Известный лондонский вокзал был объявлен достроенным в тысяча восемьсот пятьдесят втором году, и примерно в ту же историческую эпоху удостоверения личности выглядели как огромные бумажные простыни, небрежно сложенные в несколько раз. Чтобы сгенерировать такой колоритный самобытный артефакт, нужно просить нейросеть нарисовать старинный транзитный документ, исписанный от руки выцветшими сепиевыми чернилами на рыхлой хлопковой бумаге. К тому же, здесь на первый план выходит изысканная каллиграфия. Стоит обязательно добавить слова о перьевой ручке, лежащей рядом, сургучной печати тёмно-красного цвета и неаккуратных пятнах от чая на краях стола. Конечно, в представлении многих обывателей винтаж — это просто коричневый фильтр, однако настоящий исторический антураж всегда кроется в текстуре материалов. И всё же, добиться стопроцентной имитации царских или ранних советских бланков довольно сложно из-за специфических государственных гербов, которые машина упрямо склонна превращать в абстрактные геометрические узоры.
Какие подводные камни нас ожидают?
Обе стороны медали всегда всплывают при детальном и долгом рассмотрении сгенерированных картинок. Как бы филигранно ни был составлен текст, идеальный макет с первой попытки получается крайне редко. Главная ложка дёгтя обычно кроется в попытках алгоритма подставить реальные лица или известные мировые логотипы. Довольно часто система собирает фотографию в паспорте из узнаваемых черт голливудских знаменитостей, что на практике может привести к неприятным курьёзным ситуациям с авторскими правами. Кроме того, иногда вместо классической бумажной книжечки на экране появляется жёсткая пластиковая карточка, просто потому что в западных странах такой формат водительских прав используется повсеместно. Чтобы избежать подобного сценария, нет смысла переплачивать за дорогие премиальные версии сервисов, достаточно лишь жёстко прописать формат «бумажная книжка» (paper booklet) и исключить слово «карта» (ID card) через поле отрицательных запросов. Ну и, конечно же, старые добрые махинации с человеческими пальцами. Если в кадре присутствует рука, держащая разворот, стоит морально приготовиться к тому, что суставы будут неестественно вывернуты. Впрочем, самые последние версии моделей ошибаются в анатомии всё реже.
Примеры готовых запросов для работы
Практика всегда уверенно бьёт сухую теорию. Первый классический вариант отлично подойдёт для современного строгого макета и не сильно ударит по бюджету времени. Формулировать стоит так:
«Макрофотография открытого паспорта с текстурной синей обложкой, лежащего на белом фоне, фокус строго на странице с данными, глянцевая ламинация, радужная голограмма переливается под углом, случайный мелкий текст, студийное холодное освещение, невероятный фотореализм, 85mm lens».
Второй скрипт пригодится энтузиастам для создания реквизита в модном жанре киберпанк. Здесь в строку ввода вписываем:
«Футуристический голографический паспорт гражданина тёмного мегаполиса, встроенный микрочип ярко светится неоновым синим светом, прозрачный тёмный пластик, сильные потёртости по краям, тёмный металлический фон, мрачное атмосферное освещение сверху».
Ну, а третий запрос перенесёт нас в прошлое, предлагая добротный классический винтаж. Пишем следующее:
«Старинный паспорт тысяча девятьсот двадцатого года, открытый разворот, толстая пожелтевшая бумага, выцветшие железные чернила, чёрно-белое фото сурового мужчины в шляпе, красная объёмная сургучная печать, лежит на старом потёртом кожаном чемодане, тёплый кинематографичный свет из окна».
Упорство, помноженное на богатую фантазию, обязательно сделает своё дело. Не бойтесь смело экспериментировать с направлением света, плотностью текстур и самыми незначительными мелкими деталями, ведь именно они оживляют цифровое полотно. Удачных и быстрых генераций, пусть каждая созданная картинка идеально впишется в проект и запомнится надолго!