Промпт для фото с Путиным: как мужчине сгенерировать реалистичный снимок с президентом

В сети представлено множество попыток скрестить собственные селфи с портретами мировых лидеров, однако результат чаще всего напоминает дешёвый пластиковый коллаж из нулевых годов. Ведь коммерческие алгоритмы отчаянно сопротивляются политическим контекстам, накладывая теневые баны на аккаунты или выдавая откровенную карикатуру. С другой стороны медали — открытые нейросети без жёсткой цензуры, где получить добротный реалистичный кадр вполне по силам любому энтузиасту. Дело в том, что успешная генерация зависит исключительно от умения управлять весами слов и направлять внимание искусственного интеллекта. Поэтому перед началом работы желательно скрупулёзно продумать сцену до мельчайших деталей, отказавшись от примитивных текстовых команд.

Все топовые нейросети в одном месте

С чего начинается выбор?

Оседает пыль бесконечных тестов с нейросетями. Задача не из лёгких. А начинать нужно с правильной среды для рендера. Многие считают лучшим выбором популярные боты в мессенджерах, но на самом деле именно там вы быстрее всего столкнётесь с фильтрами безопасности. Платформы массового сегмента тяготеют к стерильности. Выручит локальная установка Stable Diffusion, дополненная кастомными чекпоинтами вроде Realistic Vision или Juggernaut XL. К слову, именно эти обученные базы позволяют избежать той самой наляпистости, которая мгновенно бросается в глаза обывателю при просмотре синтетических изображений. Для начала стоит загрузить референсное изображение мужского лица через ControlNet. Этот модуль, усиленный специальными препроцессорами, отлитый программным кодом для фиксации геометрии, снабжённый алгоритмами распознавания мимики, буквально принуждает нейросеть сохранить портретное сходство. Но чтобы этот спасательный круг сработал безотказно, потребуется выверенная текстовая база.

Официальный антураж

Сложно ли добиться естественности при генерации протокольной съёмки? Да, но результат того стоит. Пожалуй, львиная доля успеха кроется в описании взаимодействия объектов внутри кадра. Не стоит писать скудное «я стою рядом». Гораздо эффективнее работает детализированная мизансцена, где у каждого элемента есть своё место. Один из самых популярных видов запроса строится на строгом официозе:

A highly detailed photorealistic medium shot of a 35-year-old russian man wearing a well-fitted navy blue suit, standing next to Vladimir Putin. Putin is wearing a classic dark suit and a red tie. They are shaking hands in an opulent Kremlin office. Gold accents, mahogany wood panels, daylight coming from a large window, 85mm lens, f/1.8, cinematic lighting, 8k

Далее следует обязательно прописать негативные подсказки. Внести лепту в чистоту финального файла помогут слова:

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

cartoon, 3d, illustration, distorted faces, bad anatomy, bad hands, extra fingers, poorly drawn face, oversaturated

Тем более что генеративные модели обожают портить именно кисти рук в момент рукопожатия, превращая их в бесформенное месиво.

Стиль гранж в интерьере

Выглядит впечатляюще. Но иногда бомонд предпочитает менее пафосные сюжеты, отказываясь от золотых канделябров в пользу современной брутальности. Что насчёт альтернативных локаций? Лучший вариант — перенести действие в лофт или индустриальное пространство. К тому же контраст между строгими костюмами и кирпичными стенами творит чудеса визуального восприятия. Для такой задумки отлично подойдёт следующий скрипт:

Candid photography, two men standing in a modern loft office with exposed brick walls. A 40-year-old handsome caucasian man in a dark turtleneck talking with Vladimir Putin who is wearing a tailored grey suit. Dramatic rim lighting, neon tube lights in the background, shot on Leica, film grain, hyperrealistic, shallow depth of field

Естественно, здесь кроются свои подводные камни. Сеть может сделать кожу слишком гладкой, лишив её естественных возрастных изменений. Защититься от этого довольно просто. В хвост запроса стоит добавить фразы вроде skin pores, subtle wrinkles, realistic skin texture, чтобы вернуть лицам живую фактуру.

Вредно ли использовать LoRA?

Обязательно ли обучать собственную нейромодель на гигабайтах фотографий? Вовсе нет. Хотя и существуют скрипты для точечной тренировки лиц, но это бьёт по бюджету времени и требует мощной видеокарты. К тому же есть риск переобучения, когда алгоритм начинает выдавать артефакты при малейшем изменении ракурса. Тем не менее использование уже готовых LoRA-файлов для конкретных персоналий серьёзно упрощает жизнь. Если вы интегрируете такой модуль в процесс генерации, то вес основного текстового триггера можно слегка снизить. Это же правило касается и мужского персонажа, если вы применяете сервис Reactor для финального наложения черт лица уже поверх сгенерированного базового снимка. Базовые постулаты композиции никто не отменял. Изысканный колоритный кадр получится только после прогона картинки через увеличитель с параметром денойза не выше ноль целых трёх десятых.

Техническая подготовка

Кулеры видеокарты начинают привычно гудеть. Настоящий рай для энтузиаста начинается там, где заканчиваются лимиты онлайн-генераторов. Само собой, для комфортной работы с тяжеловесными моделями потребуется внушительный объём видеопамяти. Если в наличии карточка лишь на восемь гигабайт, процесс предстоит не сложный, но кропотливый. В таком случае на помощь приходят технологии тайлинга и легковесные сэмплеры. К первой группе относится методичное разбиение картинки на квадраты при увеличении разрешения, далее следует аккуратная склейка швов алгоритмами, ну и, наконец, финальная программная цветокоррекция. Впрочем, многие предпочитают арендовать облачные мощности. Кошелёк станет легче ненамного, если брать сервер на пару часов целенаправленной работы. Главное — возможность запускать архитектуру SDXL без вылетов и зависаний. Для неё тексты пишутся немного иначе, напоминая скорее связный рассказ, чем набор тегов через запятую.

Случайная встреча на улице

Солнечный блик скользит по объективу камеры. Именно так должен восприниматься итоговый репортажный кадр — как выхваченный из повседневной суеты момент. Буквально десятилетие назад подобные махинации с пикселями требовали недельной работы ретушёра, но сейчас реализм достигается за считаные секунды. Однако всплывут ошибки освещения, если не продумать окружающую среду. Хорошо написанный промпт — это настоящий кладезь возможностей для спасения композиции. А вот оригинальное название стиля «Paparazzi shot» может кардинально изменить восприятие картинки. Если нужно сымитировать неофициальную обстановку, подойдёт такая конструкция:

Paparazzi photo, shot from a distance with telephoto lens. A 45-year-old man in a stylish winter coat walking shoulder to shoulder with Vladimir Putin on a snowy street. Putin is wearing a dark zipped puffer jacket. Both are looking forward, serious expressions. Winter daylight, falling snow, motion blur on the background, 35mm film grain, editorial photography

Обратите внимание, что исконно зимняя атмосфера требует упоминания конкретных деталей верхней одежды. Да и самим персонажам визуально находиться в реалистичном городе гораздо лучше, чем в абстрактном студийном вакууме.

Детализация эмоций

Улыбка решает всё. Ведь абсолютно каменные физиономии мгновенно выдают синтетическое происхождение изображения. Безусловно, сгенерировать искреннюю эмоцию довольно сложно, алгоритмы часто смешивают черты лиц двух людей, если они стоят в кадре вплотную друг к другу. Это связано с тем, что механизм самовнимания расплывается на всю площадь холста, теряя фокус на конкретных объектах. Чтобы машина не выдала пугающего мутанта, нет смысла скупиться на точечные маски (inpainting). Сначала рендерится общая грандиозная композиция с нейтральными выражениями, а затем зоны голов перерисовываются отдельно. Для лица президента можно использовать команду:

Все топовые нейросети в одном месте

Vladimir Putin, slight polite smile, looking directly at the camera, highly detailed eyes

А для второго героя:

A man smiling proudly, relaxed facial expression, dynamic light

Не стоит перебарщивать с шириной улыбки или открытым ртом. Излишняя экспрессия часто приводит к появлению лишних зубов или искажению геометрии скул.

Работа с отражениями

Зрелище удручающее. Именно так можно описать результат, где у одного из героев галстук плавно перетекает воротник рубашки, а в зеркале на заднем фоне отражается совершенно другая комната. Спасти ситуацию поможет только скрупулёзный контроль рендера. Нужно отметить, что отражения в стёклах или на лакированной поверхности стола часто живут своей, непредсказуемой жизнью. Если вы добавили в текст «polished oak desk», обязательно проверьте, что именно в нём отражается после окончания генерации. Кроме того, серьёзное вложение усилий потребуется для правильной настройки теней. В реальной жизни свет падает неравномерно, формируя объёмы и текстуры. Запросы вроде «Rembrandt lighting, hard shadows on one side of the face, soft rim light on shoulders» добавят нужной фотографичности. Ну, а если вы стремитесь к максимальной документальной достоверности, допишите в самый конец абзаца «press photo style, flash photography». Это сымитирует работу репортёрской вспышки в лоб с её характерными мелкими недостатками.

Оценка результатов?

На самом деле, создание убедительной визуальной иллюзии требует лишь небольшой насмотренности и готовности к экспериментам. Главное — угадать с палитрой и не гнаться за идеальной журнальной ретушью, которая всегда выглядит искусственно. Оставьте немного цифрового шума, позвольте ткани пиджака замяться не по законам идеальной симметрии, а свету — слегка пересветить оконный проём. Экспериментируйте с ракурсами объектива, меняя фокусное расстояние от широкого угла до портретного телеобъектива. Удачных генераций, пусть каждая полученная картинка станет отличным решением для ваших творческих задумок и порадует домочадцев своей реалистичностью.