В сети представлено множество сгенерированных портретов, от которых откровенно веет пластиковой искусственностью. Ведь создать фотореалистичный автопортрет, где не бросается в глаза пресловутое машинное сглаживание, довольно сложно. Особенно если речь заходит о нашумевшем творении от Google, которое сейчас у всех на устах и доступно через официальный сайт или сторонние агрегаторы. Многие считают, что достаточно вбить пару базовых слов в интерфейс сайта или отправить короткий запрос через API, и умный алгоритм сам всё додумает. Однако на деле скупой текст выдаёт совершенно непредсказуемый результат, полный грубых анатомических ошибок и мыльных неестественных текстур. Но чтобы не ошибиться, нужно скрупулёзно подбирать текстовые команды.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Архитектура запроса
Блики на влажной коже. Именно с таких мельчайших, казалось бы, незначительных деталей опытные энтузиасты начинают выстраивать свои запросы. Дело в том, что нейросеть Nano Banana тяготеет к излишней драматизации освещения, если пустить вычислительный процесс на самотёк. С чего начинается выбор? С определения композиции кадра. Во-первых, стоит сразу прописать ракурс вытянутой руки, во-вторых, сымитированный широкоугольный объектив мобильного телефона (примерно четырнадцать миллиметров), ну и, наконец, характерное искажение перспективы по краям изображения, свойственное современной компактной оптике. Это же правило касается текстуры лица. Естественно, гладкая журнальная ретушь моментально выдаст нейросетевое происхождение картинки. А вот если добавить в текстовую строку упоминание расширенных пор, мелких мимических морщин, случайных выбившихся прядей волос, то изображение обретёт ту самую изюминку. К слову, настоящий кладезь для реализма кроется в указании конкретной модели смартфона. Ведь матрица условного аппарата тринадцатилетней давности добавит аутентичный цифровой шум. И всё же перебарщивать с артефактами не стоит, иначе кадр превратится в нечитаемую кашу из пикселей.
Локация и фоновый антураж
Куда поместить нашего персонажа? Выбор локации полностью определяет настроение всего снимка. Безусловно, львиная доля успеха зависит от того, насколько гармонично фон сочетается с освещением самого лица. Размытая городская улица, освещённая неоновыми вывесками, солирует в вечерних композициях. Далее следует указать глубину резкости. Замыленный задний план с эффектом боке надёжно скроет мелкие генеративные огрехи, которые неизбежно всплывут при детальном рассмотрении. Обыватель часто забывает про отражения в зрачках или диоптрических очках. Поверхность роговицы, отражающая светящийся прямоугольник смартфона, добавит сто очков к живости взгляда. Поэтому в промт стоит органично вплетать описание источника света. Окна пасмурного дня, светящийся монитор ноутбука, тусклая лампа накаливания в подъезде задают тон всему произведению. Зрелище удручающее, когда лицо освещено мощным студийным светом, а на фоне виднеется мрачный тёмный переулок. Наляпистость в деталях фона бьёт по реализму гораздо сильнее, чем анатомические неточности строения челюсти. К тому же, сложный детализированный фон — это серьёзное вложение вычислительных ресурсов при использовании API, что иногда ощутимо бьёт по бюджету. Гугл тарифицирует сложные запросы довольно жёстко, и кошелёк станет легче, если каждый раз генерировать толпы случайных прохожих на заднем плане.
Как избежать пластиковой кожи?
Слишком идеальное лицо. Это ложка дёгтя. В любой генерации.
Буквально десятилетие назад фотошопная гладкость была пределом мечтаний и роскошью, но сейчас колоритный самобытный недостаток ценится цифровыми художниками куда выше. Обязательно ли прописывать каждый прыщик? Вовсе нет. Однако скрупулёзный подход к описанию эпидермиса творит чудеса. В строку запроса вписывают термины вроде неравномерной пигментации, лёгкой асимметрии лица, микро-теней от ресниц на щеках. Инструментальный подход тут работает безотказно: портрет, снятый при жёстком солнечном свете, подчёркнутый резкими тенями, дополненный лёгкой испариной на лбу. Тем более, что Нано Банана отлично понимает профессиональную фотографическую терминологию, вплоть до фокусного расстояния и выдержки. Не стоит забывать про баланс белого. Вычурный тёплый фильтр часто превращает человека в пластиковый манекен с витрины магазина. Холодные, слегка зеленоватые оттенки люминесцентных ламп метро или больницы, напротив, добавляют пугающей, но притягательной жизненности. Впрочем, этот процесс не сложный, но крайне кропотливый, требующий десятков тестовых прогонов.
Стоит ли прописывать эмоции?
Застывшая голливудская улыбка. Настоящий враг любого, кто стремится к натуральности. Ведь исконно человеческая мимика редко бывает абсолютно симметричной и выверенной. Натыкаешься порой на добротный реалистичный снимок, но совершенно пустые, стеклянные глаза моментально выдают подвох. Нужно отметить, что агрегаторы нейросетей часто съедают или игнорируют часть сложных запросов, поэтому саму эмоцию лучше ставить в самое начало текстового блока. Лёгкий прищур от яркого весеннего солнца. Слегка прикушенная нижняя губа в момент напряжённых раздумий. Искренняя, тяжёлая усталость после долгого рабочего дня. Такие нюансы заставляют зрителя поверить в происходящее на экране. Конечно, обе стороны медали здесь очевидны. С одной стороны, слишком сложная, гротескная эмоция может исказить геометрию лица до неузнаваемости, с другой — нейтральное выражение делает кадр скучным фото на паспорт. Цифровой бомонд предпочитает использовать составные конструкции для обхода этих системных ограничений. Вначале задаётся базовое настроение, затем уточняется микро-напряжение конкретных лицевых мышц, ну и, наконец, прописывается точное направление взгляда. Разумеется, смотреть персонаж должен прямо в объектив невидимой камеры, иначе магия селфи разрушится в мгновение ока. Да и самим зрителям куда комфортнее воспринимать прямой зрительный контакт с виртуальным собеседником.
Особенности генерации: одежда и стиль
В помятую домашнюю футболку или дорогой твидовый костюм облачиться предстоит вашему персонажу? Фактура ткани приковывает внимание ничуть не меньше, чем само лицо на переднем плане. Грандиозный провал случается, когда мощный алгоритм по нелепой случайности сливает воротник белой рубашки с шеей в единую бесформенную биомассу. Спасательный круг кроется в детальном, почти маниакальном описании материалов. Грубая вязка растянутого шерстяного свитера, потёртости на воротнике винтажной джинсовой куртки, дешёвый полиэстеровый блеск спортивной олимпийки — всё это необходимо жёстко вносить в текст. Многие пользователи грезят о создании идеальных модных луков, напрочь забывая о базовых законах физики. Ткань, натянутая на плечах, сминается естественными, глубокими складками. Именно эти заломы нейросеть генерирует с большой неохотой, если вовремя не подтолкнуть её соответствующими словами-триггерами. Изысканный шёлковый платок на шее потребует упоминания мягких, струящихся драпировок и игры света на изгибах ткани. Неоднозначный результат получается при попытке сгенерировать сложные геометрические принты или осмысленные надписи. Буквы часто превращаются в нечитаемую инопланетную вязь, ломая всю кропотливо выстроенную иллюзию. Лучше отказаться от футболок с текстом в пользу однотонных базовых вещей или простых абстрактных паттернов. Тем более, не сильно ударит по кошельку использование лаконичных образов, так как они требуют значительно меньшего количества итераций перерисовки.
Стилизация под разные эпохи
Полароидный снимок из девяностых. Или засвеченный кадр на старую плёночную мыльницу. Подобные махинации со временем требуют совершенно особого подхода к формированию промта. Буквально в две тысячи десятом году фильтры Инстаграма стали настоящей цифровой революцией, однако история автопортретов началась задолго до появления первых смартфонов. Чтобы уверенно отправить цифровое чадо в прошлое, в промт добавляют названия конкретных фотоплёнок прошлых десятилетий. Кодак Портра четыреста или Фуджифильм Суперия моментально меняют базовую цветопередачу и контрастность генерации. Щепетильный автор обязательно укажет сильное виньетирование по краям кадра, случайные засветки красного цвета от приоткрытой крышки фотоаппарата, пыль и глубокие царапины на эмульсии. Когда-то тихое маргинальное увлечение ломографией сейчас превратилось в мощнейший инструмент стилизации для современных нейрохудожников. Впрочем, не стоит сбрасывать со счетов и раннюю цифровую эпоху, которая сейчас переживает неожиданный ренессанс. Кадры с дешёвых веб-камер нулевых годов, с их ужасающим разрешением в ноль целых три десятых мегапикселя, обладают своим неповторимым, ностальгическим шармом. Грубая пикселизация, сильные хроматические аберрации по контурам объектов, жёсткий пересвет на лбу от встроенной вспышки — все эти уродливые артефакты умышленно вносятся в тело запроса для достижения максимальной визуальной достоверности. Внести свою лепту в реализм поможет и лёгкий смаз в движении, имитирующий дрогнувшую руку непрофессионального фотографа.
Чем дополнить сцену?
Что насчёт дополнительных деталей кадра? Рука, держащая телефон. Деталь мелкая. Но критически важная. На нейросетевых руках часто оседает львиная доля зрительской критики. Алгоритмы до сих пор путаются в количестве пальцев (иногда их предательски бывает шесть или даже семь). Поэтому кисть, попадающую в объектив, желательно прятать в глубокой тени, обрезать границей кадра или сильно размывать фокусом. Если же рука уверенно стоит на ногах в вашей композиции и занимает центральное место, придётся буквально разложить по полочкам каждую фалангу в текстовом описании. Внушительный массив анатомических параметров Гугл обрабатывает гораздо лучше, если идти строго от общего к частному. Сначала описывается само действие удержания гаджета, затем положение предплечья в пространстве, ну и, наконец, напряжение сухожилий под кожей. Кроме того, на самый передний план часто помещают посторонние бытовые объекты. Бумажный стаканчик с остывшим кофе, край вязаного шарфа, нейлоновая лямка городского рюкзака. Эти, казалось бы, мусорные элементы создают многоплановость, филигранно обманывая глаз самого придирчивого зрителя. Само собой, направление света и температура теней на этих предметах должны строго совпадать с общий светом сцены. Нельзя не упомянуть и про популярнейшие зеркальные селфи. Тут задача для составителя промта усложняется многократно. Отражение самого телефона в пыльном зеркале, жирные пятна на стекле, слепящая вспышка прямо в лоб — всё это требует поистине ювелирной точности при составлении команды.
Сложно ли выстроить освещение?
Натуральный свет или студийная лампа? Выбор главного источника кардинально меняет восприятие всей картинки. Искусственные кольцевые лампы, невероятно популярные среди блогеров, оставляют специфический круглый блик в глазах. Этот надёжный современный аппарат для освещения лица легко сымитировать, если вписать в промт фразу о белом кольцевом свете, отражающемся в зрачках. Однако мягкий рассеянный свет от окна в пасмурный день даёт куда более благородный, ровный тон кожи без жёстких теней под носом и подбородком. Стоит задумываться и о цветном освещении. Заливка кадра глубоким фиолетовым или ярко-красным неоном отлично скрывает многие огрехи генерации, но делает лицо слишком плоским и мультяшным. Тёплый свет заходящего солнца, напротив, безжалостно подчёркивает каждую неровность рельефа, каждую морщинку. В лучах золотого часа кожа приобретает красивый бронзовый оттенок, а волосы подсвечиваются сзади естественным ореолом. Да и самим виртуальным персонажам такой свет добавляет некоего романтичного флёра. А если ещё вспомнить про резкий контровой свет от уличных фонарей глубокой ночью, то простор для творческих экспериментов становится поистине безграничным.
Найти свой идеальный набор слов с первой же попытки вряд ли удастся даже самому опытному промт-инженеру. Экспериментируйте с углами освещения, не бойтесь добавлять физические изъяны и всегда держите в уме ту самую атмосферу лёгкой небрежности, присущую настоящим любительским кадрам с вытянутой руки. Пусть каждый сгенерированный портрет обретёт живую искру и порадует глубокой, аутентичной эстетикой.