В сети можно найти множество умопомрачительных картин, сгенерированных искусственным интеллектом, от которых просто захватывает дух. Однако спектр объектов не ограничивается грандиозными фэнтези-пейзажами или неоновым киберпанком, ведь порой обыватель сталкивается с невероятно банальной задачей — нарисовать обычный фрукт. Кажется, что проще простого попросить машину выдать картинку жёлтого плода, но на деле результат довольно часто пестрит лишними концами, странными тенями или неестественной геометрией. Плохой сон — это не всегда кошмар с монстрами, иногда это просто пластиковый, пугающе глянцевый макет вместо съедобного продукта, лишённый всякого изыска. Люди часами бьются над клавиатурой, пытаясь заставить алгоритмы выдать естественную текстуру. Но чтобы не ошибиться, нужно правильно сформулировать запрос, разобрав каждую деталь скрупулёзно и вдумчиво.
Нейросети
С выбором софта дело обстоит сложнее, чем кажется на первый взгляд. Буквально десятилетие назад генерация изображений по тексту казалась магией для избранных программистов, но сейчас доступ к технологиям льётся рекой. И всё-таки, куда податься новичку? Разумеется, львиная доля пользователей оседает в популярных закрытых экосистемах или опенсорсных моделях. Эти системы творят чудеса, если понимать их базовые алгоритмы. Начинать работу стоит с осознания того, что машина не мыслит образами, а воспринимает лишь текстовые токены (преобразованные в математические векторы). Сложно ли укротить эту модель? Да, процесс не сложный, но кропотливый, требующий постоянных экспериментов и усидчивости. К слову, не стоит забывать о специфике каждого конкретного движка. Ведь именно одни сети тяготеют к кинематографичности и художественности, тогда как другие требуют детальных технических настроек. При перегрузке промта лишними эпитетами смысл часто искажается, и на выходе получается сплошная наляпистость. Индустрия уже твёрдо стоит на ногах, поэтому базовые постулаты генерации работают везде примерно одинаково.
Как выбрать освещение?
Отблеск света на пористой кожуре. С этого крошечного нюанса начинается магия реалистичной фотографии. Естественно, без правильного света даже самый изысканный кадр превратится в плоскую, невыразительную картинку. С одной стороны, можно довериться автоматике, с другой — лучше прописать конкретную схему самому. Выручит студийный свет, дополненный мягкими софтбоксами, направленный под углом в сорок пять градусов. Вся суть в том, что жёлтая изогнутая поверхность очень коварна, она поглощает объёмные тени и часто выглядит ненатурально. Поэтому стоит использовать промт вроде:
«реалистичная макросъёмка спелого банана, лежащего на старом деревянном столе, освещённого тёплым утренним светом из окна, снятого на объектив восемьдесят пять миллиметров, диафрагма один точка восемь, гиперреализм, высокая детализация»
Это же классика, которая не сильно ударит по кошельку в плане времени генерации и потраченных нервов. Ну и конечно же, не скупитесь на слова, описывающие мелкие коричневые пятнышки на шкурке.
Коммерческая фуд-съёмка
Для рекламных баннеров или макетов подход нужен совершенно иной. Здесь солирует идеальная, выверенная до миллиметра форма. Впрочем, многие считают, что достаточно написать слово «реклама», но на самом деле алгоритм выдаст лишь кислотный переизбыток контраста. Хороший добротный результат получается, когда запрос строится шаг за шагом в строгой последовательности. Сначала задаётся тёмный или светлый фон, затем помещается сам объект, после чего прописывается нужная атмосфера. Картинка, наполненная летящими брызгами воды, украшенная колотым льдом, подсвеченная контровыми бликами, приковывает внимание мгновенно. Пример отличного коммерческого промта:
«профессиональная рекламная фотография наполовину очищенного банана, летящего на фоне чёрного глянцевого стекла, с каплями кристально чистой воды в воздухе, высокоскоростная съёмка, студийный свет, восьмикиловаттное разрешение, фотореализм»
Заслуживает истинного уважения способность машин детализировать мельчайшие капли, застывшие в полёте. Тем более что такой динамичный кадр выглядит внушительно на любом экране. Да и генерация подобных сцен совершенно не бьёт по бюджету проекта.
Сюрреализм и вычурный арт
Тяга к экспериментам. Она сидит глубоко в каждом из нас, заставляя выходить за рамки привычного. А если ещё вспомнить скандальные работы художников прошлого века, то желание создать нечто безумное всплывёт само собой. Настоящий банан, приклеенный серебристым скотчем к белой стене галереи, был продан за колоссальные деньги в две тысячи девятнадцатом году, однако на этом дело развития современного искусства не закончилось. Искусство требует новых, смелых форм. Безусловно, создать самобытный колоритный шедевр поможет грамотный, слегка безумный запрос. Стоит попробовать такой вариант:
«огромный банан из ярко-розового неона, парящий посреди заброшенного индустриального лофта, стиль киберпанк, кинематографичное освещение, объёмный туман на полу, снято на плёнку тридцать пять миллиметров, мрачная атмосфера»
Зрелище получается удручающее в хорошем смысле слова, с лёгкой ноткой технологического постапокалипсиса. Кстати, не стоит перебарщивать с мелкими деталями на заднем плане, чтобы главный герой не потерялся на фоне разрушенных кирпичных стен. Композицию венчает именно центральный неоновый свет, который заставляет облачиться всю сцену в нужные тона.
Где искать вдохновение?
Копирование стилистики известных фотографов или живописцев часто спасает зашедшую в тупик ситуацию. Обязательно ли указывать конкретные имена в строке ввода? Вовсе нет, но это работает как надёжный спасательный круг. К тому же, математические матрицы отлично знают почерк мирового бомонда от мира глянцевой фотографии. Если ввести в строку «банан в стиле Энди Уорхола, поп-арт, контрастные кислотные цвета, шелкография, плоские тени», результат поразит своей исторической точностью. Это связано с тем, что нейросети долго обучались на огромных массивах живописи, где такие изображения имеют чрезвычайно высокий вес. Этот стиль — настоящий кладезь идей для креативного агентства. Кроме того, можно смело поэкспериментировать с плёночной, тёплой эстетикой. Внести лепту в ламповую атмосферность поможет запрос:
«полароидный снимок наполовину съеденного банана на капоте красного ретро-автомобиля, засветки от яркого солнца, винтажный стиль, сильная зернистость плёнки, ломография»
Такая выцветшая картина словно позволит окунуться в беззаботные семидесятые годы. Да и самим зрителям куда приятнее смотреть на живой, слегка несовершенный плёночный кадр.
Натюрморт на Бали: тропики
Капли прохладной росы на широком зелёном листе влажной пальмы мягко скатываются вниз. Именно с такой медитативной атмосферы стоит начинать генерацию экзотических, согревающих сюжетов. Ведь исконно тропический жаркий антураж требует невероятно щепетильного отношения к оттенкам зелёного и жёлтого. Многие грезят о сочных, рекламных картинках, но натыкаешься чаще всего на пережжённые цвета, от которых откровенно болят глаза. Чтобы благополучно избежать этого, кошелёк станет легче на пару минут вашего времени, потраченного на подбор точных английских слов. Попробуйте написать так:
«натюрморт с веткой свежих спелых бананов на фоне бирюзового океана на острове Бали, закатное тёплое солнце, мягкий фокус на заднем плане, плетёная корзина на белом песке, гиперреализм, мягкий контраст»
Этот неоднозначный, но чертовски красивый подход моментально раскроет обе стороны медали. Вы получите и аппетитный продукт, и шикарный расслабляющий пейзаж. Однако следите за тем, чтобы на горизонте не всплыли лишние парусники или птицы с тремя крыльями. Лучше отказаться от слишком общих, размытых фраз вроде «красивый вид на море».
Как бороться с дефектами?
Нередко на готовой картинке сразу бросается в глаза лишняя отслоившаяся кожура или пугающе сросшиеся концы двух плодов. Как с этим эффективно бороться? Поможет только строгий отрицательный промт (блок негативных слов). Нужно отметить, что именно он имеет решающее значение при работе со сложными органическими формами, так как подобная геометрия скрывает подводные камни. В большинстве интерфейсов, например, обязательно стоит прописать «лишние пальцы, мутация, анатомическая деформация, плохое качество, размытость, пластиковая текстура, переэкспозиция». Конечно, это не даёт абсолютной, стопроцентной гарантии успеха с первой попытки, однако значительно снижает процент откровенного брака. Серьёзное вложение времени в глубокое изучение работы негативных промтов вскоре окупится сторицей. Нельзя не упомянуть, что иногда электронные мозги просто не понимают физику очистки длинного плода. Уж слишком сложна логика сгибающихся волокон. Тогда лучше полностью отказаться от идеи показать сам процесс и генерировать либо целый фрукт в кожуре, либо уже аккуратно нарезанный на тарелке.
«Нарезанный кружочками банан в глубокой керамической миске с овсяной кашей, утренний боковой свет, профессиональная фуд-фотография, вид строго сверху»
— отличный, гарантированно работающий и безопасный бюджетный вариант.
Постобработка
Сырой, только что скачанный результат из нейросети крайне редко бывает идеальным шедевром. Своя изюминка есть в каждой генерации, но маленькая ложка дёгтя всегда непременно найдётся, будь то цифровой шум в глубоких тенях или странные артефакты на краях объектов. Поэтому обязательный прогон через нейросетевые апскейлеры (программы для умного увеличения разрешения) становится суровой, но необходимой реальностью. Ну, а если результат не устроил по цветам, финальную цветокоррекцию лучше всегда докрутить вручную в старом добром фоторедакторе. Разложить по полочкам все кричащие оттенки жёлтого надёжно поможет классическая кривая контраста. Настоящий рай для увлечённого перфекциониста начинается именно здесь, за ползунками насыщенности. Ведь даже самый удачный, выверенный промт — это лишь хорошая база для старта. Тем более что лёгкая, ненавязчивая ретушь штампом навсегда скроет все мелкие махинации искусственного интеллекта. Не стоит перегружать изображение агрессивными фильтрами, пусть натуральная текстура спокойно дышит. Ну и, наконец, позвольте вашему внутреннему творцу немного пошалить под конец, добавляя стильный искусственный шум или лёгкую виньетку по краям.
Каждый сгенерированный кадр бережно хранит в себе частичку вашей изначальной задумки, превращая сухой набор слов в осязаемый визуальный шедевр. Поиск того самого, идеального текстового запроса может занять не один долгий час, но детский восторг от получившейся картинки легко перекроет все потраченные усилия. Обязательно сохраняйте удачные комбинации слов в отдельный блокнот, ведь ваше творческое чадо не должно затеряться в истории чатов. Пусть ваши смелые эксперименты с нейросетями всегда приносят сочные, фотореалистичные плоды, а каждый новый тропический натюрморт порадует домочадцев и заказчиков.