В сети представлено множество роликов, сгенерированных нейросетями, которые буквально поражают воображение обывателя. Буквально десятилетие назад производство даже примитивной анимации требовало внушительных бюджетов, но сейчас с этой задачей справляется пара строк текста. Плохой итоговый результат — это не всегда вина алгоритма. Нередко проблема кроется в неумении человека правильно сформулировать свои мысли. Многие считают написание запросов примитивным занятием, но на самом деле процесс требует скрупулёзного подхода и понимания логики машинного зрения. А начать стоит с освоения базовых принципов составления текстовых команд.
С чего начинается магия?
С определения главного объекта в кадре. К слову, львиная доля неудачных генераций связана именно с размытостью центрального образа. В такой ситуации выручит точное исчерпывающее описание персонажа или предмета, лишённое сложных философских абстракций. Сначала задаётся субъект, наделённый конкретными физическими характеристиками. Далее объект помещается в детализированное окружение. После этого тщательно настраивается виртуальное освещение. И только в самом финале прописывается движение камеры. Это работает. Ведь машина понимает лишь прямые указания. Не стоит перегружать первое предложение эпитетами, лучше сосредоточиться на сути. Тем более, что сложные метафоры алгоритм просто проигнорирует.
Свет и камера
Огромное значение имеет виртуальная операторская работа. Эстетичны ли статичные кадры? Само по себе неподвижное полотно не отличается выразительностью, однако грамотно выстроенный свет творит чудеса.
Объёмную живую картинку создаёт студийное освещение, дополненное мягкими тенями.
Довольно часто начинающие пользователи забывают указать тип объектива или крупность плана. Из-за этого результат выглядит удручающе. Чтобы избежать подобной наляпистости, стоит использовать профессиональные термины кинематографистов. Например, упоминание тридцати пяти миллиметрового объектива кардинально меняет восприятие сцены. Съёмка с дрона также добавит масштабности. И всё же, не скупитесь на технические подробности.
Портретная съёмка: детали
Настоящий рай для экспериментов. К первой группе удачных запросов относятся детальные описания лиц крупным планом. Стоит отметить, что нейросети отлично прорисовывают текстуру кожи, если попросить их об этом напрямую. Хороший запрос звучит как описание молодой веснушчатой девушки, смотрящей прямо в объектив на фоне неоновых огней вечернего Токио. Далее следует уточнить освещение, которое должно быть контрастным, с преобладанием синих и пурпурных оттенков. Следующий важный критерий кроется в динамике. Мы добавляем лёгкий ветер, красиво развевающий волосы героини. Это же правило касается и мужских портретов. Там фактурный суровый взгляд солирует на фоне мрачного индустриального пейзажа. Разумеется, кошелёк станет легче, если заказывать подобные съёмки у профессиональных студий, а тут программа выдаёт результат за считанные минуты.
Стилистика
Спектр визуальных решений практически безграничен. Выбор стилистики очень большой. Иногда хочется получить не сухой фотореализм, а самобытный анимационный ролик. Вся суть в том, что алгоритму нужно чётко указать желаемое направление искусства. Дополняет образ упоминание конкретных эпох или техник. Отличным примером служит стиль акварельной живописи или эстетика восьмидесятых годов прошлого века (так называемый ретровейв). Безусловно, стоит избегать смешения слишком разных визуальных школ в одном запросе. Иначе на выходе получится бессмысленная каша. К тому же, изысканный винтажный антураж требует соответствующей цветокоррекции, о которой тоже нельзя забывать.
Пейзажи и архитектура
Сложно ли генерировать масштабные сцены? Да, но результат того стоит. Особый интерес вызывает конструирование вымышленных городов или инопланетных ландшафтов. Начинать нужно с описания грандиозного футуристического мегаполиса, пронизанного транспортными артериями. Город утопает в лучах тёплого заходящего солнца. Затем прописывается общая атмосфера, для чего используются слова вроде «кинематографичный», «эпичный», «детализированный». Отдельно стоит упомянуть движение виртуальной камеры. Она должна плавно пролетать над высокими шпилями небоскрёбов. Зрелище получается поистине впечатляющее. Ведь именно такие кадры приковывают внимание зрителя с первых секунд.
Динамика в кадре
Движение оживляет картинку. Как заставить персонажа бежать или прыгать? Приходится использовать максимально точные глаголы действия. В представлении многих обывателей достаточно написать слово «бег». Однако машина нуждается в строгом контексте.
Человек, стремительно убегающий от преследования по узким улочкам старого европейского города под проливным дождём — вот пример добротного рабочего промта.
Довольно сложно добиться идеальной анатомии при быстром перемещении объектов. Современные модели справляются с этим всё лучше, но артефакты всё равно всплывут. Главное — угадать с ритмом происходящего. Впрочем, не стоит ожидать безупречной физики от самых первых генераций.
Ошибки новичков
Подводные камни встречаются на каждом шагу. Игнорирование негативных промтов бьёт по бюджету времени сильнее всего. Авторы часто забывают прописать то, чего в кадре быть категорически не должно. Среди частых дефектов встречаются искажённые пропорции тел. Также алгоритм грешит созданием лишних конечностей. Нередко попадаются неестественные кислотные цвета. Все эти проблемы легко устраняются парой слов в соответствующем поле блокировки. Кроме того, чрезмерная длина запроса также вредит результату. Алгоритм просто теряет фокус. Лучше отказаться от пустых литературных описаний в пользу сухих точных характеристик.
Абстрактные сюжеты
Наряд для избранных. Далеко не всегда нужна строгая документальная реалистичность. Иногда творцы грезят о сюрреалистичных мирах, где законы физики перестают работать. Запрос может описывать гигантские карманные часы, плавящиеся на ветвях высохшего дерева в раскалённой пустыне. Естественно, здесь солирует освещение, подчёркивающее фактуру раскалённого песка. Камера медленно приближается к циферблату. При этом стрелки механизма вращаются в обратную сторону. Подобные махинации с пространством позволяют создавать потрясающие музыкальные клипы. Ну и, конечно же, не забываем про цветовую палитру, выдержанную в тёплых золотистых тонах.
Коммерческое использование
Серьёзное вложение времени всегда окупается сторицей. Рекламные ролики требуют совершенно иного подхода к написанию команд. В фокусе внимания всегда находится конкретный продукт. Роскошный спортивный автомобиль, стремительно мчащийся по горному серпантину на рассвете, снимается с нижнего ракурса для придания мощи. Особый колорит придают мелкие капли росы на блестящем кузове. Динамичный пролёт объектива фиксирует отражения утреннего неба в стёклах. Каждую из этих деталей нужно методично разложить по полочкам в тексте. Тем более, что заказчики не терпят приблизительных результатов. Да и самим создателям комфортнее работать по чётко выверенному плану.
Еда в кадре
Вызывает аппетит. Съёмка кулинарных шедевров требует особой щепетильной настройки виртуальной оптики. Кусок сочного прожаренного мяса, исходящий горячим паром, должен выглядеть безупречно. Мясо лежит на старой деревянной доске в окружении свежей зелени. Здесь стоит использовать режим макросъёмки. Зритель должен рассмотреть каждую деталь текстуры блюда. Фокусное расстояние настраивается с расчётом на размытие заднего фона. Там может уютно гореть огонь камина, не отвлекающий от основного объекта. Нужно отметить, что тёплые оттенки света делают еду гораздо более привлекательной.
Исторические эпохи
Погружение в прошлое. Египетская цивилизация всегда вызывала неподдельный интерес у исследователей. Оживить древние улицы можно довольно просто. Сначала детально описываются массивные каменные постройки, залитые ослепительным полуденным солнцем. Атмосферу создаёт шумный многолюдный рынок. Там смуглые торговцы в льняных одеждах предлагают ароматные специи. Дополняют образ проезжающие вдали боевые колесницы. Буквально сто лет назад археологи могли лишь рисовать подобные сцены вручную, но сейчас мы способны сгенерировать их в динамике. Пыль, медленно поднимающаяся от копыт лошадей, добавляет реализма. И всё-таки, историческая достоверность требует предварительного изучения материалов.
Животные в главной роли
Задача не из лёгких. Грамотно анимировать пушистых зверей бывает довольно сложно из-за особенностей меха. Базовый запрос на создание видео с котом выглядит так: пушистый рыжий кот грациозно прыгает за бабочкой в весеннем саду. Яркие солнечные лучи пробиваются сквозь листву деревьев. На заднем фоне образуется красивое оптическое боке. Скорость воспроизведения стоит слегка замедлить (так называемый слоу-мо). Это подчеркнёт невероятную плавность движений животного. Это же правило работает и для дикой природы. Да и самим зрителям всегда нравится наблюдать за братьями нашими меньшими. Разумеется, придётся сделать несколько попыток, прежде чем лапы и хвост перестанут сливаться в единое пятно.
Как редактировать запросы?
Процесс не сложный, но кропотливый. С первого раза идеальный ролик получается крайне редко. Спасательный круг кроется в пошаговом изменении промта. Сначала корректируется направление света. Затем меняется ракурс объектива. И только потом добавляются новые мелкие детали в окружение. Вносить сразу десяток глобальных правок не стоит. Иначе вы рискуете потерять удачную стартовую базу. Буквально пару лет назад такой контроль над искусственной генерацией казался чистой фантастикой. Сейчас же это обыденная рутина каждого профильного специалиста.
Вся эта работа с нейросетями требует лишь банальной усидчивости и искреннего желания экспериментировать. Каждый новый сгенерированный фрагмент будет получаться качественнее предыдущего, если вдумчиво анализировать результаты собственных ошибок. Освоив искусство составления точных текстовых команд, вы сможете воплощать на экране самые смелые визуальные задумки, не прибегая к аренде студий. Удачи в создании ваших первых кинематографичных шедевров!