В сети полно завораживающих картинок, сгенерированных нейросетями, и обыватель довольно часто думает, что создать подобный шедевр проще простого. Буквально десятилетие назад это было роскошью, доступной лишь мастерам цифровой кисти, но сейчас технологии шагнули далеко вперёд. Многие считают, что машине достаточно бросить пару слов, однако на самом деле результат часто разочаровывает. Всплывут на экране вместо ожидаемой магии жуткие артефакты или нелепая наляпистость. И всё-таки приручить искусственный интеллект вполне реально. Но чтобы не ошибиться, нужно скрупулёзно изучить анатомию текстовой подсказки.
Архитектура запроса
Служит обычная запятая чаще всего разделителем между словами. Начинать стоит с самого главного объекта, вокруг которого выстраивается вся композиция. Ведь именно он приковывает внимание зрителя в первую очередь. Затем идёт описание окружения, дополненное деталями освещения, приправленное указанием стиля, завершённое техническими параметрами виртуальной камеры. Сложно ли это на первый взгляд? Возможно, но логика тут железная. Разумеется, львиная доля успеха зависит от точности формулировок. Выдаст машина нечто невразумительное, если просто написать про девушку в лесу. А вот добротный детализированный текст творит чудеса. Стоит отметить, что каждое лишнее слово вносит сумятицу. Нет смысла перегружать систему бессмысленными эпитетами.
Как выбрать стиль?
Огромное значение имеет визуальный язык. К слову, именно стилистический маркер задаёт настроение всему кадру. Первая часть работы — определение эпохи или направления живописи. Далее следует указание конкретного художника или фотографа, чьим почерком вы вдохновляетесь. Последним в цепочке идёт упоминание типа плёнки или объектива.
Можно задать образ пожилого моряка, выполненный в суровом реалистичном стиле, вдохновлённый работами Стива Маккарри, снятый на плёнку Кодак Портра четыреста, проявленный с резкими тенями.
Выглядит впечатляюще. Кошелёк станет легче, если заказывать такую съёмку в студии, а тут алгоритм выдаёт готовый результат за секунды. К тому же, это не сильно ударит по бюджету, если использовать бесплатные тарифы генераторов.
Портретная фотография в нейросетях
Вызывают наибольший отклик всегда лица людей. Естественно, сгенерировать человека без изъянов довольно сложно. Спасательный круг тут — точное описание эмоций и света.
Имеет смысл описать молодую женщину, обладающую рыжими волосами, украшенную веснушками, озарённую лёгкой улыбкой, залитую светом золотого часа, запечатлённую на объектив пятьдесят миллиметров (с открытой диафрагмой).
Этот изысканный художественный запрос гарантированно выдаст красивую картинку. Впрочем, не стоит забывать о композиции. Ведь крупный план тяготеет к симметрии. Да и самим персонажам комфортнее «дышать» в кадре, когда есть пространство над макушкой. Обыватель часто лепит лицо на весь экран, но лучше оставлять немного воздуха. Обе стороны медали здесь очевидны: слишком много деталей перегрузят кадр, а слишком мало — сделают его скучным.
Зачем нужны модификаторы освещения?
Свет лепит форму. Это же правило касается и алгоритмов. Безусловно, без указания типа освещения картинка получится плоской.
Стоит попросить алгоритм изобразить флакон дорогих духов, стоящий на чёрном бархате, подсвеченный драматичным освещением, выхваченный боковым софтбоксом, отражённый нижним экраном.
Солирует в этой сцене именно игра теней. Нужно отметить, что такие запросы — настоящий кладезь для тех, кто занимается маркетплейсами. Серьёзное вложение в контент тут не требуется. Тем более что нейросеть сама расставит блики там, где нужно. А если ещё вспомнить про неоновый свет, то результат заслуживает истинного уважения.
Отличным вариантом станет киберпанк улица, омытая дождём, освещённая неоновыми вывесками, отражённая в лужах, пропитанная кинематографичным светом.
Зрелище получается грандиозное.
Пейзажи Исландии: северный колорит
Иногда хочется передать атмосферу конкретного места. Главное — угадать с палитрой. Исконно суровые края грезят холодными оттенками. Само собой, в таких промтах нужно использовать географические маркеры.
Хорошей идеей станет вписать чёрный песчаный пляж Вик, окружённый базальтовыми скалами, омываемый бушующим морем, накрытый тяжёлыми грозовыми облаками, снятый с дрона на широкий угол.
Этот колоритный северный антураж буквально бросается в глаза. Буквально пару лет назад туристы тратили тысячи долларов на билеты, а сейчас подобный вид оседает на жёстком диске за пару кликов. Однако не стоит перебарщивать с фильтрами в запросе. Махинации с излишней постобработкой только испортят дело. Лучше отказаться от слов вроде расширенного динамического диапазона, иначе появится жуткая неестественность.
Фантастический сюрреализм
Полёт фантазии. Он ничем не ограничен. Натыкаешься порой на совершенно безумные генерации, и местный бомонд цифровых художников приходит в восторг. С чего начинается создание невозможного? С разрушения привычной логики.
Хорошо работает летающий остров, состоящий из старинных часов, извергающий водопад из шестерёнок, окутанный туманной дымкой, написанный маслом в стиле Сальвадора Дали.
Эта вычурная пространственная иллюзия отлично подойдёт для обложки книги. Кстати, исторические детали тоже могут внести лепту. Зародился сюрреализм в двадцатых годах прошлого века, и вплетение ретро-элементов пойдёт только на пользу. Ну и, конечно же, не стоит бояться экспериментов. Ложка дёгтя в таких запросах — непредсказуемость. Машина может сгенерировать полную чепуху. Но результат того стоит.
Вредно ли использовать чужие запросы?
Обязательно ли выдумывать всё с нуля? Вовсе нет. Копировать чужие идеи на этапе обучения — это нормально. Разложить по полочкам структуру успешного промта бывает невероятно полезно. Тем более, многие авторы щедро делятся своими наработками. К первой группе относятся технические параметры, ко второй — стилистические ухищрения.
Базой может послужить уютная деревянная хижина, затерянная в заснеженном лесу, пускающая дым из трубы, излучающая тёплый свет из окон, запечатлённая на длинной выдержке.
Можно взять этот текст, заменить хижину на современный стеклянный дом (с плоской крышей), и получить совершенно новый результат. Подводные камни всплывут только в том случае, если бездумно копировать огромные полотна текста. Важно понимать функционал каждого введённого слова.
Коммерция
Дело в том, что бизнес давно взял ИИ на вооружение. Заказывать фуд-съёмку — занятие щепетильное, бьёт по бюджету ощутимо. А нейросеть позволяет создавать аппетитные кадры довольно быстро.
Отлично сработает гамбургер, начинённый сочной говяжьей котлетой, политый расплавленным сыром, дополненный свежим листом салата, окружённый летящими каплями соуса.
Выглядит это потрясающе. Вся суть в том, что машина идеально понимает текстуры еды. Нельзя не упомянуть о предметке.
Подойдёт неоднозначный самобытный кадр, вмещающий керамическую кружку ручной работы, стоящую на дубовом столе, залитую утренним светом из окна, соседствующую с льняной салфеткой.
Скрупулёзный подход к деталям здесь творит чудеса. Естественно, такие изображения легко продают товар.
Как избежать мутаций?
Лишние пальцы и кривые конечности стали мемом. Стоит ли паниковать? Нет, просто алгоритм нуждается в жёстких рамках. Часто генератор путается в сложных позах. Выручит негативный промт. Это специальное поле внутри интерфейса. Туда стоит отправлять параметры, запрещающие уродство, исключающие деформацию, отсекающие плохую анатомию, убирающие размытость. Ну, а в основном запросе лучше использовать простые статические позы.
Спасает ситуацию мужчина, облачённый в строгий костюм, сидящий в кожаном кресле, читающий газету, освещённый контрастным светом в стиле нуар.
И всё же, ошибки иногда случаются. Впрочем, современные версии нейросетей справляются с анатомией куда лучше своих предшественников. Да и обыватель уже не так пугается мелких неточностей. Кроме того, неудачный дубль всегда можно перегенерировать.
Мир генеративного искусства поистине внушительный. Вносить правки в текст можно бесконечно, улучшая результат шаг за шагом. Ну и, наконец, главное правило — регулярная практика. Нет смысла гнаться за идеалом с первой попытки, лучше планомерно изучать реакцию машины на разные комбинации слов. Ведь именно так рождаются шедевры. Пусть каждый ваш текстовый запрос превращается в потрясающую визуальную историю, которая порадует домочадцев и удивит коллег. Удачи в творческих экспериментах!