В сети представлено множество сгенерированных картинок, от которых буквально захватывает дух, однако далеко не каждый задумывается о скрытой механике их создания. Буквально десятилетие назад подобная живопись казалась недостижимой фантастикой, но сейчас умные алгоритмы прочно вошли в рутину художников и дизайнеров. Многие считают процесс генерации интуитивным развлечением, но на самом деле за красивым фасадом скрывается скрупулёзный текстовый инжиниринг. Пытаясь получить шедевр с первой попытки, рядовой обыватель часто натыкается на стену из искажённых лиц и нелепых пропорций. А начать стоит с понимания базовой структуры текстового запроса, который и задаёт нейросети правильный вектор.
С чего начинается создание?
Задача не из лёгких. Ведь машина не умеет читать мысли, ей требуются предельно точные, почти математические указания. В представлении многих людей достаточно написать пару слов, однако львиная доля успешного результата зависит от детализации. Первым делом мы задаём главный объект, описанный максимально конкретно, без размытых метафор. Далее следует окружение, где мы уточняем время суток, погодные условия и общее настроение сцены. Отдельно стоит упомянуть стилистику, ведь именно она диктует визуальный язык, будь то строгий фотореализм или вычурный импрессионизм. Последним в очереди идёт технический блок, куда вписываются параметры виртуальной камеры, тип освещения и пропорции кадра. И всё-таки, даже при идеальной формуле, иногда результат получается неоднозначным.
Как выбрать освещение?
Свет творит чудеса. И это не пустые слова, а базовая истина любого визуального искусства. Обязательно ли расписывать каждый блик? Вовсе нет. Однако указать характер лучей определённо стоит. Выбор здесь очень большой. Одним из самых популярных видов традиционно считается кинематографический свет, дающий глубокие тени и насыщенные цвета. За ним следует мягкое студийное освещение, идеально подходящее для портретов и предметной съёмки. Компактное решение для создания драматичного антуража — это контрастный контровой свет, вырезающий силуэт из темноты. Ну и, наконец, нельзя не упомянуть золотой час, мягкие лучи которого превращают любой пейзаж в настоящую сказку. Дело в том, что алгоритмы отлично понимают фотографические термины, поэтому смело используйте их в работе.
Портрет в неоновом свете
Прямо перед объективом возникает лицо молодой девушки, освещённое холодными синими и тёплыми пурпурными лампами. К слову, создание добротного портрета требует особого подхода к тексту. Не скупитесь на описание текстуры кожи и выражения глаз, иначе результат получится пластмассовым. Вот вполне рабочий вариант:
«Крупный план лица девушки-киборга, механические детали на щеках, неоновое освещение Токио, дождь, отражения в глазах, объектив восемьдесят пять миллиметров, диафрагма один и два, гиперреализм, разрешение восемь ка»
В этой связке солирует именно оптика, размывая задний фон и фокусируя внимание на деталях. Конечно, генерация лиц — это всегда ложка дёгтя в мире алгоритмов, однако правильные настройки камеры сводят риск брака к минимуму.
Стиль гранж в интерьере
Зрелище удручающее, если не знать, как правильно распорядиться фактурами. Искусственный интеллект тяготеет к идеальным, вылизанным картинкам, поэтому хаос приходится прописывать насильно. Чтобы получить изысканный колоритный лофт, придётся внести лепту в виде грязных прилагательных. Попробуйте такой запрос:
«Заброшенная комната в стиле гранж, облезлые обои на стенах, старый кожаный диван по центру, разбитое окно, сквозь которое пробивается тусклый утренний свет, пыль в воздухе, мрачная атмосфера, кинематографическая цветокоррекция, движок Unreal Engine 5»
Здесь каждый элемент, усиленный атмосферными явлениями, отлитый в форму мрачной эстетики, снабжённый нужной долей реализма, работает на общий замысел. Не стоит перебарщивать с деталями (иначе возникнет наляпистость), достаточно обозначить главные акценты.
Стоит ли усложнять?
Ответ напрашивается сам собой. Чем длиннее текст, тем сильнее машина путается в смыслах, теряя изначальную задумку. Разумеется, хочется разложить по полочкам каждую мелочь, но кошелёк внимания нейросети не бесконечен. Слишком сложный промт бьёт по бюджету композиции: важные объекты вытесняются второстепенными, а изюминка исчезает. Тем более, что иногда короткая фраза выдаёт куда более грандиозный результат. Вместо бесконечного потока слов лучше отказаться от мусорных эпитетов вроде «красивый» или «великолепный». Эти слова не несут визуальной информации, они лишь занимают место. Лучше замените их на конкретные характеристики: «ржавый», «полупрозрачный», «зеркальный». И вот тогда ваши идеи встанут на ноги.
Пейзаж
Отдых в горах всегда запоминается надолго. А вот воссоздать его на экране — задача для щепетильного творца. Исторически сложилось так, что пейзажи даются алгоритмам проще всего, ведь в них нет строгой анатомии. Буквально в тысяча девятьсот девяностом году программы едва справлялись с пиксельными деревьями, а сегодня они генерируют леса за три секунды. Пример запроса:
«Горная долина на рассвете, густой туман стелется по земле, на переднем плане заснеженные ели, вдали массивные скалистые пики, пробивающиеся лучи солнца, стиль картин Альберта Бирштадта, масло на холсте, детальная прорисовка»
Этот запрос — настоящий кладезь для тех, кто ищет атмосферные фоны. Безусловно, здесь важна отсылка к художнику, которая сразу задаёт нужный вектор цветовой палитры и манеры письма.
Технические махинации
Скрытые параметры часто пугают новичков. На самом деле, именно они выступают тем спасательным кругом, который вытягивает картинку из пучины посредственности. Взять хотя бы соотношение сторон. По умолчанию большинство систем выдаёт квадрат, что не всегда подходит для масштабных сцен. Использование специальных команд (например, –ar 16:9) меняет всё восприятие кадра. Да и самим зверькам-алгоритмам комфортнее работать в заданных рамках, не пытаясь втиснуть широкую панораму в узкий квадрат. Не забудьте проверить вес слов, если ваша платформа поддерживает такую функцию. Вынесение важного термина в начало с коэффициентом усиления заставит нейросеть обратить на него первоочередное внимание. Ошибки, конечно, всплывут, но их будет гораздо меньше.
Вредно ли копировать?
Обе стороны медали здесь предельно ясны. С одной стороны, слепое заимствование чужих формул убивает творчество, с другой — это лучший способ обучения. Исконно художники учились, копируя мастеров. Поэтому смело берите готовые промты бомонда цифрового искусства, разбирайте их на составные части и модифицируйте под свои нужды. Замените время года, поменяйте освещение или добавьте неожиданный объект в центр композиции. Именно так рождаются самобытные стили. Не бойтесь экспериментировать с парадоксальными сочетаниями: скрестите викторианскую эпоху с киберпанком, или отправьте рыцаря в космос. Умные машины стерпят любые фантазии, покорно визуализируя самые безумные постулаты вашего воображения.
Не бойтесь ошибаться и тестировать самые непредсказуемые комбинации слов, ведь каждая неудачная генерация лишь приближает вас к пониманию алгоритма. Пусть процесс создания цифровых картин станет для вас увлекательным путешествием, а не рутинной битвой с машиной, и результат обязательно порадует домочадцев и коллег.