Создание визуального шедевра за считанные секунды ещё совсем недавно казалось чем-то из области научной фантастики или, по меньшей мере, привилегией избранных художников с многолетним стажем. Сегодня же любой обладатель смартфона может почувствовать себя творцом, способным воплотить самые смелые фантазии в цифровом полотне. Приложение «Шедеврум» от Яндекса, работающее на базе нейросетей, буквально взорвало рунет своей доступностью и умением понимать «великий и могучий». Однако многие пользователи, скачав заветную программу, быстро разочаровываются: вместо эпичных картин на экране появляется нечто невнятное, с лишними пальцами или искаженной геометрией. А дело здесь вовсе не в «глупости» искусственного интеллекта. Секрет успеха кроется в умении правильно формулировать запросы. Поэтому перед началом генерации стоит разобраться в анатомии идеального промта и изучить проверенные конструкции, которые гарантированно дают качественный результат.
С чего начинается работа?
В представлении многих новичков нейросеть — это некий волшебный ящик, который должен читать мысли. Увы, телепатией алгоритмы пока не обладают. Шедеврум — это инструмент, требующий четких инструкций. Главное преимущество этой сети заключается в полноценной поддержке русского языка. Вам не нужно мучиться с переводчиком, подбирая английские термины, хотя и их алгоритм понимает довольно неплохо. Первый шаг к успеху — отказ от абстракций. Фразы вроде «что-то красивое» или «удиви меня» нейросеть, конечно, обработает, но результат будет сгенерирован случайным образом. Чтобы получить конкретное изображение, нужно действовать как режиссёр на съёмочной площадке: задать объект, окружение, освещение и стиль. Сложно ли это? Вовсе нет, если знать правильную структуру.
Анатомия запроса
Любой качественный промт строится по определенной логике, напоминающей слоёный пирог. Основу составляет главный объект. Это то, что вы хотите видеть в центре композиции. К слову, описывать его стоит максимально подробно. Вместо простого «кот» лучше написать «пушистый рыжий кот с зелёными глазами». Далее следует действие или состояние. Что делает наш герой? Сидит на подоконнике? Летит в космосе? Спит в коробке? Этот нюанс оживляет картинку. Затем мы добавляем контекст или окружение. Львиная доля атмосферы зависит именно от фона: «на фоне заката», «в киберпанк-городе», «в густом тумане». Ну и, наконец, финальный штрих — стилистические модификаторы. Это слова, которые задают тон всему изображению: «масло», «аниме», «реализм», «фотография».
Портреты и люди
С генерацией человеческих лиц у нейросетей долгое время были проблемы, но сейчас ситуация выправилась. Чтобы получить реалистичный портрет, стоит использовать проверенные формулировки. Довольно часто пользователи хотят видеть красивые женские образы. Хороший пример запроса может выглядеть так:
«Портрет красивой девушки с голубыми глазами, светлые длинные волосы, мягкий утренний свет, детальная прорисовка кожи, реализм, 8k, профессиональное фото».
Обратите внимание на уточнение «детальная прорисовка кожи» — оно спасает от «пластикового» эффекта.
А вот если душа просит чего-то более брутального, можно попробовать следующий вариант:
«Суровый викинг с густой бородой, шрамы на лице, меховая накидка, стоит во время снегопада, эпичное освещение, мрачная атмосфера, стиль тёмное фэнтези, высокая детализация».
Здесь ключевую роль играют слова «эпичное» и «мрачная», которые сразу меняют цветовую палитру. Сложнее всего даются групповые снимки. Но и тут есть выход. Попробуйте ввести:
«Семья на пикнике в парке, солнечный день, радостные эмоции, чёткие лица, стиль рекламной фотографии».
Главное — не перегружать сцену десятком персонажей, иначе нейросеть может запутаться в конечностях.
Стилизация и художественные приёмы
Шедеврум — настоящий кладезь для любителей экспериментов с художественными стилями. Обыватель часто ограничивается словом «рисунок», но палитра нейросети куда шире. Хотите почувствовать себя великим живописцем? Используйте промт:
«Одинокий домик в горах, окруженный соснами, стиль Ван Гога, звёздная ночь, масляная живопись, крупные мазки, яркие цвета».
Результат вас удивит: изображение действительно будет имитировать технику импрессионизма.
Для любителей современной поп-культуры отличным решением станет стилистика киберпанка. Запрос может звучать так:
«Футуристический самурай на мотоцикле, ночной город будущего, неоновые вывески, дождь, отражения в лужах, стиль киберпанк, яркие цвета: розовый и голубой, concept art».
А если вам ближе эстетика комиксов, стоит попробовать:
«Супергерой в красном плаще летит над Нью-Йорком, динамичная поза, стиль Marvel комикс, чёткие контуры, яркая заливка, cel shading».
Термин «cel shading» (сел-шейдинг) здесь особенно важен, так как он задает характерную для мультфильмов и комиксов прорисовку теней.
Пейзажи и архитектура
Природа и здания даются нейросети, пожалуй, лучше всего. Здесь меньше рисков получить анатомические ошибки. Однако и тут есть свои подводные камни. Скучное описание даст скучную картинку. Чтобы пейзаж «задышал», нужно добавить атмосферных явлений. Сравните два запроса. Первый: «Лес и река». Второй:
«Таинственный дремучий лес, извилистая река, утренний туман над водой, пробивающиеся лучи солнца, мох на деревьях, гиперреализм, сказочная атмосфера, render 3d».
Разница будет колоссальной. Слова «таинственный» и «сказочная» запускают ассоциативные ряды алгоритма, добавляя в картинку магию.
Архитектурные формы требуют точности в указании стилей. Любителям классики понравится такой вариант:
«Готический собор, высокие шпили, витражные окна, мрачное небо, старинная каменная кладка, вид снизу вверх, монументальность, высокая детализация».
Фраза «вид снизу вверх» задает ракурс, делая здание визуально более величественным и внушительным. А для тех, кто грезит о будущем, подойдет:
«Экологичный город будущего, небоскрёбы с вертикальными садами, летающий транспорт, стекло и бетон, солнечный свет, футуризм, архитектура Захи Хадид».
Упоминание конкретных архитекторов (или художников) — мощный прием, который сразу направляет генерацию в нужное русло.
Фантастические существа и абстракция
Где фантазия может разгуляться на полную катушку, так это в создании несуществующих миров и монстров. Шедеврум здесь творит чудеса. Можно скрещивать несовместимое. Попробуйте ввести:
«Кот-космонавт в скафандре, сидит на поверхности Луны, Земля на заднем плане, отражение звёзд в шлеме, цифровая живопись, мило и эпично одновременно».
Или вот ещё более безумный вариант:
«Дракон, сделанный из кристаллов и льда, пещера с сокровищами, синее свечение, магическая энергия, частицы пыли в воздухе, Unreal Engine 5 render».
Упоминание игрового движка Unreal Engine 5 — это своеобразный хак. Он сигнализирует нейросети, что нужно выдать картинку с современной компьютерной графикой высочайшего уровня.
Абстрактные запросы тоже могут дать интересный результат, который не стыдно поставить на заставку телефона. Например:
«Взрыв красок в воде, смешивание чернил, замедленная съёмка, макросъёмка, высокая контрастность, абстракционизм, 4k».
Или геометрический узор:
«Фрактальные узоры, бесконечная геометрия, золотое сечение, гипнотический эффект, психоделические цвета, сложная структура».
Технические модификаторы: в чём соль?
Вы, наверное, заметили, что в примерах часто встречаются непонятные английские слова или термины. Нужны ли они? Безусловно. Это те самые «специи», которые делают блюдо завершенным.
«Hyperrealism» (гиперреализм) — заставляет нейросеть стремиться к фотоподобию.
«Cinematic lighting» (кинематографичное освещение) — добавляет драматичные тени и свет, как в кино.
«Octane render» — ещё один движок рендеринга, который ассоциируется с красивой, глянцевой 3D-графикой.
«Bokeh» (боке) — размывает задний фон, акцентируя внимание на объекте.
«Wide angle» (широкий угол) — позволяет вместить в кадр больше пространства.
Использование этих слов даже в русском промте (можно писать их латиницей или кириллицей, нейросеть поймет) существенно повышает качество итоговой картинки. Тем более, что алгоритм обучался на огромном массиве данных, где эти теги встречались повсеместно.
Стоит ли писать длинные промты?
Бытует мнение, что чем длиннее запрос, тем круче результат. Отчасти это так, но есть нюанс. Нейросеть имеет ограничение на количество учитываемых токенов (слов). Если написать целую поэму на три страницы, конец запроса может быть просто проигнорирован. Оптимальный объём — 2–4 предложения, насыщенных конкретикой. Важно не количество слов, а их вес и значение. «Красивый» — слово лёгкое и размытое. «Инкрустированный золотом» — тяжёлое и конкретное. Старайтесь использовать больше существительных и прилагательных, описывающих фактуру, материал и свет. Глаголы тоже важны, но они скорее задают позу или действие. А вот предлоги и союзы нейросеть часто пропускает мимо «ушей», поэтому на них акцентировать внимание не стоит.
Ошибки, которых лучше избегать
Даже с хорошим промтом можно получить плохой результат. Самая частая ошибка — противоречивые указания. Если вы напишете «солнечный день» и «ночное небо» в одном запросе, нейросеть выдаст странный гибрид, который вряд ли вас порадует. Ещё один момент — отрицания. Фразы вроде «без бороды» или «не размытый» нейросети понимают плохо. Частицу «не» они часто игнорируют, и в итоге вы получите именно то, чего не хотели — и бороду, и размытие. Лучше формулировать запрос позитивно: вместо «не старый» пишите «молодой», вместо «не чёрно-белый» пишите «цветной».
Также не стоит перебарщивать с жестокостью или контентом 18+. Шедеврум имеет встроенные фильтры цензуры. Если ваш запрос покажется алгоритму сомнительным, генерация будет заблокирована, или результат окажется сильно замыленным. Это же касается и политических фигур или слишком натуралистичных сцен насилия. Система безопасности здесь работает довольно строго.
Отдых в мире грёз: интерьеры и дизайн
Для тех, кто планирует ремонт или просто любит красивые дома, Шедеврум может стать отличным дизайнером. Попробуйте сгенерировать интерьер мечты. Промт может быть таким:
«Уютная гостиная в скандинавском стиле, светлые стены, деревянный пол, камин, большие окна в пол, много растений, мягкий диван, естественное освещение, фотореализм, дизайн интерьера».
Такой запрос поможет визуализировать идеи перед ремонтом. Или, скажем, кухня:
«Современная кухня в стиле лофт, кирпичная стена, чёрная мебель, медные светильники, барная стойка, стильно и лаконично, журнал по архитектуре».
Фраза «журнал по архитектуре» подсказывает нейросети, что нужно сделать картинку глянцевой и идеально выверенной, как на обложке.
Ювелирная работа
Удивительно, но нейросеть отлично справляется с созданием предметов роскоши и украшений. Детализация мелких объектов в Шедевруме на высоте. Попробуйте запрос:
«Филигранное золотое кольцо с огромным сапфиром, макросъёмка, блеск драгоценных камней, сложный узор, эльфийский стиль, магический артефакт, на чёрном бархате, профессиональное фото».
Результат часто выглядит настолько реалистично, что хоть сейчас выставляй на витрину ювелирного магазина. Главное здесь — указать материал (золото, серебро) и тип камней, а также добавить слово «макросъёмка» для акцента на деталях.
Вкусные промты
Нельзя не упомянуть и фуд-фотографию. Еда в исполнении нейросети вызывает аппетит. Хотите идеальный бургер? Пишите:
«Сочный чизбургер с беконом, расплавленный сыр стекает вниз, свежие листья салата, блестящая булочка с кунжутом, пар идет от котлеты, рекламная фотография еды, студийный свет, высокая детализация».
Секрет успеха здесь в словах, описывающих текстуру и свежесть: «сочный», «расплавленный», «пар», «блестящая». Это триггеры, которые делают еду «живой». Для десертов подойдет:
«Изысканное пирожное с малиной и шоколадом, украшено мятой, лежит на белой тарелке, рядом чашка кофе, уютная кофейня, мягкий свет из окна, аппетитно».
Заключительные советы
Освоение промт-инжиниринга — процесс увлекательный и творческий. Не бойтесь копировать чужие удачные запросы и видоизменять их под себя. Это лучший способ обучения. Иногда замена всего одного слова меняет настроение всей картины. Экспериментируйте с порядком слов. То, что стоит в начале предложения, имеет для нейросети больший вес. Если цвет важнее формы, поставьте его первым. И помните, что Шедеврум постоянно обновляется, становясь умнее и точнее. То, что не получалось вчера, сегодня может выйти идеально. Ваша фантазия — единственный ограничитель, а правильные слова — ключ, открывающий дверь в бесконечный мир визуальных образов. Удачных вам генераций и пусть каждый ваш запрос превращается в настоящий маленький шедевр, который захочется сохранить и показать друзьям.