Промты для генерации картинок (с примерами готовых промтов)

В сети то и дело натыкаешься на роскошные, почти фотографические изображения нереальных миров, созданные искусственным интеллектом. Глядя на эту безупречную цифровую красоту, обыватель часто думает, что достаточно написать машине пару невнятных слов, и она сама сотворит чудеса. Многие до сих пор считают, что алгоритм умеет читать мысли, угадывая скрытые желания пользователя, но на самом деле за каждым грандиозным кадром всегда стоит скрупулёзный текстовый запрос. Буквально несколько лет назад подобное ремесло казалось магией для узкого круга избранных гиков, но сейчас доступ к мощным вычислительным ресурсам открыт почти каждому желающему. Однако чтобы вместо ожидаемого шедевра на экране не появилась откровенная наляпистость с искажёнными пропорциями, нужно научиться разговаривать с машиной на её собственном, весьма специфическом языке.

Сложно ли приручить нейросеть?

Задача не из лёгких. Ведь машина совершенно лишена человеческой интуиции. Вся суть в том, что алгоритм воспринимает загруженный текст как набор математических весов и тегов, выхватывая знакомые ему понятия из своей огромной базы обучения. К слову, львиная доля успешных генераций зависит именно от того, насколько точно автор смог разложить свою фантазию по полочкам. Сначала в текстовую строку вписывается главный объект генерации, затем последовательно наслаивается описание его одежды или фактуры, после чего задаётся окружающий фон и условия освещения. Это довольно логичный подход. И всё-таки многие новички умудряются споткнуться уже на первом этапе, вбивая в поле ввода целые литературные поэмы с деепричастными оборотами. Машина же такой сложный синтаксис просто игнорирует, выдавая на выходе совершенно случайный, часто удручающий результат.

Базовая структура

Начинать нужно с крепкого фундамента. Запрос обычно выстраивается линейно, где каждому слову отведена своя строгая роль. На первое место всегда выносят существительное, обозначающее главного героя или предмет, дополненное одним-двумя точными прилагательными. Далее в дело вступают глаголы действия или причастия, описывающие позу и занятие персонажа. Третьим важным этапом формируется окружение, чтобы фигура не зависла в пустом белом пространстве. Ну и, наконец, венчает эту текстовую конструкцию технический блок настроек. Под ним обычно подразумевают перечисление стилей рендера, названия конкретных объективов фотокамер или параметры виртуального освещения (например, мягкий свет из окна или холодный неоновый блеск). Не стоит забывать и про негативный промт. Туда скрупулёзно вписывают все те вещи, которых на итоговой картинке быть категорически не должно, будь то лишние конечности, размытый фон или текст с опечатками.

Портрет крупным планом

Наряд для избранных. Зачастую именно генерация человеческих лиц вызывает наибольший восторг у аудитории, пробуждая желание экспериментировать сутками напролёт. Эстетичны ли цифровые лица? Безусловно, если грамотно подобрать слова для описания текстуры кожи и правильного света. Чтобы получить добротный современный портрет, лучше отказаться от размытых формулировок в пользу строгой конкретики. Вот вполне рабочий пример такого запроса.

Крупный план лица молодой рыжеволосой девушки, облачённой в грубый вязаный свитер изумрудного цвета, стоящей под тёплым осенним солнцем, снятый на камеру с объективом восемьдесят пять миллиметров при диафрагме один и два.

Тем более, что добавление фразы про лёгкую веснушчатость или растрёпанные ветром волосы сразу вносит нужную лепту в реалистичность образа. Главное — не перебарщивать с деталями, иначе лицо превратится в пластиковую маску.

Архитектура в стиле киберпанк

Город будущего. Атмосфера высоких технологий и тотального упадка всегда привлекала цифровых художников своей мрачной, но притягательной эстетикой. В представлении многих этот жанр состоит исключительно из летающих машин, но истинный колоритный антураж кроется в мелких деталях. Тут солирует контраст между слепящим светом вывесок и кромешной тьмой грязных подворотен. Пример хорошего запроса для такой сцены строится по принципу нагнетания атмосферы.

Узкая ночная улица азиатского мегаполиса, освещённая яркими розовыми и голубыми неоновыми вывесками, залитая проливным дождём, с отражениями света в глубоких лужах на асфальте, кинематографичный объёмный туман, высочайшая детализация.

К тому же, если упомянуть пар, поднимающийся из вентиляционных решёток, глубина картинки моментально возрастёт. Разумеется, на рендер таких сложных сцен с множеством источников света уходит чуть больше времени, но результат того определённо стоит.

Стоит ли экономить слова?

Казалось бы, чем больше текста, тем лучше. Однако это распространённое заблуждение. Избыток эпитетов часто бьёт по бюджету внимания нейросети, заставляя её путаться в показаниях. Когда пользователь пытается впихнуть в одну строку сразу десять цветов и пять разных стилей, на экране всплывут жуткие графические ошибки. Это обе стороны медали. С одной стороны, подробное описание задаёт рамки, с другой — лишает алгоритм творческой свободы. Поэтому опытные промт-инженеры стараются укладываться в пятьдесят или семьдесят слов. Оптимальное решение — использовать короткие рубленые фразы. Это надёжно. Потому что проверено. Многочисленными тестами. Если же нужно выделить какую-то конкретную деталь, ей просто искусственно повышают вес с помощью специальных скобок или числовых коэффициентов (в зависимости от выбранной платформы).

Достопримечательности сказочных миров: Замки

Огромные каменные своды. Фэнтези неизменно приковывает внимание тех, кто устал от серой повседневности и бетонных коробок современных городов. Исконно рыцарская тематика тяготеет к масштабным пейзажам и драматичному освещению. Формируя запрос на создание замка, нужно сразу определить точку съёмки. Ведь именно ракурс задаёт настроение всей иллюстрации. Текст может выглядеть так.

Древний готический замок из тёмного камня, возвышающийся на краю крутого обрыва, окружённый густым утренним туманом и стаей кружащих птиц, снятый с высоты птичьего полёта, эпическое фэнтезийное освещение, концепт-арт для видеоигры.

Ну, а ложка дёгтя здесь кроется в том, что генераторы часто путают архитектурные стили, прилепляя купола к строгим шпилям. Избежать этого поможет указание конкретной исторической эпохи или отсылка к творчеству известных художников-иллюстраторов.

Кулинарная фотография

Еда должна выглядеть аппетитно. Создание цифровых блюд требует совершенно иного подхода, нежели работа с пейзажами. Здесь на первый план выходит макросъёмка и работа с текстурами продуктов. Обычный гамбургер, сгенерированный без должного внимания, скорее всего, будет напоминать кусок пластилина. Чтобы блюдо вызывало желание его съесть, текст насыщают «вкусными» прилагательными и студийными терминами. Отличный изысканный результат получится, если написать следующее.

Сочный говяжий стейк слабой прожарки, лежащий на деревянной разделочной доске, посыпанный крупной морской солью и веточками свежего розмарина, с лёгким дымком от горячего мяса, контровой свет из окна, фуд-фотография для глянцевого журнала.

Впрочем, не стоит забывать про задний план. Слегка размытый бокал вина или горящая свеча на фоне сделают композицию более уютной и завершённой.

Ограничения и цензура

Правила диктуют разработчики. На большинстве популярных площадок сейчас установлены весьма жёсткие фильтры, блокирующие запросы на создание сцен насилия или контента для взрослых. Да и самим создателям нейросетей спокойнее, когда их интеллектуальные продукты не фигурируют в громких скандалах. Это же щепетильное правило распространяется на авторские права. Если вписать в строку имя известного политика или запатентованного персонажа из комиксов, система с высокой долей вероятности выдаст системную ошибку или заглушку. Приходится выкручиваться. В таких случаях опытный обыватель не сдаётся, а просто описывает характерные черты нужного героя, форму его носа, цвет плаща и фирменную причёску. Конечно, это требует большего словарного запаса, однако позволяет виртуозно обходить многие искусственные запреты.

Освоение искусства написания текстовых команд напоминает увлекательную игру, где правила постоянно меняются, а качество результата зависит от настойчивости игрока. Практика решает абсолютно всё. Стоит лишь начать жонглировать стилями, эпохами и параметрами виртуальных камер, как перед глазами начнут появляться по-настоящему глубокие визуальные истории. Не бойтесь ошибаться или получать на выходе нелепых монстров вместо прекрасных принцесс, ведь каждая неудачная попытка приближает к пониманию логики алгоритма. Удачи в бесконечных цифровых экспериментах, пусть новые созданные миры неизменно поражают воображение детализацией и приносят массу эстетического удовольствия.