В сети представлено множество завораживающих картинок, сгенерированных нейросетями, и обыватель часто задаётся вопросом об их происхождении. Буквально десятилетие назад подобное казалось фантастикой, но сейчас искусственный интеллект творит чудеса по одному клику мыши. Многие люди грезят о создании собственных цифровых картин, однако при первом столкновении с алгоритмом энтузиазм часто оседает. Ведь машина понимает слова буквально, а не читает наши мысли. Получить добротный результат с первого раза удаётся далеко не всем, поскольку бессистемный набор слов приводит к визуальному хаосу. Но чтобы не ошибиться, нужно просто грамотно выстроить текстовый запрос, который алгоритм сможет разложить по полочкам.
С чего начинается работа?
Слова ложатся на пустой экран. Задача не из лёгких. Сложно ли приручить этот цифровой разум? Да, но результат того стоит. Сначала всегда идёт главный объект, обрисованный максимально детально. В представлении многих пользователей достаточно просто написать одно слово, но на самом деле процесс требует скрупулёзного подхода. Стоит отметить, что приложение от Яндекса тяготеет к русскому языку, так как разработчики обучали алгоритмы на отечественных массивах данных. Разумеется, система поймёт и английский язык, однако родная речь позволяет точнее передать самобытный колоритный антураж. К слову, не стоит перегружать строку лишними бессмысленными эпитетами. Слишком длинный и запутанный текст нейросеть просто проигнорирует, выхватив лишь знакомые куски.
Структура правильного запроса
Это важно. Ведь картинка не появится из пустоты. Одним из самых популярных подходов считается формулировка через именительный или творительный падеж с последовательным наращиванием деталей.
Например, мы описываем молодую девушку, освещённую мягким светом, сидящую на деревянной веранде, окружённую цветущими гортензиями.
Далее следует добавить технические параметры, которые зададут настроение всему кадру. Обязательно ли указывать разрешение и тип камеры? Вовсе нет. Но для лучшего эффекта стоит дописать фразы вроде «высокая детализация» или «чёткий фокус». Тем более, что подобные махинации со словами не сильно ударят по кошельку, поскольку сервис полностью бесплатен для всех желающих. Ну и, конечно же, не забывайте про фон, который часто солирует в композиции.
Пейзажные зарисовки
Особый интерес вызывает генерация природы. Естественно, создать грандиозный горный массив довольно просто. Попробуйте напечатать в строке такой вариант: заснеженные вершины Гималаев на закате, розовые пушистые облака, фотореализм, снято на широкоугольный объектив. Выглядит впечатляюще. Дело в том, что искусственный интеллект отлично знает классические пейзажи и легко их воспроизводит. К тому же, можно смело экспериментировать со временем года или погодой. Отдельно стоит упомянуть городские локации, которые всегда смотрятся выигрышно. Начинать нужно с архитектурной доминанты. Напишите: дождливый вечер в старом Петербурге, неоновые жёлтые вывески отражаются в лужах, мрачная атмосфера, киберпанк. И вот уже на экране вырисовывается совершенно иной мир. Да и самим зрителям разглядывать такие детали намного интереснее.
Вредно ли копировать чужие тексты?
С одной стороны, подсмотреть готовую идею полезно, с другой — теряется вся индивидуальность. В приложении общая лента так и льётся рекой, предлагая тысячи чужих работ. И всё же слепое копирование редко приносит глубокое удовлетворение. Гораздо приятнее внести свою лепту в создание изображения.
Возьмите чей-то хороший промт: милый рыжий щенок корги пьёт кофе из синей кружки, утреннее яркое солнце, реализм. А теперь просто замените щенка на упитанного енота, а кофе — на малиновый чай с паром.
Перевоплощение завершено. Впрочем, чужие объёмные тексты часто содержат мусорные слова, которые алгоритм давно пропускает мимо цифровых ушей. Нет смысла переплачивать вниманием за пустые громоздкие формулировки.
Портреты и эмоции
Настоящий рай для виртуального фотографа. Человеческие лица, обрамлённые растрёпанными волосами, освещённые студийными софитами, снятые на старую плёнку — именно так нанизываются свойства для идеального кадра. А вот необычное название стиля добавит изюминку. Например, попробуйте запросить портрет сурового старика с седой бородой в стиле стимпанк, медные шестерёнки на фоне, тёплый вечерний свет. Зрелище удручающее, если случайно забыть про детализацию глаз. Ведь именно они приковывают внимание любого обывателя. Не стоит скупиться на точные характеристики внешности. Укажите цвет радужки, форму скул и конкретную эмоцию. Лёгкая грустная улыбка или пронзительный взгляд — эти мелкие нюансы меняют всё восприятие картины. Однако периодически всплывают ошибки генерации в виде лишних пальцев. Ложка дёгтя присутствует почти всегда.
Модификаторы стилей
В самом низу экрана часто мелькают подсказки. Но перед их использованием стоит задуматься о конечной цели. Чтобы избежать скучной наляпистости, в дело вступают художественные модификаторы. К первой группе относится имитация классической живописи. Запрос «толстый кот в костюме космонавта, написанный масляными красками в стиле Рембрандта» выдаст невероятно изысканный портрет. Следующий важный критерий — текстуры и материалы. Если написать «стеклянная яблоня с золотыми листьями, макросъёмка, мягкие тени», то картинка обретёт внушительный объём. Последним в списке идёт освещение, играющее решающую роль. Кинематографический свет, лунные холодные блики или контровое освещение способны преобразить кадр. Безусловно, правильный подбор таких слов — это львиная доля успеха.
Скрытые подводные камни
Работа с генератором не обходится без сложностей. Часто новичок натыкается на жёсткие ограничения цензуры. Разработчики скрупулёзно следят за тем, чтобы визуальный контент оставался безопасным для общества. Поэтому любые жестокие сцены или излишне откровенные наряды система блокирует моментально. Это же правило касается и реально существующих политиков или мировых звёзд. Попытка облачить известного лидера в костюм средневекового шута наверняка завершится техническим отказом. Нужно отметить, что использование английских терминов, таких как octane render или unreal engine, всё-таки немного повышает общую детализацию картинки. Кроме того, нейросеть плохо справляется с генерацией осмысленного текста на вывесках. Буквы часто превращаются в нечитаемые загадочные иероглифы.
Как улучшить результат?
Процесс не сложный, но весьма кропотливый. Вырастить прекрасный визуальный сад без должного терпения практически невозможно. Во-первых, всегда тестируйте короткие стартовые фразы, во-вторых, постепенно добавляйте описания окружения, ну и, наконец, смело играйте со стилями. Надёжный спасательный круг кроется в вашей личной насмотренности. Изучайте картины известных классиков, запоминайте названия художественных техник. Акварель, густая гуашь, сухая пастель, линогравюра — всё это Шедеврум прекрасно распознаёт. Не перегружайте запрос взаимоисключающими командами. Если вы просите строгий фотореализм, лучше отказаться от упоминания мультяшных или аниме стилей. Обе стороны медали должны гармонировать между собой.
Окунуться в мир цифрового искусства сейчас довольно просто. Каждое правильно подобранное слово способно обернуться настоящим шедевром, который порадует домочадцев или станет отличным визуальным дополнением к личному блогу. Главное — угадать с палитрой и не бояться ломать стереотипы. Смело комбинируйте совершенно неожиданные предметы, ищите свой собственный авторский слог. Пусть каждое сгенерированное полотно максимально точно отражает вашу внутреннюю задумку. Удачи в бесконечных творческих поисках!