Промт для оживления фото в алисе (с примерами готовых промтов)

Визуальный контент сегодня окружает нас повсюду, и статичной картинкой удивить кого-либо становится всё труднее. Обыватель, пресытившийся глянцевыми, но мёртвыми изображениями, всё чаще ищет динамику, эмоцию, тот самый неуловимый момент, когда кажется, что персонаж вот-вот моргнёт или ветер действительно растреплет волосы. В сети представлено множество инструментов для работы с изображениями, но российский пользователь всё чаще обращается к привычной Алисе и интегрированным в неё нейросетям, таким как YandexART. Грезят о создании шедевров многие, но сталкиваются с тем, что нейросеть выдаёт «пластиковых» кукол с пустым взглядом. Ведь мало просто попросить нарисовать кота или девушку. Нужно уметь объяснить машине, что такое жизнь. А начать стоит с понимания того, как именно слова превращаются в движение.

Сложно ли составить правильный запрос?

На первый взгляд, задача кажется тривиальной. Казалось бы, пиши что думаешь — и получай результат. Да, но результат этот зачастую оставляет желать лучшего. Нейросети, при всей их мощности, лишены воображения в человеческом понимании. Они — лишь зеркало, отражающее нашу способность описывать мир. Довольно часто новички совершают одну и ту же ошибку: они описывают объект, но забывают описать среду и действие. Секрет «живого» фото кроется не в детальной прорисовке ресниц (хотя и это важно), а в несовершенствах, случайностях и взаимодействии с окружающим миром. Статичная поза солдата по стойке смирно выглядит искусственно. А вот тот же солдат, поправляющий каску на бегу, уже вызывает доверие. Поэтому, формулируя промт для Алисы, стоит сразу закладывать в него сценарий небольшого фильма, поставленного на паузу.

Динамика через детали

Один из самых действенных способов вдохнуть жизнь в генерацию — использование маркеров движения. К слову, нейросеть отлично понимает физику тканей и жидкостей. Если вы хотите получить портрет девушки, который не будет похож на паспортное фото, добавьте в описание ветер. Например, попробуйте такой вариант:

Крупный план девушки с рыжими волосами, сильный ветер раздувает локоны, волосы лезут в лицо, динамичная поза, живые эмоции, смех, городской фон размыт в движении.

Здесь ключевую роль играют уточнения про ветер и смех. Тем более, что эмоция — это душа снимка. Спокойное лицо всегда проигрывает искренней улыбке или гримасе удивления. Можно пойти дальше и использовать более сложные конструкции:

Танцовщица в прыжке, летящая юбка, мышцы напряжены, экспрессия, пыль в лучах прожектора, застывшее мгновение, кинематографичное освещение.

Такой подход заставляет алгоритм просчитывать инерцию и гравитацию, что неизбежно добавляет реализма.

Взгляд и эмоции

Глаза — зеркало души, и это, пожалуй, самый сложный элемент для генерации. Пустой, «рыбий» взгляд способен испортить даже самый добротный промт. Чтобы избежать эффекта зловещей долины, стоит использовать уточняющие прилагательные, описывающие не цвет, а выражение. Попробуйте ввести в Алису следующий запрос:

Портрет пожилого рыбака, глубокие морщины, прищур от яркого солнца, взгляд направлен вдаль, в глазах читается мудрость и усталость, детальная прорисовка кожи, реалистичный блеск в глазах.

Заметьте, мы не просто пишем «старик», мы задаём историю. Львиная доля успеха здесь зависит от контекста: солнце заставляет щуриться, а значит, задействуются мимические мышцы. Это создаёт ту самую «химию». Другой пример для создания милого и живого образа:

Маленький ребёнок впервые видит снег, широко раскрытые глаза, удивление и восторг, рот приоткрыт, румянец на щеках, снежинки на ресницах, мягкий зимний свет.

Здесь работает эффект новизны и непосредственности реакции.

Природные явления: Стихия

Ничто так не оживляет кадр, как разбушевавшаяся стихия. Природа никогда не бывает идеально застывшей, она всегда в процессе. Вода течёт, облака плывут, деревья гнутся. И всё это нужно передать словами. Для создания атмосферного пейзажа, который хочется поставить на заставку, используйте описание взаимодействия объектов. Отличным решением станет такой запрос:

Шторм на море, гигантские волны разбиваются о скалы, брызги воды в воздухе, пена, мрачное грозовое небо, молния вдалеке, ощущение опасности и мощи, высокая детализация воды.

Слово «брызги» здесь работает как триггер для создания мелких частиц, которые добавляют глубину и хаос, свойственный реальности. А вот вариант для более спокойной, но живой атмосферы:

Утренний лес после дождя, туман стелется по земле, лучи солнца пробиваются сквозь листву, капли росы на траве, пар изо рта, ощущение прохлады.

Упоминание температуры (через пар и прохладу) косвенно влияет на цветовую гамму, делая её более достоверной.

Технические модификаторы

Обыватель часто забывает, что фотография — это ещё и техника. Имитация работы реальной камеры творит чудеса с восприятием изображения. Нейросети обучены на миллионах снимков, и они знают, что такое «боке», «длинная выдержка» или «зернистость пленки». Чтобы картинка перестала быть «вылизанной», добавьте в промт технические параметры. Это работает безотказно. Например:

Уличная фотография, ночной город, неоновые вывески, эффект длинной выдержки, следы от фар машин, смазанное движение, плёночное зерно, ISO 3200, стиль Kodak Portra.

Зернистость и смазанность скрывают огрехи генерации и придают кадру документальность. Ещё один мощный приём — работа с глубиной резкости. Попробуйте такой сценарий:

Макросъёмка пчелы на цветке, фокус на глазах насекомого, задний план сильно размыт, малая глубина резкости, капли нектара, солнечные блики, макрообъектив 100mm.

Чёткое указание на фокус помогает нейросети расставить приоритеты и не превращать фон в кашу из непонятных деталей.

Стиль и антураж

Иногда для «оживления» нужно не добавить реализма, а, наоборот, уйти в стилизацию. Ведь живым может быть и рисунок, если в нём есть характер. Алиса отлично справляется с подражанием известным стилям. Но и тут есть свои нюансы. Не стоит просто писать «в стиле Ван Гога». Лучше описать технику мазка. Скажем, вот так:

Звёздная ночь над современной Москвой, стиль экспрессионизм, жирные масляные мазки, вихри света, пастозная техника, яркость, контраст, текстура холста.

Текстура — это то, за что цепляется глаз. Когда мы видим неровности холста или бумаги, мозг автоматически воспринимает объект как материальный, существующий в реальности. Для любителей киберпанка подойдёт такой детальный промт:

Киберпанк девушка-хакер в подворотне, дождь, отражения неона в лужах, хромированные импланты, светящиеся татуировки, пар из вентиляции, мрачная атмосфера нуара, кинематографичный ракурс снизу.

Ракурс снизу придаёт величие и динамику, делая персонажа доминирующим в кадре.

Бытовые сцены: Уют

Часто хочется увидеть не эпичную битву, а простой, тёплый момент. И тут многие спотыкаются, получая рекламные постеры счастливых семей, от которых веет фальшью. Секрет уюта — в беспорядке. Идеально убранная комната выглядит нежилой. Добавьте в промт «творческий беспорядок». К слову, это касается и внешнего вида людей. Вот пример промта для создания домашней атмосферы:

Утро на кухне, молодая пара готовит завтрак, мука на столе и на носу, смеются, разбросанные яйца, солнечный свет из окна, пар от горячего кофе, домашняя одежда, уютный интерьер, тёплые тона, контровый свет.

Детали вроде муки на носу или разбросанных продуктов делают сцену спонтанной. Это уже не постановка, а подсмотренная жизнь. Или вот вариант с питомцем:

Пушистый кот спит на подоконнике, рядом стоит кружка с чаем и открытая книга, очки, за окном идёт снег, тёплый вязаный плед, мягкий свет от настольной лампы, атмосфера спокойствия и тишины.

Здесь «оживление» происходит за счёт контраста холода за окном и тепла внутри.

Ошибки новичков

Чего делать не стоит?Безусловно, в погоне за детализацией легко перегнуть палку. Одна из главных ошибок — перегруженность запроса противоречивыми требованиями. Нельзя одновременно требовать «солнечный день» и «мрачную готическую атмосферу» (хотя результат может быть забавным, но вряд ли реалистичным). Также стоит избегать абстрактных понятий вроде «красиво», «великолепно», «невероятно». Для машины эти слова не значат ровным счётом ничего. Красота — понятие субъективное. Лучше описать, из чего эта красота состоит: золотое сечение, симметрия или, наоборот, асимметрия. Ещё один подводный камень — слишком длинные предложения без знаков препинания. Нейросеть может запутаться в связях слов. Лучше разбивать описание на смысловые блоки, разделяя их запятыми. И, конечно же, не стоит забывать про анатомию. Хотя современные алгоритмы стали лучше рисовать руки, лишнее напоминание не повредит. Можно добавить в негативный промт (если интерфейс позволяет) или просто уточнить: «детально прорисованные руки, пять пальцев». Впрочем, в стандартном диалоге с Алисой это сделать сложнее, поэтому лучше выбирать ракурсы, где руки не являются центром композиции, или заняты предметом.

Освещение

Свет — это кисть фотографа, и в генерации изображений он играет первую скрипку. Плоский фронтальный свет убивает объём, превращая лицо в блин. Чтобы добавить драматизма и жизни, используйте сложные схемы освещения. Очень эффектно выглядит контровый свет (Rim light). Попробуйте такой запрос:

Силуэт рыцаря в тумане, яркий свет позади фигуры, контурная подсветка, объёмные лучи света (god rays), пробивающиеся сквозь деревья, мистическая атмосфера, тёмные тона, высокая контрастность.

Такой свет отделяет объект от фона и создаёт глубину. Для портретов хорошо подходит «свет Рембрандта» — классическая схема с треугольником света на щеке. Промт может звучать так:

Мужской портрет в студии, классический костюм, свет Рембрандта, глубокие тени, драматичный взгляд, тёмный фон, высокая детализация текстуры ткани.

Тени здесь так же важны, как и свет. Именно в тенях прячется объём. Не бойтесь экспериментировать с цветным светом: «Портрет девушки в неоновом свете, синий и розовый цвета, двойная экспозиция, блики на коже, ночной город на фоне, стиль Vaporwave». Это сразу переносит зрителя в другую реальность.

Фантастические существа

А как быть, если нужно оживить то, чего не существует? Драконы, эльфы, пришельцы. Здесь задача усложняется тем, что у нас нет реальных референсов. Однако принципы остаются теми же: анатомия, физика, свет. Чтобы дракон выглядел живым, он должен иметь вес и фактуру. Промт для любителей фэнтези:

Огромный древний дракон сидит на вершине горы, чешуя блестит на солнце, дым идёт из ноздрей, шрамы на шкуре, потёртые крылья, взгляд хищника, облака ниже уровня глаз, эпичный масштаб, реалистичная текстура камня и кожи.

Упоминание шрамов и потёртостей придаёт существу историю, делает его ветераном битв, а не пластиковой игрушкой. Или возьмём, к примеру, лесную фею: «Маленькая фея сидит на грибе, полупрозрачные крылья стрекозы, светящаяся пыльца, мягкое свечение кожи, ночной лес, магическая атмосфера, боке, сказочный стиль». Здесь жизнь создаётся через свечение и полупрозрачность материалов.

Вкусные фуд-промты

Отдельная тема — еда. Фотографии еды должны вызывать аппетит, а значит, они должны быть «сочными». Сухая булка никому не интересна. Нам нужен пар, стекающий соус, блеск жира, крошки. Это именно те несовершенства, которые продают картинку. Попробуйте сгенерировать такой натюрморт:

Сочный бургер на деревянной доске, расплавленный сыр стекает по котлете, капли конденсата на стакане с колой, кунжут, свежие листья салата, крошки на столе, профессиональное фуд-фото, мягкий свет, малая глубина резкости.

Чувствуете разницу? Слово «конденсат» сразу даёт ощущение холода напитка, а «расплавленный» — жара котлеты. Этот температурный контраст наш мозг считывает мгновенно. А если захотелось сладкого: «Стопка панкейков, политая кленовым сиропом, кусочек тающего сливочного масла сверху, свежие ягоды клубники и черники, сахарная пудра, утренний свет, яркие цвета, высокая детализация, макро». Глагол «тающего» здесь является ключевым двигателем сюжета.

Работа с Алисой: Нюансы

Стоит помнить, что Алиса — это интерфейс, который стремится понять пользователя с полуслова, но иногда это играет злую шутку. Она может упростить ваш сложный промт. Поэтому формулировки должны быть ёмкими, но однозначными. Не стоит писать целые сочинения на три страницы. Лучше использовать короткие, рубленые фразы, разделённые запятыми. Это своего рода код, который машина считывает лучше, чем художественную прозу. Например, вместо «Я хочу увидеть красивую девушку, которая идёт по улице и улыбается», напишите: «Девушка идёт по улице, улыбка, динамика, городской стиль, фотореализм». Результат будет точнее. И не бойтесь использовать слово «шедевриум» или упоминать конкретные стили, которые есть в базе YandexART, если вы работаете через приложение. Это же правило касается и отказов. Если нейросеть отказывается генерировать изображение по этическим соображениям (а цензура там строгая), попробуйте переформулировать запрос, используя более нейтральные слова. Вместо «агрессивный воин» можно написать «воин в боевой стойке, напряжение, решимость». Смысл тот же, а окраска мягче.

Поиск своего стиля — это путь проб и ошибок. Не существует единственно верного «волшебного» промта, который будет работать всегда. Однако понимание того, как свет, текстура и эмоция влияют на восприятие, даёт вам мощный инструмент. Экспериментируйте с прилагательными, меняйте освещение, сталкивайте противоположности. И однажды, среди десятков неудачных дублей, вы увидите тот самый кадр, который заставит сердце биться чаще. Удачных вам генераций, и пусть каждый ваш запрос становится маленьким шедевром, который запомнится надолго.