В сети сегодня можно наткнуться на гигантское количество материалов по генерации изображений. Кажется, что каждый второй пользователь уже освоил Midjourney или Stable Diffusion, создавая то фантастические пейзажи, то портреты в стиле киберпанк. Однако среди этого информационного шума довольно сложно отыскать действительно рабочие, хорошо структурированные и, что самое главное, адаптированные под конкретные задачи запросы. И здесь на сцену выходят народные авторы-энтузиасты, которые не просто делятся своими находками, но и формируют целые стилистические направления. Одним из таких феноменов на просторах русскоязычного интернета, в частности на Pikabu, стал пользователь под ником Nano Banana, чьи промты для генерации женских образов приобрели колоссальную популярность. А начать разбор этого феномена стоит с основ.
В чём заключается феномен Nano Banana?
Задача не из лёгких. На первый взгляд может показаться, что ничего сверхъестественного в его работах нет. Но это лишь на первый взгляд. В чём же секрет? Секрет, как и всегда, кроется в деталях и скрупулёзном подходе. Львиная доля промтов, которые можно найти в открытом доступе, либо слишком общие, либо, наоборот, перегружены бессмысленными токенами. Nano Banana же нашёл золотую середину, предложив пользователям своего рода конструктор, который довольно просто адаптировать под свои нужды. Его изюминка – это фокус на фотореализме с лёгким налётом кинематографичности, где главным объектом всегда выступает девушка. Не мультяшный персонаж, не фэнтезийная воительница в громоздких доспехах, а живой, правдоподобный образ, который мог бы встретиться в реальной жизни. Именно эта приземлённость и высочайшая детализация приковали внимание тысяч пользователей.
К тому же, стоит отметить и саму подачу. Вместо сухих технических выкладок автор часто сопровождает свои публикации готовыми результатами, наглядно демонстрируя, как тот или иной токен влияет на итоговое изображение. Это создаёт доверительную атмосферу, где обыватель, далёкий от тонкостей настройки нейросетей, может взять готовый рецепт и получить впечатляющий результат с первой же попытки. Такой подход, безусловно, подкупает. Ведь он экономит самый ценный ресурс – время. Не нужно часами просиживать на специализированных форумах, пытаясь разложить по полочкам сотни параметров. Можно просто взять и творить.
Разбор структуры: основные компоненты промта
Чтобы понять, как это всё работает, нужно взглянуть на структуру типичного запроса от Nano Banana. С чего начинается магия? Разумеется, с так называемой «позитивной» части, где перечисляются все желаемые атрибуты изображения. Обычно в самом начале стоит блок, отвечающий за общее качество и детализацию. Выглядит он плюс-минус одинаково:
Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈
Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.
Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL
(masterpiece, best quality, ultra-detailed), 1girl, solo
Эта часть – своего рода фундамент, который говорит нейросети, что мы нацелены на максимально добротный результат.
Далее следует блок, описывающий самого персонажа. И вот здесь автор уделяет внимание мелочам. Вместо простого `beautiful girl` в ход идут уточнения, которые и создают тот самый реализм. Например, описание внешности может выглядеть так:
beautiful young woman with long wavy blonde hair, detailed blue eyes, cute face, perfect face
Обратите внимание на акцент на деталях – «детализированные голубые глаза», «идеальное лицо». После этого идёт описание одежды и позы, к примеру:
wearing a cozy white sweater, sitting at a table in a cafe, holding a cup of coffee
Каждое слово здесь вносит свою лепту в финальную картину.
Отдельно стоит упомянуть антураж, которому автор также придаёт большое значение. Для создания атмосферы и глубины часто используются команды, связанные со светом и съёмкой.
Cinematic light, depth of field (dof), soft focus, warm light from a window
Эти токены превращают плоскую картинку в кадр из фильма, добавляя объём и настроение. Ну и, конечно же, нельзя не упомянуть негативный промт – список того, чего на изображении быть не должно. Он не менее важен, чем позитивный. Стандартный набор выглядит примерно так:
(worst quality, low quality, normal quality), zombie, ugly, morbid, mutated, deformed, disfigured, poorly drawn hands, bad anatomy
Он отрезает всё лишнее. Мутации. Уродства. Плохую анатомию.
Популярные сценарии и их адаптация
Выбор тем довольно большой. Один из самых частых запросов, который можно встретить в подборках Nano Banana, – это, безусловно, повседневная эстетика. Девушка в кафе, в парке, читающая книгу у окна или просто гуляющая по осеннему городу. Эти сценарии подкупают своей жизненностью. Пример такого промта может быть следующим:
(masterpiece, best quality, ultra-detailed), 1girl, solo, beautiful 20yo woman, long ginger hair, green eyes, freckles, wearing a green knitted scarf and a beige coat, standing in an autumn park, fallen leaves, cinematic light, depth of field
Такой запрос даёт очень тёплый, атмосферный результат.
Другое востребованное направление – лёгкая, ненавязчивая фантастика или фэнтези. Но и здесь автор тяготеет к реализму. Его эльфийки не похожи на персонажей из онлайн-игр, они скорее напоминают героев из высокобюджетного кино. В промт просто добавляются характерные детали. Например:
…pointed ears, elven features, intricate silver jewelry…
Остальная структура, отвечающая за реализм, остаётся прежней, что и позволяет добиться такого эффекта. Полный запрос мог бы звучать так:
(masterpiece, best quality), 1girl, solo, beautiful elf princess, long silver hair, piercing blue eyes, pointed ears, wearing elegant white dress, standing in a magical forest, moonlit, mystical atmosphere, god rays, detailed face
К слову, не стоит забывать и про ретро-стилизации, которые тоже довольно часто встречаются. Образы девушек из 20-х, 50-х или 80-х годов прошлого века. Здесь вся суть в том, чтобы точно передать антураж эпохи через одежду, причёску и окружение. Например, для создания образа в стиле нуар можно использовать такой запрос:
(masterpiece, best quality), photo of a beautiful femme fatale from 1940s, sharp facial features, red lipstick, wearing a stylish hat and a trench coat, standing on a rainy city street at night, neon lights reflections, film noir style, monochrome with red color splash, dramatic shadows
Этот промт уже сложнее, но и результат он даёт куда более впечатляющий.
Есть ли подводные камни?
Так ли всё радужно? Конечно, нет. Как и в любом деле, здесь есть свои нюансы. Главная ложка дёгтя – это некоторая шаблонность. Поскольку промты построены по схожему принципу и часто тестируются на одних и тех же моделях (вроде Chilloutmix или Deliberate), со временем сгенерированные лица и образы могут казаться довольно однотипными. Это не вина автора, а скорее особенность работы самих нейросетей, которые тяготеют к усреднённым, «безопасным» вариантам внешности. Чтобы избежать этого, не стоит бояться экспериментировать и добавлять в промт что-то своё, например, менее стандартные черты лица или этническую принадлежность.
Второй важный момент – зависимость от конкретной модели и её версии. Промт, который творит чудеса на одной модели, может выдать совершенно удручающее зрелище на другой. Nano Banana, к слову, чаще всего указывает, на какой модели он получил тот или иной результат, и этим советом не стоит пренебрегать. Если вы используете другую нейросеть, будьте готовы к тому, что запрос придётся серьёзно корректировать, подбирая синонимы или меняя «вес» отдельных токенов. Это не сложный, но довольно кропотливый процесс, требующий терпения.
Ну и, наконец, стоит понимать, что эти промты – великолепный, добротный фундамент, но не панацея. Они идеально подходят для старта и для тех, кто хочет быстро получить красивый результат без глубокого погружения в технические махинации. Однако для создания чего-то по-настоящему самобытного и уникального придётся идти дальше: изучать работу LoRA-моделей, экспериментировать с эмбеддингами и пробовать смешивать стили. Но как отправная точка – это, безусловно, настоящий кладезь полезной информации.
Работы энтузиастов вроде Nano Banana заслуживают истинного уважения, ведь они делают сложные технологии доступными для всех. Использование его наработок может стать отличным спасательным кругом для новичков и источником вдохновения для более опытных пользователей. Ведь самое интересное в генеративном искусстве — это путь собственных открытий. Дерзайте!
