Кажется, что нейросети творят чудеса по одному клику, но любой, кто хоть раз пытался сгенерировать реалистичный женский портрет, знает обратную сторону медали. Вместо ожидаемой шедевральной картинки на экране часто появляется нечто с пластиковой кожей, странной анатомией или совершенно пустым взглядом, лишённым всякой эмоции. Проблема здесь кроется вовсе не в «глупости» алгоритма, а в неумении правильно сформулировать запрос, ведь машина понимает нас буквально, игнорируя контекст, который человеку кажется очевидным. Искусственный интеллект — это исполнительный, но совершенно безынициативный художник, которому нужно разложить всё по полочкам. Поэтому, чтобы не тратить часы на перебор неудачных вариантов, стоит разобраться в самой механике составления текстовых описаний и запастись проверенными шаблонами.
С чего начинается хороший кадр?
Разумеется, не с описания внешности модели, как ошибочно полагают многие новички. Фундамент любого качественного изображения — это свет и стиль, задающие тон всей композиции. Если вы просто напишете «красивая девушка», нейросеть выдаст усредненный, глянцевый стандарт, который выглядит довольно скучно и искусственно. Важно сразу обозначить условия съемки, будь то «золотой час» с его мягкими тенями или жёсткий студийный свет, подчеркивающий текстуру кожи. Атмосферу создает именно освещение, превращая обычный портрет в кинематографичный кадр. К тому же, стоит упомянуть тип плёнки или камеры, например, «Kodak Portra 400» для тёплой зернистости, что сразу отсечет лишнюю «цифровую» стерильность.
Структура запроса
Удержать в голове все нюансы довольно сложно, поэтому лучше придерживаться определенной последовательности, своего рода скелета промта. Сначала мы описываем объект (кто?), затем действие (что делает?) и, наконец, окружение (где находится?). Первый блок должен содержать детали внешности: цвет волос, этническую принадлежность, возраст и одежду. Далее следует описание позы и эмоций, ведь именно они оживляют статичную картинку. Третьим важным элементом выступает фон и детализация окружения, будь то оживленная улица мегаполиса или уютная спальня. Ну и, наконец, технические параметры, отвечающие за качество, разрешение и стилизацию под определенную оптику (например, 85mm lens). Такой подход позволяет контролировать результат и избегать хаоса в генерации.
Портретная съемка: Крупный план
Глаза — зеркало души. В генерации это правило работает безотказно. Для получения глубокого, проработанного портрета акцент стоит делать на микродеталях кожи и взгляде. Вот пример добротного промта для крупного плана:
«Портрет молодой женщины славянской внешности, веснушки на носу, светло-голубые глаза, смотрящие прямо в камеру, естественный макияж, мягкий утренний свет из окна, высокая детализация кожи, поры кожи видны, снято на Canon R5, 85mm f/1.2, боке».
Обратите внимание, что здесь указана не просто «девушка», а конкретные черты, делающие образ живым. Другой вариант для более драматичной подачи:
«Крупный план, женщина с тёмными кудрявыми волосами, влажная кожа, капли дождя на лице, неоновое освещение ночного города, киберпанк стиль, отражения в глазах, кинематографично, глубина резкости».
Здесь уже солирует атмосфера и освещение, создавая совершенно иное настроение.
Как выбрать одежду и позу?
Сложнее всего нейросетям даются конечности и сложные позы в полный рост. Малейшая ошибка в описании, и вы получите лишнюю ногу или неестественно вывернутую руку. Чтобы минимизировать риски, позу стоит описывать максимально просто и понятно. Например:
«Женщина стоит на набережной, опираясь спиной на перила, скрестив руки на груди, вид в полный рост, элегантное красное шёлковое платье, ветер развевает подол, закатное солнце, реалистичное фото, 4k».
Тут мы четко фиксируем положение рук, что является своеобразным «спасательным кругом» для алгоритма. А если нужна динамика, попробуйте такой вариант:
«Девушка бежит по цветочному полю, летящая белая юбка, волосы развиваются на ветру, смеется, вид сбоку, динамичный кадр, солнечное лето, широкоугольный объектив, низкий ракурс».
Главное — избегать двусмысленности в глаголах движения.
Художественная стилизация
Иногда хочется отойти от фотореализма и окунуться в мир фантазий или ретро-эстетики. Здесь на помощь приходят стили художников или конкретных эпох. Достаточно добавить пару ключевых слов, и результат кардинально изменится. Попробуйте такой промт:
«Женщина-викинг в меховых доспехах, суровый взгляд, боевая раскраска на лице, заснеженный лес на фоне, мрачная атмосфера, стиль фэнтези-арт, цифровая живопись, детальная прорисовка брони, концепт-арт».
Это уже не фото, а иллюстрация, настоящий кладезь для дизайнеров персонажей. А для любителей винтажа подойдет следующее описание:
«Девушка в стиле 20-х годов, платье с бахромой, повязка с пером на голове, чёрно-белое фото, зернистость плёнки, старая фотография, интерьер джаз-клуба, дым сигарет, сепия».
Антураж здесь играет решающую роль, создавая ту самую «изюминку», которой часто не хватает обычным генерациям.
Свет и тень
Тень падает на лицо, скрывая половину черт. Испорчен ли кадр? Вовсе нет, если это задуманный эффект. Умение управлять светом через текст — навык, который отличает профи от любителя. Для создания объема и драматизма отлично подходит «схема Рембрандта». Пример запроса:
«Женский портрет, классическое освещение Рембрандта, треугольник света на щеке, темный фон, глубокие тени, контрастное изображение, серьёзное выражение лица, бархатная текстура кожи, профессиональное фото».
А вот для бьюти-съемки лучше использовать «схему бабочки» или софтбокс:
«Студийный портрет девушки, свет бабочки, равномерное освещение лица, отсутствие жёстких теней, сияющая кожа, легкая улыбка, рекламная фотосъемка косметики, пастельный розовый фон, высокая четкость».
Разница в восприятии таких изображений колоссальная, хотя объект съемки может быть одним и тем же.
Сложно ли исправить ошибки?
Львиная доля брака приходится на пальцы, глаза и лишние конечности. Бороться с этим можно и нужно с помощью негативных промтов (Negative Prompts), указывая то, чего на картинке быть не должно. Обычно в поле исключений вписывают:
«уродливые руки, лишние пальцы, косоглазие, размытость, мультяшность, плохая анатомия, обрезанная голова».
Однако даже в основном запросе стоит делать акцент на правильности форм. К слову, полезно добавлять уточнения вроде: «Красивые руки с пятью пальцами, детализированные фаланги». Хотя стопроцентной гарантии это не даёт, количество удачных генераций заметно повышается. Да и нейросеть начинает «стараться» лучше, когда видит скрупулезный подход к описанию анатомии.
Сезонные образы: Зима и Лето
Смена времен года открывает огромный простор для творчества. Зимний уют или летний зной передаются через температуру цвета и одежду. Уютный зимний вариант может звучать так:
«Девушка в объемном вязаном свитере, держит чашку с горячим какао, пар идет от кружки, вид из окна на заснеженные горы, каминный свет, тёплые тона, уютная атмосфера (hygge), мягкий фокус, крупная вязка».
А вот летний вайб требует других красок и эмоций:
«Девушка в соломенной шляпе и легком сарафане в цветочек, пикник на траве, корзина с фруктами, яркое полуденное солнце, жёсткие тени, насыщенные зеленые и жёлтые цвета, радость, смех, блики солнца».
Такие описания буквально заставляют зрителя почувствовать холод или тепло, делая изображение эмоционально насыщенным.
Бизнес-портрет
Впрочем, не всегда нам нужны художественные изыски; довольно часто задача состоит в создании строгого делового образа. Здесь важно убрать лишние детали и сосредоточиться на статусности. Хороший промт для бизнес-аватара выглядит так:
«Деловая женщина 35 лет, в тёмно-синем брючном костюме, белая рубашка, скрестила руки, уверенный взгляд, современный офис на заднем плане, размытый фон, дневной свет, профессиональное корпоративное фото, высокое разрешение».
Главное — не переборщить с макияжем и украшениями, иначе образ уйдет в сторону глянца, потеряв необходимую серьёзность. К тому же, стоит упомянуть тип освещения, например, «мягкий офисный свет», чтобы избежать драматичных теней, неуместных в деловом стиле.
Настроение и Эмоции
Пустое лицо — главный враг ИИ-генерации. Чтобы вдохнуть жизнь в персонажа, нужно прописывать не просто «улыбка», а конкретное состояние души. Попробуйте описать меланхолию:
«Одинокая девушка сидит у окна в дождливый день, прижав руку к стеклу, грустный взгляд, серые тона, холодное освещение, капли на стекле, чувство одиночества, задумчивость».
Или же, наоборот, взрывную радость:
«Девушка прыгает от счастья на пляже, руки подняты вверх, широкая улыбка, зубы видны, волосы в беспорядке, брызги воды, яркое солнце, высокая контрастность, живые эмоции».
Нюанс здесь в том, что окружающая среда должна поддерживать эмоцию героя, работая в унисон с выражением лица.
Подводные камни генерации
Естественно, даже самый детальный промт не застрахован от сбоев. Иногда нейросеть упорно рисует серьги, когда вы просили их убрать, или добавляет очки, которых не было в описании. Дело в том, что некоторые слова имеют сильные ассоциативные связи в базе данных обучения. Если вы пишете «библиотекарь», шанс появления очков возрастает в разы, даже если вы о них не просили. В таких случаях помогает усиление веса слов (использование скобок или коэффициентов) или прямая замена понятия на синоним. Не бойтесь перефразировать. Вместо «библиотекарь» напишите «женщина среди книг», и результат может вас приятно удивить.
Эстетика тела и фитнес
Спортивная тематика сейчас на пике популярности, но и здесь есть свои хитрости. Чтобы мышцы выглядели натурально, а не как у бодибилдера на стероидах, нужны мягкие формулировки. Удачный пример:
«Фитнес-модель на пробежке в парке, спортивный топ и леггинсы, подтянутое тело, лёгкий пот на коже, наушники в ушах, утреннее солнце, динамичная поза, здоровая кожа, реалистичные пропорции».
А если цель — показать йогу или растяжку, акцент смещается на гибкость и спокойствие:
«Девушка занимается йогой на коврике, поза лотоса, медитация, закрытые глаза, спокойное выражение лица, интерьер светлой студии, минимализм, растения на фоне, дзен-атмосфера».
Это поможет избежать появления неестественно бугристых мышц, к которым так тяготеет искусственный интеллект при слове «спорт».
Стоит ли использовать имена знаменитостей?
Многие пользователи пытаются добиться красоты, вписывая в промт имена известных актрис (например, «лицо как у Марго Робби»). Это рабочий метод, но он имеет свои этические и юридические нюансы. К тому же, часто получается карикатура, а не портрет. Гораздо эффективнее описывать типаж. Вместо имени звезды лучше написать: «высокие скулы, пухлые губы, миндалевидные глаза, волевой подбородок, голливудская внешность». Так вы получите собирательный, уникальный образ, который при этом будет обладать нужной эстетикой. Но если всё-таки хочется сходства, смешивайте имена: «смесь черт Анджелины Джоли и Моники Беллуччи». Результат будет более непредсказуемым, но интересным.
Идеальной формулы, которая работала бы в 100% случаев, не существует, ведь каждая модель искусственного интеллекта имеет свой «характер». Экспериментируйте с порядком слов, добавляйте неожиданные детали и смешивайте стили. Пусть ваши цифровые фотосессии станут не просто набором пикселей, а настоящим искусством, которое захочется рассматривать. Удачи в творческих поисках, и пусть каждый сгенерированный кадр станет отличным решением для вашего портфолио.