Знакомо ли вам чувство лёгкого разочарования, когда вместо ожидаемого шедевра нейросеть выдаёт пластиковую куклу с безжизненным, «стеклянным» взглядом или пугающим количеством пальцев? В сети представлено множество красивых картинок, сгенерированных искусственным интеллектом, и порой кажется, что авторы этих работ владеют неким тайным знанием. Египетская цивилизация всегда вызывала меньше вопросов, чем логика работы некоторых алгоритмов при построении человеческого лица. Обыватель часто думает, что дело в самой модели, но на практике всё упирается в умение грамотно составить описание. Ведь именно слова служат тем ключом, который отпирает дверь в мир фотореализма. Но чтобы не ошибиться и не тратить часы на перебор вариантов, нужно разобраться в анатомии идеального промта.
Что формирует основу запроса?
С чего начинается создание портрета? Разумеется, с главного героя. Однако сухого описания «мужчина» или «женщина» алгоритму недостаточно. Ему нужна конкретика, причём довольно подробная. Львиная доля успеха зависит от того, насколько точно вы опишете возраст, этническую принадлежность и эмоциональное состояние. К слову, именно эмоции оживляют картинку. Попробуйте вместо банального «happy» (счастливый) использовать более сложные конструкции: «subtle smile» (едва заметная улыбка) или «intense gaze» (напряжённый взгляд). Это же правило касается и внешности. Не стоит ограничиваться цветом глаз. Добавьте детали: шрам на щеке, россыпь веснушек, лёгкую небритость или сложную укладку.
Следующий важный критерий – это окружение и контекст. Персонаж не должен висеть в вакууме (если только это не студийная съёмка на белом фоне). Фон задаёт настроение. Это может быть шумная улица мегаполиса, уютная кофейня или туманный лес. Тем более что взаимодействие света с окружением напрямую влияет на то, как будет выглядеть кожа и одежда модели. А если ещё вспомнить про одежду, то здесь поле для экспериментов поистине безгранично. От строгого смокинга до футуристической брони – всё зависит от вашей фантазии. Главное – угадать с палитрой. Цвета одежды должны гармонировать с фоном, иначе композиция развалится.
Фотореализм и технические детали
Добиться того самого эффекта «как в жизни» невозможно без указания технических параметров съёмки. И здесь нам на помощь приходит терминология профессиональных фотографов. Нюанс заключается в том, что нейросеть обучалась на реальных снимках, и упоминание конкретной камеры или объектива для неё – прямой приказ к действию. Например, сочетание «shot on Sony A7R IV» или «Fujifilm GFX 100» сразу повышает детализацию. А указание объектива, скажем, «85mm lens», подсказывает алгоритму, что нужно размыть фон и сохранить правильные пропорции лица. Ведь широкоугольные объективы часто искажают черты, делая нос непропорционально большим.
Кроме того, стоит использовать магические слова, отвечающие за качество. «8k resolution», «hyperrealistic», «highly detailed», «raw photo» – этот набор тегов стал своеобразным стандартом. Однако не стоит перебарщивать. Нагромождение терминов может сбить ИИ с толку. Лучше отказаться от дублирования смыслов и сосредоточиться на освещении. Свет творит чудеса. Указание «natural lighting» (естественное освещение) даст мягкую картинку, а «cinematic lighting» (кинематографическое освещение) добавит драматизма и контраста. Особый интерес вызывает «volumetric lighting» (объёмный свет), который создаёт красивые лучи и дымку.
Готовые примеры промтов: Разбираем по полочкам
Теория – это прекрасно, но без практики она мертва. Давайте рассмотрим несколько рабочих сценариев, которые можно использовать как базу для собственных экспериментов. Начнём с классического женского портрета, где главная цель – максимальная естественность. Здесь мы делаем упор на текстуру кожи и мягкий свет.
Промт для реалистичного женского портрета:
«Close-up portrait of a young Scandinavian woman with platinum blonde messy hair, blue eyes, light freckles on nose, soft natural window lighting, wearing a beige knitted sweater, cozy atmosphere, highly detailed skin texture, shot on Canon EOS R5, 85mm lens, f/1.8, shallow depth of field, photorealistic, 8k.»
Обратите внимание на структуру. Сначала идёт объект (женщина, скандинавский типаж), затем детали внешности (веснушки, растрёпанные волосы), потом освещение и одежда. Заканчивается всё техническими параметрами. Это надёжно. Потому что проверено. Временем. А вот если хочется чего-то более брутального и характерного, стоит сменить локацию и освещение. Мужские портреты часто выигрывают от более резкого, контрастного света.
Промт для характерного мужского портрета:
«Full body shot of an elderly fisherman with a white beard and weathered face, wearing a yellow raincoat and a beanie, standing on a stormy pier, rain pouring down, dramatic dark lighting, cinematic composition, moody atmosphere, sharp focus, detailed wrinkles, shot on Nikon D850, 35mm lens, 4k.»
В этом примере «изюминкой» выступает атмосфера. Дождь, шторм и морщины создают историю. Здесь мы намеренно используем 35мм объектив, чтобы захватить больше фона. Ну и, наконец, вариант для любителей эстетики киберпанка. Это направление всё ещё крайне популярно и позволяет поиграть с неоновым освещением, которое так любят нейросети.
Промт в стиле Neon/Cyberpunk:
«Portrait of a futuristic cyborg girl with glowing neon blue lines on her face, metallic skin parts, pink bob hair, standing in a rainy Tokyo street at night, reflection of neon signs in puddles, bokeh background, volumetric lighting, cyberpunk aesthetic, synthwave colors, highly detailed, octane render.»
Работа с дефектами и «спасательный круг»
Даже идеальный промт не гарантирует отсутствие ошибок. Лишние пальцы, странные глаза или размытые конечности – классика жанра. Как с этим бороться? С помощью негативных промтов (Negative Prompts). Это команды, указывающие нейросети, чего не должно быть на изображении. Многие пренебрегают этим инструментом, а зря. Ведь именно он отсекает львиную долю брака.
В поле Negative Prompt стоит вписать стандартный набор ограничений. К ним относятся: «deformed», «bad anatomy», «disfigured», «poorly drawn face», «mutation», «mutated hands», «extra limbs», «ugly», «poorly drawn hands», «missing limb», «floating limbs», «disconnected limbs», «malformed hands», «blur», «out of focus». Этот простой список (хоть мы их и не любим, но здесь перечисление неизбежно в строку) значительно повысит качество генерации. Не скупитесь на слова, описывающие уродство или искажения – нейросеть поймёт намёк.
Стилизация и художественные отсылки
Порой фотореализм надоедает, и хочется чего-то более художественного. ИИ – настоящий кладезь знаний об истории искусств. Вы можете попросить его стилизовать фото под работы конкретного фотографа или художника. Сработает ли это всегда идеально? Нет, но результат часто получается интересным и самобытным. Например, добавление фразы «in the style of Annie Leibovitz» придаст снимку журнальный лоск и глубокие цвета. А упоминание «Steve McCurry» сделает акцент на пронзительном взгляде и ярких цветовых контрастах.
Также можно экспериментировать с плёночной эстетикой. Теги «Kodak Portra 400» или «Fujifilm Velvia» добавят характерное зерно и цветопередачу, свойственную этим плёнкам. Это отличный способ уйти от «пластиковой» идеальности цифрового изображения. Кстати, не забывайте про соотношение сторон. Параметр «–ar 3:2» (для Midjourney) или настройка разрешения в Stable Diffusion задают формат кадра. Вертикальные снимки (2:3 или 9:16) лучше подходят для ростовых портретов, а горизонтальные (16:9) – для кинематографичных сцен.
Тонкости настройки веса слов
Есть ещё один нюанс, о котором знают не все. Это вес (значимость) конкретного слова в запросе. Если нейросеть упорно игнорирует какую-то деталь, например, красную шляпу, стоит усилить акцент на ней. В разных нейросетях это делается по-разному. Где-то используются скобки ((((red hat)))), где-то коэффициенты (red hat:1.5). Это позволяет управлять вниманием алгоритма, заставляя его «слушать» ваши приоритеты.
Баланс – вот ключ к успеху. Перегруженный промт, где каждое слово имеет максимальный вес, приведёт к каше. Лучше выделить один-два ключевых элемента, которые будут солировать в композиции. Остальное пусть служит фоном. Экспериментируйте, меняйте слова местами, ведь, как известно, от перестановки слагаемых в мире промтинга сумма меняется кардинально. Удачных вам генераций и пусть каждый ваш кадр станет маленьким шедевром!