Желание увидеть себя рядом с голливудской знаменитостью или создать уникальный арт с любимым музыкантом посещает, пожалуй, каждого пользователя нейросетей хотя бы раз. В сети представлено множество галерей, где Илон Маск пьёт чай в хрущёвке, а Мэрилин Монро примеряет современный стритвир, и выглядит это пугающе реалистично. Однако, когда обыватель пытается повторить успех, вбивая простое имя кумира в строку генерации, результат довольно часто разочаровывает: искажённые черты лица, «плывущие» глаза или вовсе неузнаваемый персонаж становятся нормой. Казалось бы, искусственный интеллект обучался на миллионах снимков этих людей, так в чём же проблема? А проблема кроется в нюансах формулировок и технических параметрах, которые задают тон всему изображению. Удивительно, но чтобы получить фотореалистичный шедевр, а не карикатуру, нужно научиться разговаривать с машиной на языке операторов и осветителей.
Анатомия запроса
С чего начинается качественный портрет? С понимания того, как нейросеть «видит» известных людей. Львиная доля успеха зависит от того, насколько точно вы укажете не только имя, но и контекст. Простое упоминание «Brad Pitt» выдаст вам усреднённый образ актёра за все годы его карьеры. А вот если добавить конкретику по возрасту или роли, машина начнет работать точнее. К слову, порядок слов имеет колоссальное значение. Имя звезды стоит выносить в самое начало промта. Ведь именно первые токены имеют для алгоритма наибольший вес.
Сложно ли добиться стопроцентного сходства? Да, но есть хитрости. В Stable Diffusion, например, принято использовать весовые коэффициенты. Если вы напишете (Angelina Jolie:1.2), сеть уделит её чертам лица повышенное внимание. Но не стоит перебарщивать. Завышение веса до 1.5 и выше часто приводит к появлению артефактов и «пережаренной» картинке. Баланс здесь — наше всё. Кроме того, отличным решением станет описание характерных черт внешности знаменитости, чтобы закрепить результат.
Портретная съёмка
Самый востребованный жанр — это, безусловно, крупный план. Здесь важно передать текстуру кожи, живой блеск в глазах и естественное освещение. Чтобы избежать эффекта «пластиковой маски», который так любят выдавать ранние версии нейросетей, в запрос необходимо включить технические термины фотографии.
Рассмотрим пример добротного промта для мужского портрета. Допустим, нам нужен Киану Ривз. Текст запроса может выглядеть так:
«hyper realistic portrait of Keanu Reeves, looking at camera, detailed skin texture, pores, wrinkles, slight beard, soft cinematic lighting, rim light, shot on Sony A7R IV, 85mm lens, f/1.8, depth of field, global illumination, 8k, uhd»
Обратите внимание на детализацию. Упоминание пор (pores) и морщин (wrinkles) заставляет ИИ прорисовывать микрорельеф кожи, делая лицо живым. А указание конкретной камеры и объектива (85mm — классический портретник) задает правильные пропорции без искажений.
А что насчёт женского образа? Возьмём, к примеру, Скарлетт Йоханссон. Здесь можно добавить больше мягкости. Промт будет следующим:
«close-up photo of Scarlett Johansson, elegant evening makeup, red lipstick, diamond earrings, soft studio lighting, bokeh background, detailed iris, natural skin texture, subsurface scattering, vogue magazine style, high resolution, photorealistic»
Термин «subsurface scattering» (подповерхностное рассеивание) здесь играет ключевую роль. Он имитирует прохождение света сквозь верхние слои кожи, придавая ей ту самую естественную полупрозрачность и мягкость. Без этого тега кожа часто выглядит как плотный тональный крем.
Случайный кадр
Статичные портреты хороши, но настоящая жизнь кроется в движении. Создание эффекта «папарацци» или случайного снимка требует иного подхода. Здесь мы намеренно ухудшаем качество идеальной картинки, добавляя шум, зернистость и, возможно, смазанность. Это придаёт изображению документальную достоверность.
Для имитации снимка папарацци промт может строиться так:
«paparazzi shot of Leonardo DiCaprio walking on the street, wearing sunglasses and casual hoodie, hiding face, motion blur, film grain, low quality, high noise, candid moment, daylight, urban background, realistic colors»
Слова «low quality» и «high noise» в данном контексте не портят работу, а, наоборот, работают на атмосферу. Мы обманываем мозг зрителя, который привык видеть звёзд именно в таком, несовершенном качестве в хрониках светской жизни.
Другой интересный вариант — селфи. Этот формат подразумевает искажение перспективы, характерное для фронтальных камер смартфонов. Попробуем отправить Дуэйна «Скалу» Джонсона в спортзал. Промт:
«smartphone selfie of Dwayne Johnson in gym, smiling, holding camera, wide angle lens distortion, sweating, workout clothes, gym equipment in background, mirror reflection, amateur photo, posted on instagram»
Упоминание «wide angle lens distortion» (искажение широкоугольного объектива) критически важно. Без него лицо будет выглядеть слишком плоским для селфи, и магия разрушится. Ну и, конечно же, детали вроде капель пота добавляют реализма.
Стилизация фото: Ретро
Особый интерес вызывает помещение современных звёзд в другие эпохи. Это настоящий кладезь для творчества. Представьте Билли Айлиш в антураже 1950-х или Тома Харди в образе гангстера 20-х годов. Чтобы провернуть такой трюк, нужно не просто указать год, но и описать технологию съёмки того времени.
Для стилизации под 90-е, которая сейчас довольно популярна, используйте такой шаблон:
«flash photography, polaroid style photo of Zendaya at a 90s house party, red eyes effect, vintage clothing, film grain, vignette, harsh flash lighting, candid atmosphere, analog aesthetic»
Жёсткая вспышка (harsh flash lighting) — это визитная карточка любительской съёмки конца прошлого века. Она делает лица плоскими, тени резкими, но именно это и создаёт нужное настроение.
Если же хочется углубиться в историю, например, в 1920-е, промт изменится кардинально:
«vintage daguerreotype photo of Cillian Murphy wearing 1920s suit and flat cap, sepia tone, scratches, dust, heavy grain, old photo texture, serious expression, peaky blinders atmosphere, historical photography»
Здесь мы оперируем терминами «сепия», «царапины» и «пыль». ИИ прекрасно понимает эти маркеры старения и накладывает их поверх изображения, буквально перенося персонажа во времени.
Кинематографичный кадр
Иногда хочется создать не просто фото, а кадр из несуществующего блокбастера. Здесь в игру вступают термины из индустрии кино. Нам нужно задать освещение, цветокоррекцию и композицию, свойственную большому экрану.
Представим Генри Кавилла в роли шпиона. Промт для такой сцены должен быть насыщенным:
«cinematic still shot of Henry Cavill in a tuxedo, casino background, dramatic lighting, teal and orange color grading, volumetric fog, intense look, action movie atmosphere, 35mm film stock, anamorphic lens flares, wide aspect ratio»
Сочетание «teal and orange» (бирюзовый и оранжевый) — это классическая голливудская схема цветокоррекции, которая мгновенно делает картинку «дорогой». А «volumetric fog» (объёмный туман) добавляет глубину пространству позади героя.
Стоит ли использовать имена режиссёров? Безусловно. Добавление «directed by Christopher Nolan» или «in style of Wes Anderson» кардинально меняет палитру и композицию. В случае с Уэсом Андерсоном нейросеть будет стремиться к симметрии и пастельным тонам, а Нолан добавит мрачности и реализма. Это мощный инструмент, про который не стоит забывать.
Освещение
Свет творит чудеса. Он может состарить лицо или, наоборот, омолодить его. Новички часто игнорируют этот параметр, полагаясь на случайность. И зря. Ведь именно свет лепит форму. Для звёздных портретов лучше всего подходят определённые схемы.
Один из самых выигрышных вариантов — «Rembrandt lighting» (рембрандтовское освещение). Оно создаёт характерный треугольник света на затенённой стороне лица, добавляя драматизма. Промт может звучать так:
«portrait of Margot Robbie, rembrandt lighting, moody atmosphere, dark background, sharp focus on eyes, chiaroscuro»
Если же нужно что-то более современное и яркое, подойдёт «Neon lighting» или «Cyberpunk style». Это часто используют для музыкантов или актёров фантастических боевиков. Пример:
«portrait of The Weeknd, cyberpunk city background, neon blue and pink lights reflecting on face, wet skin, rainy night, futuristic sunglasses, cinematic composition»
Отражения неона на коже (reflecting on face) придают изображению объём и вписывают персонажа в окружение, чтобы он не выглядел приклеенным.
Ошибки и подводные камни
Работа со звёздами имеет свои нюансы. Главный из них — фильтры безопасности. Большинство популярных нейросетей, таких как Midjourney или DALL-E, имеют встроенные ограничения на создание контента 18+ или компрометирующих изображений с реальными людьми. Если ваш промт блокируется, возможно, вы использовали слова, которые система сочла подозрительными. Даже безобидное описание купальника может вызвать срабатывание фильтра. В таком случае стоит заменить провокационные термины на более нейтральные или описать одежду детально, не называя её напрямую.
Ещё одна частая проблема — «зловещая долина». Это когда лицо вроде бы похоже, но выглядит мёртвым. Обычно это связано с отсутствием эмоций в запросе. Не забывайте добавлять слова, описывающие мимику: «laughing» (смеётся), «frowning» (хмурится), «screaming» (кричит) или «smirking» (ухмыляется). Статичное лицо с пустым взглядом всегда проигрывает живой эмоции.
К тому же, нередко всплывают проблемы с руками. Если в кадре должны быть руки звезды, готовьтесь к тому, что пальцев может оказаться шесть или четыре. Полностью избавиться от этого сложно, но промты вроде «perfect hands» или «detailed fingers» иногда спасают ситуацию. Лучше же всего просто кадрировать изображение так, чтобы кисти рук не попадали в фокус, если они не являются сюжетообразующим элементом.
Групповые снимки
Самое сложное — это заставить двух звёзд взаимодействовать в одном кадре. Нейросеть часто пытается слить их лица в одно или путает причёски. Чтобы этого избежать, используйте технику разделения описаний (если интерфейс позволяет) или максимально чётко разграничивайте персонажей в тексте.
Конструкция может быть такой:
«photo of Brad Pitt and Edward Norton talking in a bar, Brad Pitt on the left wearing leather jacket, Edward Norton on the right wearing suit, facing each other, detailed faces, fight club vibe, realistic lighting»
Указание «on the left» и «on the right» помогает ИИ расставить фигуры по местам. Однако, стоит отметить, что даже с таким подробным описанием может потребоваться несколько десятков генераций, прежде чем результат станет приемлемым.
Также помогает использование функции Inpainting (дорисовка), которая есть во многих локальных установках Stable Diffusion или в веб-интерфейсах. Сначала вы генерируете одного персонажа, а затем дорисовываете второго в нужной области. Это процесс кропотливый, но он позволяет контролировать внешность каждого героя по отдельности, не полагаясь на удачу.
Что в итоге?
Генерация изображений со звёздами — это захватывающий процесс, балансирующий на грани технологии и искусства. Не стоит гнаться за первым попавшимся результатом. Экспериментируйте с освещением, меняйте объективы, играйте со стилями и эпохами. Ваш промт — это режиссёрский сценарий, и чем подробнее он будет прописан, тем убедительнее сыграют ваши цифровые актёры. Пусть каждый созданный вами кадр станет маленьким шедевром, который удивит друзей и соберет заслуженные лайки. Удачи в творческих поисках, и пусть нейросеть понимает вас с полуслова!