Ни одна современная лента в социальных сетях не обходится без этого жанра, ставшего уже своего рода культурным кодом поколения. Казалось бы, что может быть проще, чем направить камеру смартфона на своё отражение и нажать кнопку спуска? Однако когда дело доходит до генерации подобных изображений с помощью нейросетей, ситуация кардинальным образом меняется, превращаясь из пятиминутного развлечения в настоящую головоломку. Искусственный интеллект, блестяще справляющийся с пейзажами и портретами, часто «ломается» на простой геометрии отражений, рисуя смартфоны, вросшие в ладони, или глаза, смотрящие в разные стороны. Но чтобы получить кадр, который не вызовет у зрителя когнитивного диссонанса, а заставит поверить в реальность происходящего, стоит разобраться в анатомии правильного текстового запроса.
Почему возникают сложности?
С точки зрения алгоритма, зеркало — это не физический объект, отражающий свет, а просто набор пикселей, который он пытается воспроизвести на основе миллионов обучающих картинок. Сложно ли машине понять, где заканчивается реальный объект и начинается его двойник? Безусловно. Ведь именно здесь кроется главный подвох: нейросеть часто пытается нарисовать и человека, и его отражение как двух разных персонажей, либо путается в том, в какой руке должен быть телефон. Логика, присущая нашему миру, в цифровом пространстве работает со сбоями. А если добавить сюда ещё и текст на чехле телефона, то задача для ИИ становится поистине грандиозной. Тем не менее, обойти эти ограничения вполне реально, если использовать правильные формулировки и знать пару хитростей.
Базовая структура запроса
С чего начинается построение идеального промта? С определения главного героя и, что ещё важнее, его взаимодействия с устройством. Нельзя просто написать «girl in mirror». Результат вас, скорее всего, разочарует. Основной скелет запроса должен содержать четкое указание на действие: «taking a mirror selfie», «holding a smartphone», «looking at the phone screen». Эти три кита удерживают композицию от распада. Причем порядок слов здесь играет не последнюю роль. Сначала мы описываем субъекта, затем действие, а уже потом — антураж и детали. Например, добротный базовый запрос может звучать так:
A young woman taking a mirror selfie, holding an iPhone 15 Pro Max in right hand, looking at the screen, bathroom interior, detailed reflection
К слову, уточнение модели телефона иногда помогает нейросети лучше прорисовать блок камер, делая его более узнаваемым, хотя и не гарантирует стопроцентного сходства.
Детализация и освещение
Особый интерес вызывает работа со светом. Ведь именно вспышка (flash) часто становится тем самым элементом, который продает реалистичность картинки. Плоское студийное освещение убивает атмосферу «случайного кадра», к которой мы все так привыкли. Поэтому стоит добавить в промт такие маркеры, как «camera flash», «bright flash flare», «dim lighting». Это создаст необходимые блики на зеркальной поверхности и добавит объём фигуре. А вот наляпистость в фоне лучше исключить, если только вы не стремитесь к стилю «творческий беспорядок».
Довольно часто новички забывают про состояние самого зеркала. Идеально чистая поверхность выглядит стерильно и искусственно. Стоит попробовать добавить «dirty mirror», «fingerprints on mirror» или «water drops on mirror» (если речь о ванной). Эти, казалось бы, мелкие дефекты творят чудеса, обманывая глаз зрителя и заставляя его верить в подлинность снимка. Да и самой нейросети проще сгенерировать шумную текстуру, чем идеально гладкое стекло.
Готовые решения: Повседневный реализм
Перейдем к конкретике, ведь теория без практики мертва. Допустим, вам нужен максимально естественный кадр девушки в домашней обстановке. Здесь отлично сработает конструкция, акцентирующая внимание на небрежности. Попробуйте такой вариант:
Raw photo, amateur shot, a cute girl taking a mirror selfie in a messy bedroom, wearing oversized grey hoodie and shorts, holding smartphone with both hands, messy bun hairstyle, camera flash, reflection in a wardrobe mirror, cozy warm lighting, grain, high detail
Обратите внимание на уточнение «holding smartphone with both hands» — это спасательный круг для генерации пальцев, так как нейросети проще нарисовать закрытый хват, чем изящно отставленный мизинец.
Другой популярный сценарий — это спортзал. Фитоняшки и бодибилдеры львиную долю контента создают именно перед зеркалами фитнес-клубов. Тут важен задний план. Промт может выглядеть следующим образом:
Fitness model taking a mirror selfie in a gym, wearing tight sportswear, holding phone, sweating skin, gym equipment in background, harsh fluorescent lighting, full body shot, large wall mirror, realistic texture, 8k
Здесь акцент смещается на текстуру кожи и характерное жёсткое освещение, которое обычно бывает в залах.
А что насчёт мужского портрета?
Мужские селфи имеют свою специфику. Обычно это более сдержанные позы и, довольно часто, акцент на одежде или физической форме. Если нужен стильный лук в лифте (классика жанра), запрос стоит сформировать так:
Man in a black suit taking a mirror selfie in an elevator, holding phone in one hand, metallic walls reflection, elevator buttons, moody lighting, wide angle, fashion photography style, sharp focus
Лифт — это вообще кладезь для интересных отражений благодаря металлическим поверхностям, которые нейросеть рисует с большим удовольствием. Однако стоит быть готовым к тому, что кнопки могут «поплыть», и их придется править в редакторе или с помощью inpainting.
Эстетичны ли такие двери? Само по себе полотно лифта не отличается красотой, но создаваемый им эффект бесконечного коридора отражений (если зеркал два) выглядит впечатляюще. Правда, с двойными отражениями ИИ справляется с трудом, поэтому лучше ограничиться одним зеркалом.
Стилизация: от аниме до киберпанка
Но реализмом сыт не будешь. Иногда хочется чего-то более художественного или даже фантастического. Промты для стилизованных селфи строятся по тем же законам, но требуют добавления специфических тегов художников или жанров. Для любителей японской анимации подойдет такой вариант:
Anime style, 2D illustration, cute anime girl taking a mirror selfie, school uniform, holding phone with charms and stickers, bathroom mirror, cel shading, vibrant colors, Makoto Shinkai style
Тут важно упомянуть «stickers on phone», так как это добавляет изображению характерную для аниме-культуры детализацию.
Если же душа тяготеет к мрачному будущему, то киберпанк станет отличным решением. Представьте себе не просто зеркало, а голографическую панель. Промт:
Cyberpunk character taking a mirror selfie, neon lights, futuristic bathroom, cybernetic arm holding a transparent smartphone, glowing tattoos, neon pink and blue lighting, reflection in a dirty cracked mirror, chromatic aberration, cinematic composition
В данном случае «cracked mirror» (треснутое зеркало) добавит драматизма и усложнит визуальный ряд.
Ошибки и «подводные камни»
Задача не из лёгких — получить идеальные руки с первой попытки. Это, пожалуй, самый большой бич нейросетевых селфи. Часто пальцы сливаются с корпусом телефона или их количество превышает биологическую норму. Ещё один нюанс — это «взгляд в никуда». В реальности, когда мы делаем селфи, мы смотрим либо на экран телефона (чтобы контролировать кадр), либо в объектив (в отражении). Нейросеть же может направить взгляд персонажа сквозь телефон или на зрителя, что выглядит жутковато.
Чтобы минимизировать этот эффект, в промте обязательно нужно прописывать направление взгляда: «looking at phone» или «looking at reflection». Также стоит избегать слишком сложных поз, где руки переплетаются или закрывают лицо. Чем проще геометрия тела, тем выше шанс на успех. И всё же, даже с идеальным промтом, процент брака будет оставаться. Это нормально. К слову, иногда нейросеть «забывает» нарисовать сам телефон, и персонаж просто держит руку в характерном жесте пустоты. В таких случаях помогает усиление веса токена (phone:1.3) или добавление бренда (iPhone, Samsung).
Нужен ли Negative Prompt?
Безусловно. Без качественного негативного промта, отсекающего мусор, получить добротный результат практически невозможно. В список исключений стоит внести всё, что касается искажений анатомии и логики. Стандартный набор выглядит примерно так:
ugly hands, extra fingers, missing fingers, deformed phone, text, watermark, signature, blur, low quality, distortion, double reflection, two people, camera lens in reflection
Особого внимания заслуживает пункт «double reflection» — иногда ИИ пытается отразить отражение, создавая рекурсивный кошмар.
Также не стоит забывать про исключение «camera in hands» в том случае, если вы хотите именно телефон, а не зеркальную камеру. Нейросети, обученные на старых датасетах, могут по старинке выдать персонажу громоздкий DSLR-аппарат, закрывающий половину лица. Хотя для кого-то это может стать винтажной изюминкой, в контексте современного селфи это чаще ошибка.
Работа с моделями и чекпоинтами
Разные нейросети реагируют на слово «mirror» по-разному. Midjourney, например, славится своей художественностью и довольно неплохо понимает контекст освещения, но контроль над точной позой там сложнее. Stable Diffusion (особенно модели на базе SDXL или Flux) дает больше инструментов контроля, таких как ControlNet, но требует более скрупулезного подбора слов.
Для SDXL хорошо работают промты с естественным языком, без перегрузки тегами через запятую. Вместо «girl, mirror, selfie, phone» лучше написать связное предложение: «A photo of a girl who is taking a selfie in the mirror using her phone». Это связано с тем, как обучались новейшие модели. А вот старые версии (SD 1.5) лучше «едят» именно теговую структуру. Поэтому перед генерацией стоит учитывать особенности выбранного инструмента.
Хитрости композиции
Интересный приём — использование зеркала не как основного элемента, а как части интерьера. Например, «car rear view mirror selfie». Селфи в зеркале заднего вида автомобиля — это отдельный жанр, создающий ощущение дороги и движения. Промт:
Close up shot in car rear view mirror, woman eyes looking at reflection, sunset light, bokeh road background, highly detailed eyes, makeup
Такой кадр выглядит очень кинематографично и часто используется для создания настроения в сторителлинге.
Или возьмем зеркало на улице. Витрина магазина. «Street photography, reflection in a shop window, hipster guy taking photo of himself, city lights, night street atmosphere, neon signs reflected in glass, candid shot». Здесь стекло витрины работает как полупрозрачное зеркало, смешивая образ героя с тем, что находится внутри магазина (манекены, товары), создавая сложную многослойную композицию. Это требует серьёзного вложения усилий в подбор параметров, но результат того стоит.
Заключительные штрихи
Не стоит забывать и про одежду. В зеркальных селфи она играет ключевую роль, так как занимает большую часть кадра. Текстуры ткани — шёлк, деним, кожа — при правильном освещении добавляют снимку достоверности. Используйте описания материалов: «satin dress», «leather jacket», «knitted sweater texture». Нейросеть любит конкретику. Чем точнее вы опишете фактуру, тем меньше шансов получить «пластиковую» одежду.
А если ещё вспомнить про чехлы для телефонов? «Phone case with stickers», «transparent phone case», «pink silicone case». Эти мелочи делают картинку живой. Зритель подсознательно считывает эти детали как маркеры реальности. Ведь у кого сейчас телефон без чехла? Разве что у рекламных моделей.
Экспериментируйте с ракурсами, меняйте освещение и не бойтесь добавлять странные детали. Мир отражений в нейросетях — это пространство, где законы физики уступают место вашей фантазии, и только от упорства зависит, станет ли зеркало порталом в мир искусства или кривой комнатой смеха. Удачных вам генераций, и пусть каждое отражение радует глаз своей четкостью и стилем!