В бесконечном потоке сгенерированных изображений, которыми сегодня наводнены социальные сети и портфолио цифровых художников, глаз обывателя моментально цепляется за одну и ту же деталь — неестественную, словно отполированную до блеска пластмассу вместо живой человеческой плоти. Идеально гладкие лица без единой поры, словно вырезанные из воска, уже давно стали маркером «дешёвой» нейросетевой генерации, выдавая искусственное происхождение картинки за долю секунды. Ведь в реальности наша оболочка никогда не бывает безупречной: она дышит, краснеет, имеет микрорельеф и реагирует на свет сложнейшим образом, который физики называют подповерхностным рассеиванием. Но чтобы добиться такого эффекта от бездушного алгоритма, нужно не просто нажать кнопку «Сделать красиво», а скрупулёзно подобрать слова, заставляющие машину рисовать не манекен, а живого человека. А начать стоит с понимания того, из чего же на самом деле складывается этот неуловимый эффект реализма.
Сложно ли обмануть зрителя?
Да, но результат того стоит. Задача не из лёгких. Ведь нейросети, будь то Midjourney или Stable Diffusion, обучались на миллионах фотографий, львиная доля которых — это отретушированный глянец, где кожа «замылена» до состояния фарфора. Алгоритм по умолчанию тяготеет к идеализации. Ему проще нарисовать гладкий шар, чем сложную текстуру с тысячами микроскопических неровностей. Поэтому, вводя простой запрос вроде «beautiful girl», вы почти гарантированно получаете куклу. Чтобы сбить эту настройку, приходится буквально принуждать ИИ добавлять «грязь» и несовершенства, которые и делают нас людьми. И тут на сцену выходят специфические токены.
Текстура и микродетали
Главное — это поры. Без них лицо выглядит как резиновая маска. В промте обязательно должны присутствовать уточнения, касающиеся микрорельефа. Хорошо работают связки visible pores (видимые поры), detailed skin texture (детализированная текстура кожи) и skin pores. Но и перебарщивать не стоит. Если просто написать «много пор», нейросеть может превратить лицо в губку. Лучше использовать смягчающие определения или указывать контекст съёмки, например, макро. К слову, отличным дополнением станут упоминания мелких волосков — peach fuzz (тот самый пушок на щёках), который особенно хорошо виден в контровом свете. Это сразу добавляет снимку достоверности.
Нельзя не упомянуть и о естественных неровностях. Goosebumps (мурашки) могут оживить кадр, если сюжет предполагает холод или эмоции. А fine lines (мелкие морщинки) необходимы даже для молодых лиц, особенно вокруг глаз при улыбке. Ведь абсолютно гладкое лицо при мимике — это признак ботокса, а не молодости.
Свет и подповерхностное рассеивание
Влияет ли освещение на восприятие кожи? Безусловно. И даже сильнее, чем текстура. Настоящая кожа не просто отражает свет, она пропускает его внутрь, рассеивает и возвращает обратно. Именно поэтому уши на солнце светятся красным, а тени на лице никогда не бывают абсолютно чёрными. В компьютерной графике этот эффект называется Subsurface Scattering (SSS). Добавление этого термина в промт часто творит чудеса, делая кожу мягкой и полупрозрачной, а не гипсовой.
Ещё один нюанс — это тип освещения. Жёсткий студийный свет (studio lighting) часто скрадывает текстуру, превращая лицо в маску. А вот hard lighting (жёсткий свет) или side lighting (боковой свет), падающий под острым углом, наоборот, подчёркивает каждую пору и неровность. Если ваша цель — показать качество кожи, выбирайте драматичное освещение. Raking light (скользящий свет) — ещё один профессиональный термин, который заставит рельеф буквально «выпрыгнуть» на зрителя.
Цветовые нюансы и несовершенства
Идеальный бежевый цвет — это миф. Живая кожа — это сложная палитра из красных, синих и жёлтых оттенков. Skin variation (вариативность кожи), blotchy skin (пятнистая кожа) или redness (покраснения) делают портрет живым. Разумеется, не нужно превращать модель в человека с тяжёлым дерматологическим заболеванием (если только это не ваша цель), но лёгкий румянец (flushed cheeks) или неравномерный загар добавляют жизни.
Особый интерес вызывает использование токенов, описывающих конкретные дефекты. Freckles (веснушки) — это уже классика, настоящий спасательный круг для генераторов, так как веснушки автоматически создают слой детализации. Moles (родинки), acne scars (шрамы от акне) или hyperpigmentation (гиперпигментация) — инструменты для смелых. Они разбивают искусственную симметрию и гладкость. Довольно часто именно наличие небольшого шрама или родинки над губой заставляет зрителя поверить в реальность персонажа.
Примеры готовых промтов: Крупный план
Для начала разберём вариант, когда нам нужен максимальный реализм в портрете. Здесь мы делаем упор на технические характеристики камеры и текстуру. Такой промт подойдет для демонстрации возможностей нейросети в детализации. Вот довольно мощная конструкция:
Extreme close-up portrait of a woman, natural look, no makeup, highly detailed skin texture, visible pores, peach fuzz on cheeks, subsurface scattering, hyperrealistic, shot on 100mm macro lens, sharp focus, soft natural lighting, raw photo style –v 6.0
Обратите внимание на отсутствие макияжа (no makeup). Косметика часто «замыливает» кожу, поэтому для тестов лучше её убирать.
Примеры готовых промтов: Возрастной портрет
Старая кожа — это настоящий кладезь фактуры для нейросети. Здесь можно разгуляться с морщинами и пигментацией. Генерировать пожилых людей проще, так как алгоритм не пытается их «омолодить» и сгладить так агрессивно, как молодых девушек. Попробуйте такой вариант:
Portrait of an elderly fisherman, deep wrinkles, sun-damaged skin, age spots, weathered skin texture, rough skin, intense gaze, intricate details, cinematic lighting, dramatic shadows, 8k resolution, photorealistic –style raw
Слова weathered (обветренная) и rough (грубая) здесь играют ключевую роль, создавая ощущение прожитой жизни и тяжёлого труда.
Примеры готовых промтов: Влажная кожа
Вода и пот меняют свойства отражения света, создавая блики, которые добавляют объёма. Это отличный способ уйти от «матовой куклы». Спортивная тематика или сцены под дождём всегда выглядят выигрышно. Интересный результат даст такой запрос:
Fitness model after workout, sweat drops on skin, glistening skin, wet skin texture, intense lighting, realistic skin sheen, high contrast, pores visible through sweat, dynamic angle, realistic photography
Здесь glistening (блестящий) и sheen (отблеск) помогают имитировать влажность, не превращая человека в пластик, облитый маслом.
Отрицательные промты: Чего мы избегаем
Иногда важнее не то, что вы написали, а то, что вы запретили. В Stable Diffusion (и частично в Midjourney через параметр --no) стоит отсекать всё, что связано с искусственностью. В список «персон нон грата» смело вносите:
airbrushed, smooth skin, plastic, doll, wax, blurry, cartoon, illustration, 3d render, photoshop
Исключение этих понятий заставит нейросеть искать альтернативы в базе данных, обращаясь к более реалистичным, «сырым» фотографиям.
Технические параметры и стиль
Не стоит забывать и о «волшебном» слове RAW. В фотографии это формат “сырого” снимка без внутрикамерной обработки. Добавление raw photo или параметра --style raw (в Midjourney) дает команду алгоритму отключить встроенные “улучшайзеры”. Это часто приводит к появлению шума (film grain), который, как ни странно, нам на руку. Зернистость плёнки скрывает цифровую природу изображения, связывая пиксели воедино.
Можно также поиграть с названиями конкретных фотоплёнок. Упоминание Kodak Portra 400 или Fujifilm Pro 400H добавит специфическую цветопередачу и микроконтраст, характерный для аналоговой фотографии. Плёнка ведь никогда не дает абсолютно гладкой картинки, она всегда имеет структуру зерна.
Ошибки, которые убивают реализм
Главная ошибка новичков — использование слишком абстрактных эпитетов. Слова gorgeous, stunning, perfect нейросеть воспринимает как команду к идеализации. «Идеальный» для ИИ — значит симметричный и гладкий. Если вы хотите живого человека, избегайте слов, описывающих совершенство. Лучше использовать нейтральные или описательные прилагательные: authentic (аутентичный), candid (искренний, непринужденный).
Ещё один подводный камень — избыток света. Заливка кадра равномерным ярким светом убивает тени, а вместе с ними и объём. Кожа становится плоской. Не бойтесь теней, не бойтесь контраста. Тёмные участки на лице создают глубину.
Влияние расстояния до объекта
Интересно, что промты для кожи работают по-разному в зависимости от крупности плана. Если вы генерируете человека в полный рост, требовать visible pores бессмысленно — нейросеть просто не сможет прорисовать их в таком масштабе, и вместо этого может добавить странный шум или артефакты на лицо. Для ростовых портретов лучше использовать общие описания освещения и атмосферы, а детализацию кожи оставить для крупных планов (close-up).
Впрочем, есть хитрость. Можно использовать upscale (увеличение разрешения) с дорисовкой деталей. В Stable Diffusion это делается через Hires. Fix или img2img, где вы можете пройтись по лицу с более низким параметром denoising strength, добавив детализацию уже на готовое изображение.
Специфика разных моделей
Нужно отметить, что Midjourney v6 и Stable Diffusion XL (SDXL) понимают запросы немного по-разному. Midjourney v6 стала гораздо чувствительнее к естественному языку. Ей можно просто написать: «Девушка с плохой кожей, видны поры и неровности», и она поймет. А вот старые версии или базовые чекпоинты SD всё ещё любят теги через запятую и усиление веса токенов (скобки и коэффициенты).
Для SDXL отлично работает тег photorealistic, но в сочетании с конкретным указанием фокусного расстояния, например 85mm или 50mm. Это задает правильные пропорции лица (дисторсию), что подсознательно считывается нами как «настоящее фото». Широкоугольные объективы на крупных портретах могут искажать черты, делая лицо мультяшным, если не контролировать этот процесс.
Этнические особенности
Кожа бывает разной не только по возрасту, но и по цвету, плотности и реакции на свет. Упоминание этнической принадлежности (Scandinavian, Ethiopian, Japanese) подтягивает из базы данных ИИ соответствующие характеристики кожи. Например, тёмная кожа сильнее бликует (specular highlights), и это нужно учитывать в промте, добавляя слова о блеске или контрасте. Светлая кожа, наоборот, больше подвержена покраснениям и просвечиванию вен. Использование этих биологических фактов — верный путь к тому, чтобы изображение перестало выглядеть как картинка из стока.
Как же собрать идеальный промт?
В конечном итоге, секрет не в одном волшебном слове, а в балансе. Нельзя просто накидать все термины сразу. Начните с базы: кто на фото и какое освещение. Затем добавьте слой текстуры (pores, skin texture). После этого введите «шум» в виде несовершенств (freckles, moles). И закрепите всё техническими параметрами камеры (raw style, macro).
Практика показывает, что лучшие результаты получаются методом перебора и смешивания. Иногда удаление одного слова меняет картинку кардинально. Не скупитесь на эксперименты с синонимами: вместо sweaty попробуйте perspiration, вместо wrinkled — lined face. Язык богат, и нейросети ценят это разнообразие.
Ну и, наконец, доверяйте своему глазу. Если результат кажется вам «пластиковым», значит, так оно и есть. Добавляйте хаос, добавляйте случайности, уходите от глянцевых стандартов. Ведь именно несовершенства делают нас уникальными, и именно их так не хватает в цифровом мире. Пусть ваши генерации вызывают желание протянуть руку и коснуться, а не протереть экран от жирных пятен. Удачи в поисках того самого, живого кадра, который заставит зрителя замереть в восхищении!