Ни одна современная лента социальных сетей уже не обходится без изображений, сгенерированных нейросетями. Зачастую мы листаем их, даже не подозревая, что привлекательная девушка с идеальной кожей и глубоким взглядом — это всего лишь набор математических кодов, преобразованных в пиксели. Безусловно, технологии шагнули далеко вперёд, оставив позади эру шестипалых рук и “пластиковых” лиц, от которых веяло холодом зловещей долины. Многие обыватели, впервые открыв тот же Midjourney или Stable Diffusion, вводят запрос «красивая девушка» и получают результат, мягко говоря, далёкий от шедевра. Глаза косят, текстура кожи напоминает восковую фигуру, а фон живёт своей, порой весьма сюрреалистичной жизнью. А ведь дьявол, как известно, кроется в деталях. Поэтому, чтобы получить действительно качественное, живое и эстетичное изображение, к составлению промта (текстового запроса) стоит подойти не просто как к набору слов, а как к настоящему искусству режиссуры кадра.
С чего начинается работа?
С идеи. Банально, но факт. Просто написать «женщина» — значит обречь себя на бесконечный перебор вариантов, который довольно быстро наскучит. Нейросети нужна конкретика. Ей нужно понимать, кто перед ней, где этот персонаж находится и, самое главное, как на него падает свет. Первым делом стоит определить типаж. Это может быть «25 years old woman» (25-летняя женщина), «scandinavian model» (скандинавская модель) или, скажем, «cyberpunk girl» (девушка в стиле киберпанк). Возраст указывать стоит обязательно (если вам важен реализм), иначе алгоритм часто тяготеет к усреднённому образу без явных признаков индивидуальности. Да и этническую принадлежность лучше прописывать сразу. Ведь понятие красоты у нейросети весьма размытое и базируется на миллионах обучающих картинок.
Освещение
Свет — это, пожалуй, львиная доля успеха. Именно он лепит форму, создаёт настроение и объём. Если оставить этот пункт пустым, ИИ подставит стандартное, скучное освещение, напоминающее паспортное фото. Для драматичных, глубоких портретов отлично работает связка «cinematic lighting» (кинематографичное освещение) или «Rembrandt lighting» (рембрандтовское освещение). Последнее создает тот самый узнаваемый треугольник света на щеке, который так любят фотографы. Для более мягких, нежных образов спасательным кругом станет «soft lighting» (мягкое освещение) или «natural light» (естественный свет). А если хочется добавить в кадр магии, попробуйте «golden hour» (золотой час) — время перед закатом, когда всё залито тёплым золотистым сиянием. Бывает же, что нужно подчеркнуть футуристичность образа. Тут на помощь придет «neon lights» (неоновые огни) или «volumetric lighting» (объёмный свет), который добавит лучи, пробивающиеся сквозь дымку. Это выглядит впечатляюще.
Как добиться фотореализма?
Бич многих генераций — эффект «перефотошопленности». Кожа выглядит слишком гладкой, словно замыленной. Чтобы этого избежать, в промт необходимо вводить слова, отвечающие за текстуру. Ключевые маркеры здесь — «highly detailed skin» (высокодетализированная кожа), «skin pores» (поры кожи), «skin texture» (текстура кожи). Не стоит забывать и про такие нюансы, как «freckles» (веснушки) или «moles» (родинки) — они придают лицу живость и индивидуальность. Можно даже добавить «imperfect skin» (неидеальная кожа), чтобы сбить этот налёт глянцевой искусственности.
Кроме того, технические параметры камеры играют огромную роль. Если указать «shot on 35mm lens» (снято на 35мм объектив), вы получите более широкий угол и эффект присутствия. А вот «85mm lens» или «100mm lens» дадут классическую портретную картинку с красивым размытием фона, которое, кстати, активируется словом «bokeh» или «depth of field» (глубина резкости). Разумеется, такие добавки, как «4k», «8k», «ultra realistic», «photorealistic», «UHD», уже стали стандартом де-факто для получения высокого разрешения.
Позирование и ракурс
Сложно ли управлять позой модели? Да, это требует терпения. ИИ часто норовит поставить персонажа просто лицом к камере. Чтобы разнообразить кадр, используйте уточнения: «looking at camera» (смотрит в камеру), «looking away» (смотрит в сторону), «side profile» (профиль), «dynamic pose» (динамичная поза). Для крупных планов идеально подходит «close-up portrait» (крупный план) или «extreme close-up» (макросъёмка глаз или губ). Если же нужно показать одежду или окружение, пишите «waist shot» (по пояс) или «full body shot» (в полный рост). Впрочем, с последним стоит быть осторожнее: на общих планах нейросети чаще ошибаются с прорисовкой лица и конечностей. Лицо может “поплыть”, превратившись в нечто малопривлекательное. Исправлять это потом (Inpaint) — занятие кропотливое.
Работа с одеждой и стилем
Одежда — это антураж, который рассказывает историю. Просто «платье» (dress) — это скучно. А вот «intricate red silk dress» (сложное красное шёлковое платье) — совсем другое дело. Материалы стоит прописывать детально: «denim» (джинса), «leather» (кожа), «lace» (кружево), «velvet» (бархат). Можно добавить эпитеты вроде «dirty» (грязный) для постапокалипсиса или «wet» (мокрый) для драматичных сцен под дождём. Стиль тоже имеет значение. «Boho style», «cyberpunk fashion», «victorian style», «streetwear» — эти теги задают вектор всей генерации. Ну и, конечно же, аксессуары. Очки, серьги, шляпы — всё это добавляет изюминку. Но не перегружайте промт лишними деталями в один заход, иначе нейросеть может запутаться и смешать всё в кучу.
Пример готового промта: Студийный портрет
Попробуем собрать всё воедино для создания качественного студийного портрета. Начнем с объекта. Пусть это будет молодая девушка с рыжими волосами. Далее добавим свет и детали.
Промт может выглядеть так:
Portrait of a beautiful 25 year old woman with messy ginger hair and green eyes, freckles, highly detailed skin texture, pores, studio lighting, rim light, dark background, shot on 85mm lens, f/1.8, bokeh, hyperrealistic, 8k, photography style.
Разберем по полочкам. Мы задали возраст и цвет волос, указали наличие веснушек и текстуры кожи (чтобы убрать “мыло”). Свет выбрали студийный с контровым освещением (rim light), чтобы отделить модель от тёмного фона. Технические параметры камеры (85mm, f/1.8) обеспечили нам правильные пропорции лица и размытый фон. Результат такого запроса обычно получается добротным и требует минимальной доработки.
Пример готового промта: Уличная фотография
А если хочется чего-то более живого, спонтанного? Уличная фотография тяготеет к естественности.
Вот вариант для солнечного дня:
Full body shot of a stylish woman walking in Tokyo street, wearing oversized coat and sneakers, golden hour sunlight, lens flare, dynamic pose, candid shot, urban atmosphere, highly detailed, photorealistic, cinematic depth of field.
Здесь ключевую роль играют слова «walking» (идет), «candid shot» (случайный кадр) и «urban atmosphere» (городская атмосфера). Мы также добавили «lens flare» (блик объектива) для большей художественности. Такой запрос создаст ощущение, что фото сделал папарацци или уличный фотограф, поймавший удачный момент.
Пример готового промта: Фэнтези и Арт
Не всегда цель — реализм. Иногда хочется окунуться в мир грёз. Для этого нужно сменить лексикон с фотографического на художественный.
Попробуем создать эльфийку:
Ethereal portrait of an elven princess with long silver hair and glowing blue eyes, wearing intricate floral crown, magical forest background, fireflies, soft moonlight, fantasy art style, digital painting, by Artgerm and Greg Rutkowski, intricate details, masterpiece.
Обратите внимание: мы убрали упоминания камеры и добавили имена художников (Artgerm, Greg Rutkowski), чей стиль нейросети знают отлично. Слова «ethereal» (эфирный, воздушный) и «magical» (магический) задают тон. Такой промт выдаст не фотографию, а красивую цифровую иллюстрацию.
Негативный промт (Negative Prompt)
Это та самая “ложка дёгтя”, которую нужно исключить, чтобы бочка мёда осталась чистой. Во многих интерфейсах (особенно в Stable Diffusion) есть отдельное поле для того, чего на картинке быть НЕ должно. Это спасательный круг от мутантов. Туда смело вписывайте: «ugly, deformed, extra fingers, missing limbs, blur, low quality, watermark, text, bad anatomy, fused fingers, cross-eyed». Впрочем, даже такой список не даёт 100% гарантии, но количество брака снижает в разы. Особенно это касается рук. Нейросети до сих пор плохо понимают, как работают суставы пальцев, поэтому «bad hands» в негативном промте — обязательный гость.
Ошибки новичков
Самая частая ошибка — писать абстрактно. «Beautiful photo» (красивое фото) — понятие субъективное. Для ИИ это может быть и закат, и котёнок, и девушка. Вторая ошибка — слишком длинные промты. Не стоит переписывать “Войну и мир”. Алгоритм уделяет больше внимания словам в начале запроса, а хвост часто игнорирует. Старайтесь укладывать суть в первые 5-7 слов, а детали — в середину. Третья ошибка — противоречия. Если вы напишете «sunny day» (солнечный день) и «night atmosphere» (ночная атмосфера) одновременно, результат будет непредсказуемым и, скорее всего, странным. Нейросеть попытается смешать несмешиваемое, выдав серую кашу.
Стилизация под плёнку
Сейчас в тренде ретро-эстетика. Зернистость, лёгкие искажения цветов, несовершенство. Чтобы получить такой эффект, добавляйте в промт названия плёнок. «Kodak Portra 400» даст тёплые, приятные скин-тоны. «Fujifilm Superia» уведет картинку в зеленовато-марганцевые оттенки. «Polaroid style» добавит характерную рамку и вспышку «в лоб».
Пример:
Close-up portrait of a girl with messy bun, drinking coffee in a retro diner, neon sign reflection in window, shot on Kodak Portra 400, film grain, vintage colors, 90s aesthetic.
Здесь «film grain» (плёночное зерно) и «vintage colors» (винтажные цвета) делают картинку уютной и атмосферной, словно из семейного альбома.
Взгляд
Глаза — зеркало души, и в сгенерированном портрете они часто “солируют”. Чтобы взгляд не был пустым, используйте эпитеты. «Expressive eyes» (выразительные глаза), «piercing gaze» (пронзительный взгляд), «sad look» (грустный взгляд). Цвет глаз тоже лучше уточнять, иначе получите стандартный карий или голубой рандом. «Heterochromia» (разный цвет глаз) — популярный приём для создания уникального персонажа. А если нужно, чтобы девушка смотрела прямо в душу зрителю, фраза «looking directly into camera» должна стоять в самом начале промта.
Макияж
О, это целый мир. Нейросеть умеет “красить” моделей не хуже профессионального визажиста. Но ей нужно дать задание. «No makeup» (без макияжа) подойдёт для естественных образов. «Smokey eyes» (смоки айс) добавит драмы. «Red lipstick» (красная помада) станет ярким акцентом. Можно экспериментировать с «fantasy makeup» (фэнтезийный макияж), добавляя блестки, узоры на лице или золотую фольгу. Главное — не переборщить, чтобы лицо не превратилось в раскраску клоуна, если только это не было вашей целью.
Заключение: нюанс восприятия
Генерация изображений — процесс не сложный, но кропотливый, напоминающий добычу золота. Приходится просеивать тонны пустой породы неудачных вариантов, чтобы найти тот самый самородок. Но когда на экране появляется изображение, от которого невозможно отвести взгляд, понимаешь: оно того стоило. Экспериментируйте со стилями, меняйте освещение, “переодевайте” своих моделей и не бойтесь ошибок. Ведь каждая неудачная генерация — это лишь шаг к пониманию того, как мыслит алгоритм. Пусть ваше творчество приносит удовольствие, а коллекция пополняется настоящими цифровыми шедеврами, которые удивят даже самых искушённых зрителей.