Создать в нейросети изображение человека, которое не вызывало бы отторжения своей искусственностью, сегодня хотят многие: от дизайнеров до обычных пользователей соцсетей. Казалось бы, технологии шагнули далеко вперёд, и достаточно нажать одну кнопку, чтобы получить шедевр. Но на практике мы часто сталкиваемся с пластиковой кожей, стеклянными глазами или пугающей симметрией, которая присуща скорее манекенам, чем живым людям. Львиная доля успеха здесь зависит не столько от выбранной модели ИИ, сколько от умения правильно сформулировать запрос. Ведь генератор — это не телепат, а исполнитель, нуждающийся в точных инструкциях. Поэтому, чтобы результат действительно впечатлял, стоит погрузиться в тонкости составления промтов и понять анатомию идеального запроса.
С чего начинается реализм?
Первое, что нужно усвоить: нейросеть мыслит образами, на которых она обучалась. Если вы напишете просто «красивая девушка», алгоритм выдаст вам усреднённый, выхолощённый стандарт красоты, набивший оскомину. Здесь и кроется главная ошибка новичков. Начинать нужно с конкретики. Кто ваш герой? Каков его возраст, этническая принадлежность, настроение? Довольно часто именно мелкие детали задают тон всему изображению. Попробуйте добавить в описание не только внешние черты, но и эмоцию. Например, вместо сухого описания лица укажите «усталый взгляд», «лёгкая ухмылка» или «сосредоточенное выражение». Это мгновенно оживит картинку.
Кожа и текстура
Главный враг реализма — идеальная гладкость. Живой человек не может выглядеть как отполированная фарфоровая кукла. Чтобы избежать эффекта «мыла», в промт необходимо внедрять слова, отвечающие за фактуру. Отлично работают такие определения, как skin texture, highly detailed skin, pores, micro details. Можно пойти ещё дальше и добавить несовершенства, которые делают нас людьми. Веснушки, родинки, лёгкая небритость или даже морщинки в уголках глаз — всё это работает на достоверность. И здесь есть интересный нюанс: чем больше вы описываете текстуру, тем меньше шансов, что нейросеть «замылит» лицо.
Свет решает всё
Даже самая детальная модель будет выглядеть плоско без правильного освещения. Свет — это тот инструмент, который лепит форму и создаёт объём. Обыватель часто забывает об этом, полагаясь на случайность. Но профессионалы знают: характер освещения меняет восприятие кардинально. Хотите драмы? Используйте cinematic lighting, rembrandt lighting или chiaroscuro. Нужно что-то нежное и воздушное? Подойдёт soft light, natural lighting, sunlight. А вот для студийных портретов идеально впишется studio lighting или rim light (контровой свет), который отделит модель от фона и подсветит контур волос. Кстати, указание направления света тоже играет роль. Свет, падающий сбоку, подчеркнёт текстуру кожи, а фронтальный — скроет недостатки, но сделает лицо более плоским.
Техническая часть
Нельзя не упомянуть и о «фотографических» терминах. Нейросети прекрасно понимают язык фотографов. Если вы укажете модель камеры или тип плёнки, результат изменится до неузнаваемости. Например, запрос «shot on 35mm» даст более широкий угол и жизненную перспективу, в то время как «85mm» (классический портретник) обеспечит красивые пропорции лица без искажений. Апертура, или диафрагма, тоже важна. Указание f/1.8 или f/2.8 создаст то самое размытие фона (боке), которое так ценится в портретной фотографии. Это же правило касается и названий плёнок. Попробуйте добавить Kodak Portra 400 для тёплых, естественных тонов или Fujifilm для более холодных и контрастных оттенков.
Глаза — зеркало души
Именно на глаза мы смотрим в первую очередь. И именно они чаще всего выдают искусственное происхождение изображения. Чтобы взгляд был живым, стоит использовать уточнения вроде detailed eyes, beautiful detailed eyes, reflection in eyes. Безжизненный взгляд часто получается из-за отсутствия бликов или неправильной геометрии зрачка. Нейросеть иногда «забывает» о симметрии, поэтому акцент на детальной проработке глаз лишним не будет. Тем более, что выразительный взгляд способен вытянуть даже среднюю по качеству генерацию.
Пример портретного промта
Разберём конкретный пример, чтобы не быть голословными. Допустим, нам нужен гиперреалистичный портрет пожилого мужчины-рыбака. Простой запрос даст нам карикатурного старика с бородой. А вот правильный промт будет выглядеть иначе. Мы начинаем с главного объекта:
Portrait of an old fisherman with a weathered face and a thick grey beard. Wearing a yellow raincoat, stormy ocean background, rain drops on face. Highly detailed skin texture, deep wrinkles, hyperrealistic, shot on Sony A7R IV, 85mm lens, f/1.8, cinematic dramatic lighting, volumetric fog, 8k resolution.
Такой подход гарантирует, что вы получите не просто картинку, а историю, запечатлённую в цифре.
Эстетика полного роста
Сложно ли генерировать человека в полный рост? Да, задача эта не из лёгких. Как только мы отдаляем камеру, детализация лица падает, а конечности начинают жить своей жизнью. Здесь на помощь приходят уточнения по композиции. Используйте full body shot, wide angle, но будьте готовы к тому, что лицо придётся дорабатывать (инпейнтить) отдельно. Главное достояние ростовых портретов — это поза и одежда. Опишите, как стоит человек: standing confidently, walking towards camera, sitting on a chair. Одежду тоже стоит расписывать подробно, вплоть до типа ткани (denim, silk, leather), чтобы нейросеть понимала, как свет должен взаимодействовать с материалом.
Женский портрет: от гламура к естественности
Попробуем создать женский образ. Часто пользователи грезят о глянцевой красоте, но получают пластиковую куклу. Чтобы этого избежать, используем следующий алгоритм. Сначала описываем девушку:
Beautiful young woman with messy curly red hair and freckles. Laughing looking at the camera, dynamic pose. Soft natural lighting, golden hour, sun flare, shot on Kodak Gold 200, film grain, vintage aesthetic. Highly detailed, sharp focus, 8k, photorealistic.
Обратите внимание на «messy hair» (растрёпанные волосы) — идеальная укладка часто выглядит неестественно, а лёгкий хаос добавляет живости.
Как бороться с артефактами?
Конечно, даже лучший промт не страхует от ошибок. Лишние пальцы, странные изгибы конечностей — классика жанра. Спасательный круг в этой ситуации — так называемый Negative Prompt (негативный промт). Это список того, чего вы НЕ хотите видеть на изображении. В него обязательно стоит включить:
ugly, deformed, disfigured, extra fingers, bad anatomy, blurry, watermark, text, low quality, plastic skin
Это своеобразный фильтр, отсекающий откровенный брак. Не скупитесь на слова в этом разделе, ведь чем строже ограничения, тем чище результат.
Стилизация и художественные приёмы
Иногда реализм — это не просто фото, а стилизация под определённую эпоху или жанр. Хотите киберпанк? Добавляйте neon lighting, futuristic clothes, wet streets, cybernetic implants. Нужен нуар? Ваш выбор — black and white photography, high contrast, shadows, retro style, femme fatale. А если тяготеет душа к фэнтези, то в ход идут intricate armor, magic glow, ethereal lighting, digital art style by ArtStation. Удивительно, но даже добавление имени известного художника или фотографа (например, style of Annie Leibovitz или Greg Rutkowski) может кардинально изменить пластику света и композицию кадра.
Пример сложного кинематографического промта
Рассмотрим ситуацию, когда нужно создать кадр, словно вырванный из дорогого голливудского блокбастера. Нам важна не только модель, но и антураж. Промт может строиться так:
Cinematic shot of a warrior woman in battle armor, dusty battlefield background, smoke and fire particles. Sweat on skin, dirty face, intense look, blood smear. Anamorphic lens, lens flare, color graded, teal and orange, hyperrealistic, Unreal Engine 5 render, 8k.
Словосочетание «teal and orange» (бирюзовый и оранжевый) — это классическая цветовая схема кино, которая сразу придаёт картинке «дорогой» вид. А упоминание движка Unreal Engine 5 подсказывает нейросети, что мы ждём современной компьютерной графики высочайшего уровня.
Работа с цветом и палитрой
Цвет задаёт настроение. Не стоит пускать это на самотёк. Вы можете прямо указывать цветовую гамму: pastel colors, vibrant colors, dark moody atmosphere, monochrome. Иногда полезно указать конкретный доминирующий цвет, например, red theme или blue tones. Это поможет собрать композицию воедино, чтобы одежда героя не спорила с фоном. Впрочем, и здесь нужно чувствовать меру. Слишком пёстрая картинка («наляпистость») утомляет глаз и выглядит дёшево. Гармония — вот к чему стоит стремиться.
Одежда и ткани
Одежда — это не просто тряпки, прикрывающие тело. Это продолжение характера персонажа. Нейросеть отлично понимает разницу между текстурами. Если вы напишете просто jacket, результат будет непредсказуемым. А вот worn leather jacket (поношенная кожаная куртка) или fluffy wool sweater (пушистый шерстяной свитер) дадут совершенно разные тактильные ощущения зрителю. Играйте на контрастах: грубая джинса и нежный шёлк, тяжёлый бархат и лёгкий хлопок. Свет по-разному преломляется на этих поверхностях, создавая сложный и интересный рисунок.
Динамика и поза
Статичные позы «по стойке смирно» — удел паспортных фотографий. Живой человек всегда находится в движении, пусть даже в микроскопическом. Используйте глаголы действия. Running, jumping, dancing — для активных сцен. Lean against wall (прислонившись к стене), crossing arms (скрестив руки), looking over shoulder (оглядываясь через плечо) — для более спокойных, но естественных положений тела. Динамичные позы сложнее для генерации из-за риска получить анатомические ошибки, но результат того стоит. Картинка перестаёт быть мёртвым слепком и обретает энергию.
Нюансы возраста
Возраст персонажа — это кладезь возможностей для детализации. Изображая ребёнка, акцентируйте внимание на smooth skin, big eyes, soft features. Для людей среднего возраста подойдут эпитеты, подчёркивающие характер и статус. А вот пожилые люди — это настоящий подарок для любителей текстур. Каждая морщинка рассказывает историю. Не бойтесь использовать слова mature, elderly, aged. Нейросети часто пытаются омолодить персонажей, поэтому иногда приходится усиливать эти характеристики, добавляя «very old» или указывая конкретный возраст, например, «80 years old woman».
Окружение и фон
Герой не висит в вакууме. Фон — это контекст. Он может быть размытым (blurred background, bokeh), чтобы не отвлекать внимание, или детальным (detailed background, busy street, forest), чтобы рассказать историю места. Важно следить, чтобы освещение фона совпадало с освещением персонажа. Если герой освещён тёплым закатным солнцем, а на фоне пасмурное небо — возникнет диссонанс. Связка объекта и фона создаёт целостное восприятие. К тому же, интересный фон может скрыть мелкие огрехи генерации по краям кадра.
Пример промта для фэшн-съёмки
Для тех, кто хочет попробовать себя в роли виртуального фэшн-фотографа, подойдёт следующий вариант. Описываем модель и наряд:
Fashion model wearing avant-garde haute couture dress made of plastic and glass. Dynamic high fashion pose, low angle shot. Studio setup, clean grey background, professional lighting, softbox. Sharp focus, 8k, magazine cover quality, Vogue style.
Здесь мы намеренно убираем лишний шум фона, чтобы всё внимание приковал к себе образ.
Итоговая проверка
Перед тем как нажать кнопку «Generate», пробегитесь глазами по промту. Нет ли противоречий? Не слишком ли много стилей намешано в одну кучу? Кашу маслом, может, и не испортишь, а вот промт избыточными тегами — запросто. Иногда лучше убрать пару лишних прилагательных, чтобы дать нейросети немного свободы для творчества. Ведь именно в этой свободе часто рождаются самые неожиданные и удачные решения. Экспериментируйте, меняйте местами слова (те, что в начале, имеют больший вес), пробуйте разные синонимы.
Пусть ваши генерации всегда радуют глаз высокой детализацией, а количество пальцев на руках персонажей никогда не превышает пяти. Удачных экспериментов в создании цифровых людей!