Создание реалистичного человека в нейросети — это всегда лотерея, где вместо ожидаемого шедевра пользователь довольно часто получает пластиковую куклу с пустым взглядом или, что ещё хуже, анатомический кошмар с лишними пальцами. Казалось бы, технологии шагнули далеко вперед, но запрос «красивая девушка» или «суровый мужчина» всё ещё ставит искусственный интеллект в тупик, заставляя его генерировать усредненные, лишенные жизни образы. Ведь машина не понимает красоты в человеческом смысле, она лишь оперирует набором пикселей и тегов, которые ей скормили. И всё же, добиться фотореализма или стильной иллюстрации вполне реально. Но чтобы результат не разочаровал, а процесс не превратился в бесконечный перебор вариантов, стоит разобраться в самой механике составления промтов.
Чем отличается мужской портрет?
Многие новички считают, что достаточно просто поменять слово «woman» на «man», чтобы получить достойный результат. Это заблуждение. Мужские образы в генерации требуют совершенно иного подхода к текстуре и освещению. Если для женских портретов алгоритмы тяготеют к сглаживанию кожи (soft skin), то в мужских промтах такая «полировка» убивает всю харизму. Здесь солирует детализация. Чтобы добавить персонажу характер, в запрос стоит включать слова, описывающие несовершенства и рельеф. Отлично работают связки вроде «rough skin texture» (грубая текстура кожи), «chiseled jawline» (точеные скулы) или «stubble» (щетина). Без этих уточнений вы рискуете получить лицо, напоминающее маску из дешёвого сериала. К слову, возраст в мужских портретах тоже играет на руку реализму. Морщины, шрамы или даже лёгкая небритость делают образ живым, в то время как абсолютная гладкость вызывает эффект «зловещей долины».
Женские образы
С генерацией женских персонажей дело обстоит иначе. ИИ обучен на миллионах глянцевых фотографий, поэтому его «базовая настройка» — это идеализированная красота, которая быстро приедается. Сложно ли уйти от этого шаблона? Да, но возможно. Главное — избегать слов-паразитов вроде «perfect face» или «beautiful», которые лишь усиливают искусственность. Вместо этого лучше сосредоточиться на конкретике. Опишите тип внешности, макияж или его отсутствие, причёску и эмоцию. К примеру, запрос «natural look» (естественный вид) в сочетании с «freckles» (веснушки) и «messy bun» (небрежный пучок) даст куда более живой результат, чем абстрактная «красавица». А если добавить описание одежды и окружения, нейросеть перестанет концентрироваться только на лице и создаст цельную композицию. Изюминка кроется в деталях: случайная прядь волос, падающая на лицо, или нестандартный ракурс могут сотворить чудеса.
Структура запроса
Грамотный промт — это не просто набор слов, а чёткая инструкция, где порядок имеет значение. Начинать нужно с главного объекта. Кто в кадре? Мужчина, женщина, киборг или эльф? Сразу же задавайте стиль: «photo realistic», «oil painting» или «cyberpunk». Далее следует описание внешности и одежды. Не скупитесь на цвета и материалы: «silk dress» (шёлковое платье) или «leather jacket» (кожаная куртка) дадут нейросети нужную фактуру. Затем описываем окружение и, наконец, технические параметры (свет, тип камеры). Ошибкой будет смешивать всё в кучу. Нейросеть читает запрос слева направо, и то, что стоит в начале, имеет для неё наибольший вес. Поэтому, если вам важен цвет глаз, не ставьте его в самый конец огромного текста, иначе этот нюанс просто потеряется.
Примеры для мужчин
Рассмотрим конкретные сценарии. Допустим, нам нужен портрет пожилого мужчины с характером. Простой запрос «old man» выдаст скучный результат. А вот развернутый промт заставит ИИ попотеть. Попробуйте такую конструкцию:
Portrait of an elderly fisherman with a weathered face and deep wrinkles, wearing a yellow raincoat, stormy sea background, dramatic lighting, rain drops on face, shot on 35mm, highly detailed, cinematic texture
Здесь каждое слово работает на атмосферу. «Weathered face» (обветренное лицо) задает текстуру, «raincoat» (дождевик) и «stormy sea» (штормовое море) создают контекст, а технические параметры обеспечивают кинематографичность.
Другой вариант — деловой стиль. Нам нужен бизнесмен, но не стоковый, а живой. Промт может выглядеть так:
Confident handsome man in a bespoke navy blue suit, standing in a modern glass office, natural sunlight, depth of field, sharp focus, masculine features, 8k resolution
Обратите внимание на «natural sunlight» (естественный свет) — он убирает студийную искусственность. Ну и, конечно же, уточнение «bespoke» (сшитый на заказ) намекает нейросети на идеальную посадку костюма, что добавляет образу статусности.
Примеры для женщин
Теперь перейдем к женским портретам. Довольно часто требуется создать не просто красивое лицо, а определенное настроение. Возьмем, к примеру, образ в стиле бохо на закате. Промт будет следующим:
Young woman with long wavy red hair wearing a white lace boho dress, standing in a field of lavender during golden hour, soft warm lighting, dreamy atmosphere, intricate details, candid shot
Ключевое здесь — «candid shot» (случайный кадр). Это заставляет нейросеть имитировать естественную позу, словно девушку сфотографировали неожиданно. «Golden hour» (золотой час) обеспечивает то самое мягкое, теплое освещение, которое так любят фотографы.
А если нужна футуристичная героиня? Тут в ход идут другие триггеры. Попробуйте:
Cyberpunk woman with neon makeup and short blue hair, wearing high-tech armor, rainy neon city street background, wet surfaces, reflections, volumetric lighting, unreal engine 5 render style
Слова «wet surfaces» (мокрые поверхности) и «reflections» (отражения) добавят картинке глубины и реализма, характерного для этого жанра. Тем более, что стиль киберпанк сейчас на пике популярности, и нейросети отлично справляются с подобными задачами.
Свет и камера
Огромную роль играет описание света. Это же очевидно, но многие про это забывают. Освещение может полностью изменить восприятие персонажа. Для мужчин отлично подходит «Rembrandt lighting» (свет Рембрандта) или «hard shadows» (жёсткие тени) — это подчеркивает рельеф лица и придает драматизма. Для женских портретов часто используют «softbox lighting» (свет софтбокса) или «diffused light» (рассеянный свет), чтобы сгладить тени и сделать образ нежнее. Не стоит забывать и про настройки камеры. Упоминание «f/1.8» или «bokeh» размоет фон, акцентируя внимание на лице. А если написать «wide angle» (широкий угол), можно получить динамичный кадр с искажением перспективы, что выглядит довольно свежо.
Текстовые промты (ChatGPT)
Но не картинками едиными жив человек. Генерация текста от лица мужчины или женщины тоже имеет свои подводные камни. Если вы просите чат-бота «написать как женщина», он часто скатывается в стереотипы, добавляя кучу эмодзи и восклицательных знаков. Как этого избежать? Задавайте роль через профессию, возраст и характер, а не только через пол. Пример промта для мужского стиля:
Напиши пост для блога от лица опытного автомеханика 45 лет. Используй короткие, рубленые фразы, профессиональный сленг, минимум эмоций, скептический тон. Тема: выбор зимней резины.
Такой подход даст «сухой», экспертный текст.
Для женского образа, скажем, владелицы уютной кофейни, промт может быть таким:
Ты — хозяйка маленькой пекарни, увлеченная своим делом. Напиши приглашение на утренний кофе. Используй теплые, доверительные интонации, образные сравнения (аромат, уют), но избегай лишней восторженности. Стиль: дружеская беседа.
Здесь мы управляем тональностью («доверительные интонации»), а не просто полагаемся на гендерный стереотип. Результат будет куда более естественным и, главное, полезным для аудитории.
Ошибки новичков
Главный враг хорошего промта — это перегруженность. Попытка впихнуть в один запрос «всё лучшее сразу» приводит к каше. Если написать «мужчина в костюме, на пляже, в космосе, в стиле аниме, фотореализм», нейросеть просто сойдет с ума и выдаст нечто среднее и невразумительное. Противоречивые команды сбивают алгоритм. Нельзя требовать одновременно «black and white» (чёрно-белое) и «vibrant colors» (яркие цвета). Также не стоит дублировать слова. Многократное повторение «beautiful, beautiful, very beautiful» не сделает картинку лучше, а лишь засорит запрос. Ну и, наконец, избегайте слишком длинных предложений. Нейросеть лучше понимает теги и короткие фразы, разделенные запятыми, чем литературные описания в стиле Льва Толстого.
Работа с негативными промтами
Есть ещё один инструмент, который часто игнорируют, — это Negative Prompt (то, чего быть не должно). В интерфейсах вроде Stable Diffusion это отдельное поле. Что туда писать? Всё, что портит кадр. Стандартный набор для людей:
deformed, bad anatomy, disfigured, poorly drawn face, mutation, extra limb, ugly, disgusting, missing limb, floating limbs
Для реализма стоит добавить: «cartoon, 3d, illustration, sketch, low res». Это своего рода фильтр, отсекающий мусор. Для женских портретов в негативный промт иногда добавляют «makeup», если нужна полная естественность, или «male», чтобы черты лица не были слишком грубыми. Для мужских, соответственно, наоборот.
Влияние стиля художника
Интересный прием — использование имен известных художников или фотографов. Это задает вектор стиля. Хотите мистическую женщину? Добавьте «by Alphonse Mucha» (в стиле Альфонса Мухи) — получите характерные узоры и плавные линии. Нужен мрачный мужчина? «By H.R. Giger» превратит его в биомеханическое существо. А для классического фотореализма отлично работает «shot by Annie Leibovitz». Это кладезь готовых решений, накопленных мировой культурой. Однако тут есть нюанс: смешивание несочетаемых стилей может дать непредсказуемый результат. Ван Гог и киберпанк в одном флаконе — зрелище на любителя, хотя иногда эксперименты приводят к гениальным открытиям.
Одежда и аксессуары
Детали гардероба помогают раскрыть персонажа. Просто «одежда» — это скучно. Уточняйте крой, материал, эпоху. «Victorian suit» (викторианский костюм) сразу меняет осанку мужчины на картинке. «Silk kimono» (шёлковое кимоно) добавляет женщине плавности и загадочности. Аксессуары тоже важны. Очки, шляпы, ювелирные украшения — всё это якоря для внимания зрителя. Но помните про меру. Слишком много деталей могут перегрузить композицию, превратив персонажа в новогоднюю елку. Тем более, что нейросети иногда путаются в сложных аксессуарах, превращая ожерелье в часть ключицы.
Эмоции и взгляд
Взгляд — это душа портрета. Пустые глаза — главная проблема ИИ-генераций. Чтобы оживить персонажа, используйте такие эпитеты, как «piercing gaze» (пронзительный взгляд), «looking at viewer» (смотрит на зрителя) или, наоборот, «looking away» (смотрит в сторону). Эмоции тоже нужно прописывать конкретно: «smirk» (ухмылка), «frown» (хмурый взгляд), «laughing» (смеется). Статичное лицо без эмоций выглядит как паспортное фото. А вот лёгкая полуулыбка или задумчивость заставляют зрителя додумывать историю героя. Это работает безотказно.
Эксперименты с цветом
Цветовая палитра задает настроение. «Neon colors» отправляют нас в будущее, «sepia» — в прошлое, а «pastel tones» создают ощущение нежности и спокойствия. Не бойтесь указывать конкретные сочетания: «cyan and magenta lighting» (голубое и пурпурное освещение). Это особенно актуально для мужских портретов в стиле нуар или женских в стиле фэнтези. Цвет может рассказать о герое больше, чем его одежда. Мрачные, приглушенные тона («desaturated») подойдут для драматичного мужского образа, а яркие, насыщенные («vibrant») — для жизнерадостного женского.
Практика — ключ к успеху
Никакой готовый промт не заменит личного опыта. Нейросети постоянно обновляются, и то, что работало вчера, сегодня может выдать другой результат. Стоит пробовать, менять слова местами, добавлять и убирать детали. Иногда удаление всего одного прилагательного кардинально меняет картинку. Создайте свою библиотеку удачных связок. Записывайте, какие слова дают лучшую кожу, а какие — самый красивый свет. Это скрупулезный труд, но он того стоит. Ведь в конечном итоге вы становитесь не просто оператором машины, а соавтором, направляющим цифровую кисть в нужное русло.
Пост-обработка (Upscale и Inpainting)
Даже идеальный промт иногда выдает картинку с мелкими дефектами. Кривой глаз или странное ухо — не приговор. Современные нейросети позволяют исправлять эти огрехи через функцию Inpainting (дорисовка). Вы просто выделяете проблемную зону и просите перерисовать её. Также не забывайте про Upscale (увеличение разрешения). Часто детализация кожи и глаз проявляется именно после апскейла. Это важный этап, превращающий черновик в чистовик. Не ленитесь дорабатывать свои генерации, ведь именно внимание к мелочам отличает любителя от профи.
Подводные камни генерации рук
Отдельно стоит упомянуть руки. Это ахиллесова пята всех генераторов. Получить нормальные пять пальцев с первой попытки — удача. В промтах часто пишут «detailed hands» (детализированные руки), но это не панацея. Лучшее решение — кадрировать портрет так, чтобы руки не попадали в кадр, или прятать их в карманы («hands in pockets»). Если же руки необходимы, готовьтесь к долгому перебору вариантов (рероллу) или использованию специальных моделей (ControlNet), которые фиксируют позу. Этот нюанс портит кровь многим, но технологии не стоят на месте, и ситуация постепенно улучшается.
Выбор модели (Checkpoints)
Если вы работаете в Stable Diffusion, результат на 50% зависит от выбранной модели (Checkpoint). Есть модели, заточенные под аниме, есть — под фотореализм (например, Realistic Vision или Juggernaut). Промт, который выдает шедевр на одной модели, может показать полную ерунду на другой. Для мужских и женских портретов лучше выбирать специализированные модели, обученные на фотографиях людей. Они лучше понимают анатомию и текстуру кожи. В Midjourney выбора моделей меньше, но там есть параметры стиля (–style raw), которые тоже сильно влияют на исход.
Вдохновение и референсы
Где брать идеи? Натыкаешься на интересное фото — попробуй описать его словами для нейросети. Существуют даже сервисы, которые делают обратную операцию: вы загружаете картинку, а ИИ выдает вам промт. Это отличный способ учиться. Анализируйте работы других промпт-инженеров. Смотрите, какие слова они используют, в каком порядке. Сообщество довольно открытое, и найти примеры качественных промтов не составит труда. Копировать их один в один не стоит, а вот подсмотреть удачные приемы — милое дело.
Напоследок хочется сказать, что магия промт-инжиниринга кроется в постоянном поиске. Не бойтесь ошибаться, смешивать стили и выходить за рамки привычного. Искусственный интеллект — это мощный инструмент, но без человеческой фантазии он остаётся лишь набором алгоритмов. Управляйте им смело, экспериментируйте с формулировками, и тогда ваши цифровые мужчины и женщины обретут настоящую жизнь, вызывая восхищение зрителей. Пусть каждый ваш запрос становится маленьким открытием, а результат радует глаз и вдохновляет на новые творческие свершения.