Ни одна генерация портрета в нейросети не обходится без сюрпризов, особенно когда дело касается мужских образов, которые искусственный интеллект так и норовит превратить в глянцевые манекены. В сети представлено множество красивых картинок, но стоит обычному пользователю ввести запрос «мужчина», как на экране появляется нечто среднее между пластиковым Кеном и отфотошопленной моделью из рекламы барбершопа. Обыватель часто сталкивается с тем, что добиться текстуры кожи, харизматичного взгляда или суровой щетины оказывается сложнее, чем нарисовать дракона. А ведь именно детали создают характер, превращая бездушный набор пикселей в личность с историей. Но чтобы не ошибиться и не тратить часы на перебор вариантов, нужно понимать логику машины и знать правильные «заклинания».
Что такое «мужской» промт?
На самом деле, никакой секретной кнопки не существует, однако есть набор тегов, которые кардинально меняют результат. Генерируя женские портреты, нейросети по умолчанию стремятся к «красоте» в общепринятом, гламурном смысле, а вот с мужчинами алгоритм часто буксует, выдавая либо слишком слащавые, либо карикатурно брутальные лица. Главное — угадать с балансом. Здесь на помощь приходят уточняющие прилагательные, описывающие не просто внешность, но и фактуру. К слову, львиная доля успеха зависит от указания возраста и типажа кожи. Если не уточнить детали, вы получите усреднённый вариант. Поэтому первым делом стоит добавить в описание слова вроде «rugged» (суровый, грубый), «mature» (зрелый) или «detailed skin texture» (детальная текстура кожи). Это база. Без неё никуда.
Реализм и текстура: как убрать «пластик»?
Сложно ли заставить ИИ рисовать поры на лице? Довольно сложно, если не знать правильных токенов. Зачастую новички пишут просто «realistic», но для нейросети это понятие слишком размытое. Чтобы лицо обрело жизнь, нужно буквально требовать несовершенства. Прекрасно работают связки, описывающие микродетали. Например, стоит попробовать конструкцию, где упоминаются «facial pores» (поры на лице), «hyper-detailed» (гипердетализация) и даже «slight wrinkles» (лёгкие морщины). Ведь именно морщинки вокруг глаз делают взгляд живым. А если ещё вспомнить про освещение, то результат может превзойти ожидания. К тому же, отличным маркером реализма служит упоминание типа съёмки, допустим, «shot on 35mm lens» или «f/1.8» для размытого фона (боке).
Примеры для делового стиля
Представим ситуацию, когда вам нужен образ успешного бизнесмена или корпоративного лидера. Тут важно не скатиться в стоковую фотографию, где люди с неестественными улыбками жмут друг другу руки. Начать нужно с описания одежды и окружения, но не перегружать запрос лишним мусором. Добротный промт для такого случая может выглядеть так:
«Portrait of a confident man in his 40s, wearing a bespoke navy blue suit, white shirt, expensive watch, standing in a modern glass office, city skyline background, depth of field, natural lighting, 8k resolution, cinematic composition»
Заметьте, здесь указан возраст (40 лет), что сразу добавляет солидности. Можно пойти дальше и сделать образ более кинематографичным, добавив драматизма. Вариант для более жёсткого, «волевого» портрета:
«Close-up shot of a serious CEO, sharp features, intense gaze, dark textured suit, dim office lighting, moody atmosphere, ray tracing, hyperrealistic»
Такой подход создает ощущение власти и сосредоточенности.
Брутальность и «гранж»
Конечно, не всем нужны люди в пиджаках, ведь порой требуется создать персонажа для игры, обложки книги или просто харизматичного героя боевика. Здесь в ход идут совсем другие триггеры. ИИ прекрасно реагирует на слова, связанные с грязью, потом, шрамами и тяжёлым трудом. Это тот самый случай, когда «чем хуже — тем лучше». Для создания образа бывалого путешественника или наёмника отлично подойдёт следующая комбинация:
«Rugged handsome man with a thick beard, scars on face, wearing worn-out leather jacket, rainy street at night, neon reflections, wet skin texture, intense eyes, highly detailed, photorealistic, cinematic lighting»
Обратите внимание на «wet skin» — влажная кожа всегда выглядит более натурально и объёмно при рендере. А если хочется уйти в полную дикость, например, для фэнтези, попробуйте:
«Viking warrior, furious expression, face covered in mud and war paint, fur armor, snowy mountain background, dynamic lighting, 8k, unreal engine 5 style, masterpiece»
Эффект будет внушительным.
Студийный свет и арт-фотография
Бывает и так, что цель — не гиперреализм, а эстетика высокой моды или художественного портрета. Здесь на первый план выходят схемы освещения. Многие пренебрегают этим, полагаясь на случай, но это серьёзное упущение. Профессиональные фотографы знают, что свет «лепит» форму. Самый беспроигрышный вариант — это «Rembrandt lighting» (рембрандтовское освещение), которое дает красивый треугольник света на щеке и глубокие тени. Пример промта для чёрно-белого шедевра:
«Black and white portrait of an elderly man with deep wrinkles, side profile, dramatic rembrandt lighting, dark background, high contrast, sharp focus on eyes, emotional, award winning photography»
Это классика. Она работает безотказно. Если же душа просит цвета и креатива, можно использовать «double exposure» (двойную экспозицию) или цветной свет. Вот пример для экспериментов:
«Male model portrait, studio shot, blue and red gel lighting, cyber aesthetics, futuristic fashion, sharp features, sleek hair, minimalist background, 8k»
Киберпанк и футуризм: герой будущего
Тяготеет современная культура и к технологичным образам. Создать киборга или жителя неонового города — задача интересная, но здесь легко свалиться в «наляпистость», когда деталей так много, что глаз не цепляется за лицо. Нужна мера. Лучше сосредоточиться на одном-двух технологических элементах, чем превращать человека в трансформера. Довольно стильно выглядит интеграция имплантов или специфических очков. Попробуйте такой сценарий:
«Cyberpunk street samurai, asian male, glowing tech implants on face, wearing tactical techwear hood, rainy futuristic city street background, neon signs reflection in eyes, volumetric fog, cinematic shot, 35mm»
Здесь атмосферу задают не только детали одежды, но и окружение — дождь, неон, туман. А вот другой вариант, более чистый и научный:
«Portrait of a futuristic scientist, white minimalist lab coat, holographic interface in front of face, focused expression, clean laboratory background, soft blue lighting, high tech aesthetic, detailed iris»
Стилизация под живопись и иллюстрацию
Не фотографией единой жив цифровой художник. Порой нужен рисунок, скетч или масло. И тут возникают свои нюансы. Если просто написать «painting», нейросеть выдаст нечто среднее и невнятное. Стоит указывать конкретные техники или материалы. Это может быть масло, акварель, уголь или цифровой арт. К примеру, для создания эпичного портрета в духе классического фэнтези подойдёт такая конструкция:
«Oil painting of a noble knight, silver armor, holding a sword, epic battlefield background, smoke and fire, dramatic sky, style of Greg Rutkowski and Artgerm, intricate details, golden ratio»
Упоминание конкретных художников (хоть это и вызывает споры в сообществе) всё ещё остается рабочим способом задать стиль. Для более лёгкого, комиксного варианта:
«Concept art of a detective, noir style, comic book shading, ink lines, rain, dark alley, mysterious atmosphere, vivid colors, sharp illustration»
Ошибки, которые портят всё
Казалось бы, чем больше слов, тем точнее результат. Но на самом деле это распространенное заблуждение. Нейросеть имеет лимит внимания, и если вы напишете эссе на три страницы, она просто проигнорирует половину, выбрав случайные куски. Не стоит перебарщивать с эпитетами. «Красивый, великолепный, потрясающий, невероятный, лучший в мире мужчина» — это мусор для алгоритма. Лучше одно точное слово «charismatic» (харизматичный), чем десять синонимов красоты. Ещё один подводный камень — противоречивые команды. Нельзя требовать одновременно «sunny day» (солнечный день) и «dark moody atmosphere» (тёмная мрачная атмосфера). Машина сойдет с ума и выдаст серую кашу. Также следует быть осторожным с количеством конечностей и пальцев, хотя это лечится скорее негативными промтами (Negative Prompt), куда стоит вписать «deformed hands», «extra fingers», «bad anatomy». Но в основном промте лучше фокусироваться на позитивном описании того, что должно быть в кадре.
Технические параметры и ракурсы
Отдельно стоит упомянуть управление камерой. Ведь композиция решает, как мы воспринимаем героя. По умолчанию ИИ часто лепит портрет по плечи. Скучно. Чтобы изменить это, нужно использовать операторские термины. «Low angle shot» (вид снизу) придаст мужчине величественности и доминирования. «High angle shot» (вид сверху) сделает его более уязвимым или задумчивым. А «Wide shot» (широкий план) покажет окружение. Вот пример промта, где ракурс играет ключевую роль:
«Low angle full body shot of a giant barbarian, standing on a pile of rocks, looking down at camera, muscular build, heavy axe, stormy sky background, dynamic pose, epic scale»
Без указания «Low angle» варвар казался бы обычным парнем в костюме. Также полезно указывать соотношение сторон (в Midjourney это параметр –ar), так как вертикальные кадры (например, –ar 2:3) лучше подходят для портретов, чем стандартные квадраты.
Работа с возрастом и национальностью
Искусственный интеллект обучен на миллионах изображений, и у него есть свои стереотипы. Если не указать национальность, вы, скорее всего, получите белого мужчину европейской наружности. Если ваша цель — разнообразие, об этом нужно сказать прямо. И это касается не только расы, но и культурных кодов. При этом возраст — это вообще главный рычаг управления текстурой кожи. «Young man» (молодой человек) почти всегда будет с гладкой кожей. «Old man» (старик) — с гипертрофированными морщинами. А вот «Middle-aged» (среднего возраста) — золотая середина. Пример этнического портрета с характером:
«Portrait of an old Native American chief, traditional feathered headdress, weathered face with deep wrinkles, wise eyes, desert sunset background, warm lighting, highly detailed texture, national geographic style»
Здесь мы играем на ассоциациях с известным стилем фотографии, и ИИ это прекрасно понимает.
Как собрать свой идеальный промт?
Конструктор промта — вещь индивидуальная, но есть проверенная структура. Сначала — Объект (кто?), затем — Действие/Поза (что делает?), далее — Одежда и Внешность (во что одет?), после — Окружение (где?), и в финале — Технические параметры и Стиль (как снято?). Такая последовательность помогает алгоритму расставить приоритеты. Разумеется, местами их можно менять, но хаос в начале строки часто приводит к хаосу на картинке. К тому же, можно использовать «веса» (в некоторых нейросетях это двойное двоеточие :: или скобки), чтобы усилить значимость конкретного слова. Например, (red tie:1.5) сделает галстук самым важным элементом. Но для начала достаточно простого порядка слов.
Абстракция и эмоции
Иногда хочется уйти от конкретики и создать настроение. Мужской портрет не обязан быть реалистичным. Эмоциональные промты, описывающие чувства, а не физические объекты, дают удивительные, сюрреалистичные результаты. Слова вроде «sorrow» (печаль), «rage» (ярость), «solitude» (одиночество) могут окрасить картинку сильнее, чем описание цвета глаз. Попробуйте поэкспериментировать с таким запросом:
«Abstract portrait of a man made of smoke and shadows, silhouette, glowing red eyes, expression of anger, dark void background, surrealism, ethereal, mystical atmosphere»
Это уже не просто картинка, а метафора. И, кстати, такие изображения часто привлекают больше внимания своей загадочностью.
Финальные штрихи
Генерация изображений — это процесс, где количество попыток переходит в качество. Не стоит отчаиваться, если с первого раза у мужчины три руки или взгляд смотрит в разные стороны. Это нормально. Часто достаточно слегка изменить формулировку, добавить слово «symmetrical» (симметричный) или просто нажать кнопку «Generate» ещё раз. Главное богатство промпт-инженера — это его словарный запас и наблюдательность. Чем точнее вы можете описать то, что видите в голове, тем послушнее будет нейросеть. Удачи в творческих поисках, и пусть каждый ваш сгенерированный портрет станет маленьким шедевром, который хочется разглядывать часами.