Ленты социальных сетей буквально ломятся от сгенерированных изображений, и порой обыватель даже не подозревает, что смотрит на несуществующего человека. Казалось бы, технологии достигли пика: нажал кнопку — получил шедевр. Но на практике новички довольно часто сталкиваются с пластиковыми лицами, бессмысленным взглядом и пугающей анатомией, которая способна испортить любое впечатление. Грезят о фотореализме многие, но получают лишь его жалкое подобие, напоминающее плохую компьютерную игру начала нулевых. А ведь секрет успеха кроется не в мощности видеокарты или платной подписке, а в умении грамотно сформулировать запрос. И чтобы результат заставил зрителя замереть от восторга, стоит разобраться в анатомии идеального промта.
Как собрать идеальный запрос?
С чего начинается работа над портретом? С понимания того, как нейросеть «видит» мир. Она не понимает абстракций, зато отлично оперирует терминами из фотографии и кинематографа. Просто написать «красивая девушка» — значит отдать инициативу на откуп рандому. А вот если указать конкретные параметры, ситуация меняется кардинально. Начать стоит с определения объекта и общего стиля. Это фундамент. Например, фраза «hyperrealistic portrait of a young woman» задаёт тон всему изображению. Но этого мало. Львиная доля успеха зависит от технических деталей, которые для алгоритма служат своего рода маяками в океане пикселей.
Техническая часть: Камера и объектив
Задумывались ли вы, почему одни портреты выглядят как сэлфи, а другие — как обложка Vogue? Дело в фокусном расстоянии. В реальной жизни фотографы используют портретные объективы, чтобы избежать искажений лица. Нейросеть знает об этом. Поэтому в промт обязательно стоит включить обозначение объектива. Классикой считается 85mm. Именно это фокусное расстояние делает черты лица правильными и гармоничными. Если же хочется добавить больше пространства и воздуха, подойдёт 50mm или 35mm, но с последним нужно быть осторожнее — он может деформировать пропорции на крупных планах.
Не стоит забывать и о диафрагме. Значение f/1.8 или f/2.8 творит чудеса, создавая то самое размытие фона (бокэ), которое отделяет модель от заднего плана и приковывает внимание к глазам. Пропишите в запросе «depth of field» или «bokeh», и картинка мгновенно приобретёт объём. Ну и, наконец, маркеры качества. Слова «8k resolution», «highly detailed», «sharp focus» и «shot on Sony A7R IV» (или любой другой топовой камере) дают сигнал системе: нам нужна максимальная чёткость, а не мыльная опера.
Свет и атмосфера
Свет. Это душа фотографии. Без него даже самая красивая модель будет выглядеть плоской. Обычное «good lighting» здесь не сработает. Нужна конкретика. Один из самых выигрышных вариантов — «cinematic lighting». Это создаёт драматичный, киношный объём. Если же хочется мягкости и нежности, выручит «softbox lighting» или «natural window light». А для тех, кто любит контрасты и выразительные тени, отличным решением станет «Rembrandt lighting» — классическая схема с треугольником света на щеке, названная в честь великого живописца.
А вот для уличных портретов идеально подходит «golden hour» — время перед закатом, когда солнце заливает всё тёплым золотистым светом. Это беспроигрышный вариант. Тем более, что нейросети великолепно имитируют этот эффект. Хотите добавить загадочности? Попробуйте «volumetric lighting» или «god rays» — лучи света, пробивающиеся сквозь дымку или листву. Выглядит впечатляюще. Также атмосферу задают цветовые акценты. Фразы вроде «color grading», «teal and orange» или «pastel colors» помогут стилизовать изображение под определённое настроение.
Фактура кожи: борьба с пластиком
Главный бич сгенерированных портретов — идеальная, словно отполированная кожа. В жизни так не бывает. Живой человек имеет поры, морщинки, родинки, веснушки. И чтобы вдохнуть жизнь в цифровой фантом, нужно намеренно добавить «несовершенства». Обязательно используйте связки «detailed skin texture», «visible pores», «skin imperfections». Можно добавить «freckles» (веснушки) или «moles» (родинки). Это сразу же повышает градус реализма. Нейросеть попытается сгладить картинку, но эти слова заставят её прорисовать микрорельеф кожи. Результат — лицо, к которому хочется прикоснуться.
Примеры готовых решений
Разговор о теории — это хорошо, но практика куда важнее. Давайте разберём несколько конкретных сценариев, которые можно брать за основу и модифицировать под свои нужды. Сами промты обычно пишутся на английском языке, так как он является родным для большинства моделей генерации.
Вариант для классического женского портрета. Здесь мы делаем упор на женственность и детализацию. Запрос может выглядеть так:
«Portrait of a beautiful Scandinavian woman with blue eyes and blonde messy hair, looking at camera, natural skin texture, freckles, soft cinematic lighting, shot on 85mm lens, f/1.8, bokeh background, ultra realistic, 8k, high detail».
Обратите внимание на структуру: сначала объект, потом детали внешности, затем свет и технические параметры камеры. Это работает безотказно.
Для мужского брутального портрета лексикон меняется. Здесь уместны более жёсткие тени и текстуры. Пример промта:
«Close-up portrait of an old fisherman with a gray beard, deep wrinkles, detailed skin, wearing a wool beanie, dramatic lighting, stormy sea background, dark atmosphere, sharp focus, Nikon D850, 50mm lens, gritty texture, hyperrealism».
Слово «gritty» добавляет зернистости и суровости, а «deep wrinkles» заставляет алгоритм прорабатывать каждую складку на лице.
Если же душа требует чего-то сказочного или фэнтезийного, можно отойти от фотореализма в сторону арта, но сохранить портретные черты. Попробуйте такой вариант:
«Ethereal portrait of an elf princess with glowing purple eyes, silver hair with flowers, intricate fantasy armor, magical forest background, fireflies, soft moonlight, volumetric fog, fantasy art style by Artgerm and Greg Rutkowski, highly detailed, digital painting».
Упоминание конкретных художников (Artgerm, Rutkowski) — это своего рода чит-код, направляющий стилистику в нужное русло.
Что насчёт стиля?
Иногда хочется не просто фото, а стилизацию под плёнку или определённую эпоху. Винтаж нынче в моде. Добавьте в промт «Polaroid style», «vintage 90s photo», «film grain» или «Kodak Portra 400». Картинка сразу станет «ламповой», появятся характерные шумы и цветопередача. Это отличный способ скрыть мелкие огрехи генерации, ведь плёночное зерно маскирует неестественную гладкость кожи.
Для любителей киберпанка и неона алгоритм действий иной. Ключевые слова здесь: «neon lighting», «cyberpunk city background», «wet asphalt», «reflections», «futuristic clothing». Свет в таких портретах играет решающую роль — он обычно цветной (синий, розовый, фиолетовый) и контурный. Пример:
«Cyberpunk girl with cybernetic implants, neon blue and pink hair, rainy night city street, neon signs reflecting in puddles, cinematic lighting, ray tracing, unreal engine 5 render, futuristic fashion».
Чего избегать?
Многие новички в попытке получить «всё и сразу» перегружают промт противоречивыми командами. Не стоит писать «sunny day» и «night atmosphere» в одной строке — нейросеть выдаст кашу. Также избегайте абстрактных понятий вроде «love», «hope» или «success». Алгоритм не знает, как выглядит надежда. Описывайте визуальные образы. А ещё не забывайте про Negative Prompt (негативный запрос). В специальное поле (если оно есть в интерфейсе) или через параметр «–no» стоит вписать то, чего вы видеть не хотите. Стандартный набор: «blurry, deformed, ugly, bad anatomy, extra fingers, mutated hands, cross-eyed, watermark, text». Это своего рода фильтр, отсекающий брак. Особенно это касается рук — они всё ещё остаются ахиллесовой пятой искусственного интеллекта.
Впрочем, даже самый выверенный промт не даёт стопроцентной гарантии с первой попытки. Нейросети — это генератор случайных чисел, упакованный в красивую обёртку. Иногда приходится генерировать десятки вариантов, меняя одно-два слова, чтобы поймать тот самый кадр. Это нормально. Процесс напоминает рыбалку: ты забрасываешь удочку (промт) и ждешь. Иногда клюёт мелочь, а иногда попадается настоящий трофей.
Нюансы композиции
Композиция кадра тоже задаётся словами. По умолчанию нейросеть центрирует лицо. Но это скучно. Используйте термины «rule of thirds» (правило третей), «looking away» (взгляд в сторону), «profile view» (вид в профиль) или «low angle shot» (съёмка снизу). Ракурс меняет восприятие персонажа. Съёмка снизу придает величие, сверху — уязвимость. А «close-up» (крупный план) позволяет рассмотреть детали глаз, в то время как «full body shot» (ростовой портрет) покажет одежду и окружение. Правда, с ростовыми портретами проблем больше — лицо становится менее детализированным из-за нехватки пикселей на него. Поэтому для качественного портрета лучше ограничиваться поясом («waist up») или плечами.
К слову, одежда и аксессуары — это отдельный кладезь для творчества. Не оставляйте модель в «стандартной футболке». Опишите фактуру ткани: «silk dress», «leather jacket», «knitted sweater». Добавьте детали: «pearl necklace», «glasses», «scarf». Это делает образ цельным. Нейросеть обожает сложные текстуры и охотно их прорисовывает. А наляпистость в одежде иногда даже играет на руку, скрывая возможные анатомические ошибки тела.
Финальные штрихи
Создание портрета в нейросети — это не магия, а технология. И как любая технология, она требует освоения. Не бойтесь экспериментировать со смешиванием стилей. Попробуйте соединить «Renaissance painting» и «Cyberpunk». Результат может быть непредсказуемым, но безумно интересным. Скрупулёзный подбор слов, понимание основ фотографии и капелька терпения — вот рецепт шедевра. И пусть первые попытки будут корявыми, опыт придёт. Главное — не останавливаться на стандартных настройках и постоянно искать новые сочетания. Удачной генерации, и пусть каждый ваш промт попадает точно в цель!