Сколько раз, глядя на экран монитора, вы испытывали разочарование от того, что вместо фотореалистичного портрета нейросеть выдавала пластиковую куклу с пустым взглядом или, что ещё хуже, существо с семью пальцами на одной руке? Проблема «Зловещей долины» и отсутствия детализации знакома каждому, кто хоть раз пытался создать идеальное изображение человека с помощью искусственного интеллекта, будь то Midjourney или Stable Diffusion. Казалось бы, технологии шагнули далеко вперед, но получить живой, дышащий кадр по-прежнему довольно сложно. Ведь машина не понимает контекста, она лишь скрупулезно, но бездумно выполняет команды, собирая пиксели в усредненный образ. Однако этот хаос можно упорядочить, если подобрать правильные слова-ключи и выстроить логику запроса. А начать стоит с понимания того, как именно алгоритм «видит» наш запрос.
С чего начинается построение?
С фундамента, разумеется. Любой запрос должен иметь чёткую структуру, иначе нейросеть начнет импровизировать там, где это совершенно не нужно. Главный секрет кроется в последовательности: сначала мы обозначаем субъект, затем — действие, окружение и, наконец, технические детали. Не стоит писать просто «красивая женщина». Это слишком размыто. Для машины понятие красоты субъективно (насколько это вообще применимо к алгоритму), и она выдаст вам самый популярный в её базе данных шаблон. Гораздо эффективнее задать конкретные параметры: возраст, этническую принадлежность, цвет волос и даже настроение. К слову, именно прилагательные играют здесь первую скрипку. Сравните два запроса: «девушка в парке» и «усталая 25-летняя ирландка с веснушками, сидящая на скамейке в осеннем парке». Разница будет колоссальной. Во втором случае вы даете машине «крючки», за которые она цепляется, создавая уникальный образ.
Детализация кожи
Самый большой бич сгенерированных портретов — это неестественная, фарфоровая гладкость кожи. ИИ тяготеет к идеализации, убирая любые изъяны, которые, по сути, и делают человека живым. Чтобы побороть этот глянцевый эффект, придется использовать тяжёлую артиллерию из текстурных уточнений. В промт обязательно стоит включить такие слова, как detailed skin texture, pores, skin imperfections, moles (родинки). Это своего рода сигнал для системы: «Не блюрь, оставь как есть». Довольно часто помогает добавление технических терминов вроде subsurface scattering (подповерхностное рассеивание) — этот параметр отвечает за то, как свет проходит сквозь кожу, придавая ей тот самый мягкий, естественный красноватый оттенок на просвет. Игнорировать этот нюанс не стоит, если ваша цель — фотореализм, а не 3D-модель для видеоигры десятилетней давности.
Свет и тени
Играет ли освещение ключевую роль? Безусловно, ведь именно свет лепит форму и задает настроение всему кадру. Обыватель часто забывает про этот аспект, довольствуясь дефолтными настройками, а зря. Плоский свет убивает объём, превращая лицо в блин. Чтобы добавить драматизма, можно использовать Rembrandt lighting (свет Рембрандта) — классическую схему с затемнённой половиной лица и характерным треугольником света под глазом. Если же хочется чего-то более современного и кинематографичного, на помощь придет cinematic lighting или volumetric lighting (объёмный свет), который добавит в воздух пылинки и лучи. Для мягких, нежных портретов лучше отказаться от жестких теней и запросить softbox lighting или natural window light. Тем более, что естественное освещение, особенно в «золотой час» (golden hour), творит чудеса с тоном кожи, делая его тёплым и приятным глазу.
Настройки камеры
Здесь мы вступаем на территорию профессиональной фотографии, но пугаться не стоит. Нейросети отлично понимают язык объективов и диафрагм. Указание фокусного расстояния — это, пожалуй, самый простой способ кардинально изменить восприятие снимка. Для портретов золотым стандартом считается 85mm (85mm lens). Такое фокусное расстояние немного «сжимает» перспективу, делая черты лица более пропорциональными и красивыми. А вот если вы напишете 35mm или даже wide angle, лицо может слегка вытянуться, зато в кадр попадет больше окружения. Отдельно стоит упомянуть диафрагму. Хотите размытый фон, то самое красивое боке? Смело вписывайте f/1.8 или f/2.8. Это отделит модель от фона, акцентируя внимание на глазах. А глаза, как известно, — зеркало души, даже если эта душа цифровая. Дополнить технический блок можно указанием на тип пленки, например, Kodak Portra 400, что добавит снимку характерную зернистость и тёплые, ламповые цвета.
Одежда и стиль: Нюансы
Нейросеть довольно часто путается в сложной одежде, превращая пуговицы и узоры в невнятную кашу. Поэтому описание гардероба должно быть предельно конкретным, но не перегруженным. Вместо абстрактного «красивое платье» лучше написать intricate silk dress with floral embroidery (сложное шёлковое платье с цветочной вышивкой). Упоминание материалов — denim, leather, wool, cotton — помогает генератору правильно отрисовать фактуру, чтобы кожаная куртка блестела, а шерстяной свитер выглядел мягким и ворсистым. К тому же, стиль одежды — это отличный маркер времени. Стоит добавить vintage 1920s fashion, и вот уже перед нами не современница, а дама из эпохи джаза. Но тут есть подводные камни: если переборщить с деталями костюма, нейросеть может «забыть» про лицо. Баланс здесь важен как никогда.
Взгляд и эмоции
Стеклянные глаза — ещё одна частая проблема. Чтобы вдохнуть жизнь во взгляд, недостаточно просто написать eyes. Нужно уточнить: expressive eyes, piercing gaze (пронзительный взгляд) или looking directly at camera. Эмоция тоже играет огромную роль. Mysterious smile (загадочная улыбка) создаст совсем иное настроение, нежели laughing или angry. Интересно, что нейросети лучше справляются с яркими, гипертрофированными эмоциями, а вот тонкие полуулыбки им даются сложнее. Однако именно эти микровыражения делают портрет по-настоящему человечным. Можно попробовать добавить caught in the moment (пойманный момент), чтобы избежать статичности позирования, словно модель замерла в ожидании вспышки. Живая фотография всегда предполагает лёгкую небрежность, случайность кадра.
Художественные стили
Реализм — это прекрасно, но иногда душа просит творчества. И здесь поле для экспериментов поистине безгранично. Можно облачить своего персонажа в стилистику киберпанка (cyberpunk style), добавив неоновые огни, хромированные детали и футуристичные импланты. Совсем иная атмосфера возникнет при использовании oil painting (масляная живопись) или watercolor sketch (акварельный набросок). Для любителей мрачной эстетики подойдет gothic style или noir, где игра теней и контрастов выходит на первый план. А если хочется чего-то эпичного, в духе фэнтези, стоит использовать слова fantasy concept art, intricate armor, magical glow. Каждый стиль тянет за собой определенную цветовую палитру и композиционные решения, поэтому, выбирая, например, steampunk, будьте готовы к обилию меди, шестерёнок и коричневых тонов.
Негативный промт
Это ваш спасательный круг, фильтр, отсеивающий всё ненужное. В это поле (или в конец основного промта с параметром --no в Midjourney) мы вписываем то, чего видеть категорически не хотим. Стандартный набор, который должен быть под рукой у каждого: ugly, deformed, disfigured, bad anatomy, extra limbs, extra fingers, mutation, blurry, low quality, watermark, text. Без этого «оберега» шанс получить мутанта возрастает в разы. Особенно это касается рук. Нейросети до сих пор с трудом понимают концепцию пяти пальцев, поэтому bad hands и missing fingers — обязательные гости в негативном промте. Также не лишним будет добавить cartoon, 3d render, если вы добиваетесь именно фотореализма, чтобы случайно не получить персонажа из мультфильма Pixar.
Примеры готовых запросов
Теория — это хорошо, но практика куда нагляднее. Давайте разберем несколько сценариев, которые можно брать за основу и модифицировать под свои нужды.
Начнем с классического фотореалистичного женского портрета. Задача — получить максимально живое лицо.
Hyper-realistic portrait of a 28 year old French woman, natural freckles, blue eyes looking at camera, messy bun hair, soft morning light coming from window, detailed skin pores, peach fuzz, shot on Sony A7R IV 85mm f/1.8, cinematic depth of field, neutral colors.
Здесь мы собрали все важные элементы: конкретный возраст и национальность, детали кожи (пушок, поры), точное указание света и камеры. Результат порадует высокой детализацией.
А что, если нужен брутальный мужской образ? Попробуем такой вариант:
Close-up portrait of an elderly fisherman with a white beard, deep wrinkles, weathered skin, wearing a yellow raincoat, stormy ocean background, dramatic volumetric lighting, rain drops on face, dark moody atmosphere, raw photo, high contrast, 8k resolution.
В этом случае акцент сделан на фактуре (weathered skin — обветренная кожа) и атмосфере шторма. Драматичный свет и капли дождя добавят снимку истории и глубины.
Для любителей фэшн-фотографии подойдет следующий сценарий.
Full body shot of a fashion model walking on a runway, wearing avant-garde futuristic silver outfit, transparent plastic boots, neon lights background, cyberpunk vibe, dynamic pose, low angle shot, motion blur, sharp focus on face, Vogue magazine style, professional photography.
Тут мы используем full body shot, чтобы показать одежду целиком, и добавляем dynamic pose с motion blur, чтобы передать движение подиума. Low angle (нижний ракурс) визуально удлинит ноги и добавит модели величественности.
Ну и, наконец, вариант для художественной стилизации.
Portrait of a warrior princess, intricate golden armor, glowing magical runes, fantasy ruins background, digital art style, by Greg Rutkowski and Alphonse Mucha, ethereal lighting, sharp details, concept art, masterpiece.
Упоминание конкретных художников (by…) — мощный инструмент. Альфонс Муха добавит декоративности и плавных линий, а Грег Рутковски известен своими эпичными фэнтези-артами. Смесь этих стилей даст уникальный, добротный результат.
Секреты композиции
Мало просто описать человека, нужно ещё и правильно расположить его в кадре. Слова close-up (крупный план) обрежут изображение по плечи или даже ближе, акцентируя внимание на лице. Medium shot (средний план) покажет героя по пояс, что идеально для демонстрации одежды и взаимодействия с предметами. Если же нужно показать фигуру целиком и вписать её в окружение, используйте full body или wide shot. Есть и более специфические запросы, например, from behind (вид сзади) или profile view (профиль). Экспериментируя с ракурсами, можно добиться гораздо более интересного повествования, чем при стандартном взгляде «в лоб». Не стоит забывать и про rule of thirds (правило третей) — нейросеть вполне способна понять этот композиционный прием и сместить объект от центра для большей динамики.
Ошибки новичка
Чего не стоит делать, так это перегружать промт противоречивыми командами. Если вы напишете одновременно sunny day и night atmosphere, машина сойдет с ума и выдаст нечто среднее и невнятное. Также нет смысла писать огромные полотна текста с литературными оборотами вроде «она думала о смысле жизни, глядя в бесконечную даль». ИИ не понимает абстракций. Переводите мысли в визуальные образы: «задумчивый взгляд», «горизонт», «сумерки». Краткость — не всегда сестра таланта в промпт-инжиниринге, но переспам словами — это верный путь к артефактам и галлюцинациям нейросети. Лучше меньше, но точнее.
Всё приходит с опытом
Генерация изображений — это процесс не сложный, но кропотливый, требующий усидчивости и готовности к перебору вариантов. С первого раза шедевр получается редко, и это нормально. Меняйте одно слово за раз, следите, как меняется результат, и сохраняйте удачные комбинации. Ведь каждый промт — это своего рода заклинание, и только от вас зависит, насколько сильной будет магия. Не бойтесь копировать чужие удачные находки и смешивать их со своими идеями. В конечном итоге, именно ваш уникальный взгляд и вкус превратят набор бездушных пикселей в настоящее цифровое искусство, которое не стыдно показать миру. Удачи в творческих поисках, и пусть ваши генерации всегда будут чёткими, а пальцев на руках — ровно пять!