Создание идеального изображения в нейросети порой напоминает лотерею, где вместо ожидаемого шедевра на экране появляется существо с лишними пальцами или стеклянным взглядом, устремленным в никуда. Знакомая ситуация? Безусловно, ведь каждый, кто пытался получить от искусственного интеллекта фотореалистичный портрет, сталкивался с тем, что машина воспринимает наши слова совсем не так, как мы их себе представляем в голове. Дело тут не в отсутствии таланта у «цифрового художника», а в неумении человека подобрать правильный ключ к алгоритмам. Однако, стоит лишь разобраться в логике построения запроса, как хаос превращается в упорядоченную структуру, а результаты начинают поражать воображение своей глубиной и детализацией.
С чего начинается магия?
Ошибочно полагать, что чем длиннее запрос, тем лучше результат. На самом деле, нейросеть тяготеет к конкретике, но в определенном порядке. Сначала машине нужно объяснить, кто является главным героем. И тут в игру вступает первое правило: детализация персонажа. Просто написать «красивая девушка» — значит отдать всё на откуп случаю. А вот «молодая девушка с веснушками, зелёными глазами и растрёпанными рыжими волосами» — это уже добротный фундамент. Нужно отметить, что порядок слов имеет колоссальное значение. То, что стоит в начале, алгоритм считает самым важным. Поэтому описание внешности всегда идёт первым, а уже потом — одежда, фон и стилистика. К слову, возраст персонажа лучше указывать конкретной цифрой (например, «25 years old»), так как понятие «молодой» у ИИ может варьироваться от подростка до человека средних лет.
Свет и его значение
Ни один профессиональный фотограф не начнет съемку без выставления света. И в генерации изображений это правило работает железно. Свет — это тот самый инструмент, который задает настроение и объем. Если оставить этот пункт без внимания, картинка получится плоской и скучной. Самый популярный вариант, который творит чудеса, — это «cinematic lighting» (кинематографичное освещение). Он добавляет драматизма и глубины. Для более мягких портретов отлично подходит «golden hour» (золотой час) — время перед закатом, когда свет становится тёплым и обволакивающим. А вот если хочется чего-то таинственного, стоит попробовать «volumetric lighting» (объемный свет), который создает красивые лучи, пробивающиеся сквозь туман или пыль. Ну и, наконец, для студийных портретов идеально работает связка «studio lighting» и «rim light» (контровой свет), который подсвечивает контур волос и отделяет модель от фона.
Настройки камеры
Казалось бы, зачем указывать параметры объектива, если камеры не существует? Дело в том, что нейросети обучались на миллионах реальных фотографий, и они прекрасно «понимают», как фокусное расстояние влияет на геометрию лица. Широкий угол (например, 16mm или 24mm) часто искажает пропорции, делая нос большим, а лицо — неестественно вытянутым. Этого стоит избегать, если вы не добиваетесь комического эффекта. Для классического портрета золотым стандартом считается 85mm или 100mm. Эти значения делают лицо пропорциональным и красивым. Также не стоит забывать про диафрагму. Указание «f/1.8» или «f/2.8» даст тот самый красивый эффект боке (размытый фон), который так ценится в портретной фотографии. А слово «bokeh» само по себе усилит этот эффект. И всё же, если хочется максимальной резкости по всему кадру, лучше использовать значение «f/8» или «f/11».
Примеры фотореалистичных запросов
Теория — это хорошо, но как это выглядит на практике? Допустим, нам нужен портрет пожилого мужчины, чьё лицо отражает мудрость прожитых лет. Начать стоит с субъекта:
Portrait of an elderly fisherman with a weathered face and a thick gray beard. wearing a yellow raincoat, stormy sea in the background, rain drops on face. dramatic lighting, gloomy atmosphere, shot on 35mm lens, highly detailed skin texture, 8k, photorealistic
Такой запрос, собранный по кирпичикам, даст внушительный результат.
А вот другой пример — нежный женский портрет. Здесь каждое слово работает на создание конкретного образа, и шансы на ошибку минимальны. Результат наверняка порадует глаз и не потребует десятков перегенераций:
Close-up portrait of a gorgeous woman with blue eyes, soft smile, wind blowing through hair, standing in a field of lavender. sunset lighting, warm colors, dreamy atmosphere, soft focus. 85mm lens, f/1.8, depth of field, hyperrealistic
Стилизация и художественные приёмы
Фотореализм — не единственный путь. Иногда хочется получить портрет в стиле определенного художника или эпохи. И здесь открывается настоящий кладезь возможностей. Достаточно добавить имя известного мастера, как стиль картинки меняется кардинально. Например, «in the style of Alphonse Mucha» добавит изображению изысканные линии, цветочные орнаменты и налет модерна. А если упомянуть «Greg Rutkowski», то портрет приобретет черты цифровой живописи с проработанным светом и эпичностью, свойственной фэнтези-арту. Любителям киберпанка стоит использовать маркеры «neon lights», «cybernetic implants», «futuristic city background». Для тех же, кто грезит классикой, подойдут «oil painting», «heavy brushstrokes» (крупные мазки) или «Renaissance style». Важно помнить, что смешивание стилей тоже допустимо, но делать это нужно осторожно, чтобы не получить визуальную кашу.
Сложно ли создать шедевр?
Вовсе нет. Главное — понимать, как слова влияют на веса внутри нейросети. Например, слово «masterpiece» (шедевр) часто улучшает общее качество картинки, добавляя детализацию там, где её не хватало. А вот «trending on ArtStation» подтягивает стилистику под современные стандарты цифрового искусства. Тем более, что сообщество постоянно находит новые токены, улучшающие генерацию. Одним из таких является «Unreal Engine 5 render» — даже если вы не делаете 3D-модель, эта фраза заставляет ИИ использовать текстуры и освещение высочайшего качества. Да и самим экспериментаторам процесс поиска «того самого» слова доставляет немало удовольствия.
Подводные камни генерации
Однако на пути к идеалу часто всплывают ошибки. Самая распространённая — перегруженность промта. Обыватель часто думает, что если напихать в запрос все известные красивые слова, то получится конфетка. На самом деле, нейросеть может «запутаться» в противоречивых указаниях. Нельзя одновременно требовать «minimalism» и «intricate details» (сложные детали) — результат будет непредсказуемым и, скорее всего, посредственным. Также стоит избегать слишком абстрактных понятий типа «счастье» или «любовь» без визуальной привязки. Машине нужно объяснить, как именно выглядит это счастье: «smiling», «laughing», «bright eyes». Ну и, конечно же, не стоит забывать про негативные промты.
Что исключить?
Негативный промт (параметр –no в Midjourney или отдельное поле в Stable Diffusion) — это спасательный круг для любого генератора. Сюда мы вписываем всё то, чего видеть на картинке категорически не хотим. Первым делом туда отправляются «ugly», «deformed», «extra fingers», «missing limbs». Это база. Далее следует убрать «blur», «grainy», «low quality», если мы стремимся к чёткости. Иногда полезно исключить «text», «watermark» и «signature», так как ИИ часто пытается имитировать подписи художников или водяные знаки фотостоков, что изрядно портит композицию. К слову, для портретов полезно добавить в минус-слова «bad anatomy» и «cross-eyed», чтобы избежать проблем с глазами, которые всё ещё являются слабым местом многих моделей.
Эмоции и взгляд
Портрет мёртв без эмоции. Статичное лицо куклы — это то, чего мы стараемся избежать. Поэтому отдельное внимание стоит уделить описанию взгляда. Фразы «looking at camera», «piercing gaze» (пронзительный взгляд) или «looking away» (смотрит в сторону) кардинально меняют восприятие работы. Эмоции тоже нужно прописывать чётко: «smirk» (ухмылка), «frown» (хмурый взгляд), «tears in eyes» (слёзы в глазах). Нюанс в том, что эмоция влияет на всё лицо, меняя положение бровей, губ и даже морщин. Это придаёт живость. Ведь именно микровыражения делают лицо человеческим, а не пластиковым.
Фэнтезийные примеры
Если реальность наскучила, можно окунуться в мир магии. Промт для эльфийской принцессы может выглядеть так:
Portrait of an ethereal elven princess with silver long hair and violet eyes. wearing intricate silver armor with glowing runes, crown of crystals. mystical forest background, fireflies, moonlight. fantasy art, digital painting, sharp focus, magical atmosphere, by Ilya Kuvshinov
Здесь важно подчеркнуть текстуры материалов — металла, ткани, кожи, чтобы они не выглядели как единая масса.
А вот пример для сурового воина-орка:
Close-up of a fierce orc warrior with green skin, scars on face, protruding tusks. wearing fur and leather armor, dirty texture. dark fantasy, cinematic lighting, gritty realism, high contrast, detailed texture
Слова «gritty» (зернистый/грубый) и «dirty» (грязный) здесь играют ключевую роль, добавляя персонажу суровости и реализма, уводя картинку от «мультяшности».
Композиция кадра
Ракурс решает всё. Не всегда стоит ограничиваться простым «portrait». Попробуйте «low angle shot» (вид снизу), чтобы придать персонажу величественности и доминирования. Или «high angle shot» (вид сверху), чтобы сделать его более уязвимым или милым. «Profile view» (вид в профиль) отлично подходит для демонстрации силуэта. А «Dutch angle» (голландский угол, заваленный горизонт) добавит динамики и тревожности. Главное достояние экспериментатора — это смелость пробовать нестандартные ракурсы, которые могут превратить обычный портрет в повествовательную историю.
Одежда и стиль
Не стоит скупиться на описание одежды. Просто «платье» — это слишком скучно. А вот «silk red dress with lace details» (шёлковое красное платье с кружевными деталями) — это уже фактура. Нейросети отлично понимают названия тканей: «denim», «leather», «velvet», «linen». Упоминание материала помогает ИИ правильно выстроить отражения света. Кожа блестит, бархат поглощает свет, а шёлк струится. Эти мелочи и создают тот самый эффект присутствия, за которым мы гонимся.
Технические параметры для продвинутых
Если вы используете Midjourney, то параметры — это ваша волшебная палочка. «–ar 2:3» или «–ar 9:16» задают вертикальный формат, идеальный для портретов на телефон. Параметр «–stylize» (или –s) отвечает за то, насколько вольно нейросеть будет интерпретировать ваш запрос. Низкие значения (например, –s 50) заставят её строго следовать тексту, а высокие (–s 750 или 1000) дадут ей творческую свободу, что порой приводит к неожиданным и грандиозным результатам. А параметр «–chaos» (от 0 до 100) определяет вариативность результатов: чем выше число, тем сильнее будут отличаться друг от друга четыре предложенных варианта.
Цветовая палитра
Цвет — это мощный инструмент воздействия на зрителя. Можно задать общую гамму: «pastel colors» (пастельные тона) для нежности, «vibrant colors» (яркие цвета) для энергии или «black and white photography» для нуара. Очень интересно работают сочетания контрастных цветов, например, «teal and orange» — классическая кинематографическая схема, которая делает картинку приятной глазу и современной. Также можно использовать названия конкретных плёнок, например, «Kodak Portra 400», что придаст изображению характерную зернистость и цветопередачу, любимую многими фотографами.
Вдохновение и практика
Где брать идеи? Лучший способ — смотреть работы других. Сайты вроде Lexica или библиотеки промтов — это отличный старт. Но слепое копирование редко даёт удовлетворение. Настоящий азарт просыпается тогда, когда вы начинаете смешивать несмешиваемое. Киберпанк-бабушка? Легко. Рыцарь в деловом костюме? Почему бы и нет. Искусственный интеллект — это лишь инструмент, кисть в ваших руках. И только от вашего воображения зависит, станет ли результат очередным проходным изображением или настоящим произведением цифрового искусства.
Пусть каждая генерация открывает для вас новые горизонты, а финальный результат всегда превосходит самые смелые ожидания. Творите, экспериментируйте и не бойтесь ошибок — именно они часто приводят к самым интересным открытиям.