Вспомните то чувство, когда вы впервые увидели сгенерированное изображение, которое невозможно было отличить от реального снимка, сделанного профессионалом. Казалось бы, за этим стоит какая-то непостижимая магия или годы художественного образования, перенесённые в цифровой код. Но на самом деле всё упирается в умение говорить с машиной на её языке, и этот диалог порой напоминает общение с талантливым, но очень буквальным ребёнком. Обыватель часто думает, что достаточно ввести пару слов, чтобы получить шедевр, но, увы, результат чаще всего оказывается удручающим или комичным. Ведь нейросеть — это не телепат, а инструмент, требующий точных инструкций. Поэтому, чтобы не тратить генерации впустую и сразу получать добротный результат, стоит разобраться в анатомии правильного запроса.
Как устроена «мысль» нейросети?
Сложно ли понять логику алгоритма? И да, и нет. Главное — усвоить, что искусственный интеллект мыслит образами, разобранными на теги. Лезть в дебри программирования не нужно, но структуру запроса (промта) соблюдать придётся. Начинается всё, как правило, с главного объекта. Это может быть человек, животное или предмет, который вы хотите видеть в центре композиции. Но одного существительного машине мало. Ей нужны детали. Далее следует описание действия или состояния, ведь статичная картинка редко вызывает эмоции. А вот затем в игру вступает контекст — окружение, фон, время суток. Именно контекст превращает простого «кота» в «кота, сидящего на крыше под проливным дождём в киберпанк-городе».
И всё же, почему одни картинки выглядят как «мыло», а другие — как кадры из голливудского блокбастера? Секрет кроется в стилистических модификаторах. Это те самые слова, которые задают тон, освещение и качество. К слову, порядок слов тоже имеет значение: то, что стоит в начале, нейросеть считает наиболее важным. Ближе к концу запроса влияние слов ослабевает.
Техническая часть: камера и свет
Фотографы годами учатся работать со светом, а нейрохудожнику достаточно знать правильные термины. Свет — это вообще отдельная, огромная тема. Если вы напишете просто «lighting», результат будет случайным. А вот уточнения творят чудеса. Например, «cinematic lighting» (кинематографичное освещение) сразу добавит драмы и глубины. «Natural light» (естественный свет) подойдёт для портретов на улице, делая их мягкими и живыми. «Volumetric lighting» (объёмный свет) создаст те самые красивые лучи, пробивающиеся сквозь пыль или туман. Ну и, конечно же, «rembrandt lighting» — классическая схема освещения для мужских портретов с характерным треугольником света на щеке.
С камерой дело обстоит ещё интереснее. Вы можете «обмануть» систему, указав конкретную модель фотоаппарата или плёнки. Упоминание «Shot on Sony A7R IV» или «Canon EOS R5» даст нейросети сигнал о том, что картинка должна быть предельно чёткой, детализированной. А если хочется винтажной атмосферы, стоит добавить «Kodak Portra 400» или «Polaroid style». Это сразу добавит зернистости, специфическую цветопередачу и тот самый тёплый ламповый налёт. Не стоит забывать и про объективы. Указание «85mm lens» размоет фон (эффект боке) и сделает пропорции лица идеальными для портрета, тогда как «wide angle» или «fish eye» позволят захватить в кадр больше пространства, хоть и с искажениями.
Реализм против художественности
Гнаться ли всегда за фотореализмом? Вовсе нет. Но если ваша цель — создать изображение, которое заставит зрителя сомневаться в его искусственном происхождении, придётся использовать тяжёлую артиллерию тегов. В ход идут такие слова-маркеры, как «hyperrealistic», «photorealistic», «ultra-detailed», «8k resolution», «Unreal Engine 5». Эти модификаторы буквально заставляют нейросеть прорисовывать каждую пору на коже, каждую ворсинку на ткани. Это довольно тяжёлый для обработки запрос, но результат того стоит.
С другой стороны, иногда хочется чего-то более рисованного или стилизованного. Тут львиная доля успеха зависит от указания конкретных художников или направлений. «Oil painting» превратит фото в картину маслом, а «digital art» сделает его похожим на концепт-арт к видеоигре. Нюанс в том, чтобы не смешивать противоречивые стили. Сочетание «реалистичное фото» и «рисунок карандашом» в одном промте скорее всего приведёт к появлению странного гибрида, который будет выглядеть неестественно.
Готовые решения: Портретная съёмка
Перейдём от теории к практике. Допустим, нам нужен выразительный женский портрет. Задача не из лёгких. Ведь кожа, глаза и волосы — это то, где нейросети чаще всего ошибаются. Начать нужно с описания внешности, затем добавить свет и настройки камеры.
Вот пример добротного промта для реалистичного портрета:
«Close-up portrait of a young woman with freckles, ginger curly hair, green eyes, natural skin texture, looking at camera, soft sunset lighting, bokeh background, shot on 85mm lens, f/1.8, highly detailed, photorealistic, 8k.»
Разберём, что здесь работает. «Natural skin texture» — критически важный тег, чтобы кожа не выглядела пластиковой. Указание диафрагмы «f/1.8» и фокусного расстояния «85mm» отвечает за красивое размытие фона. А «sunset lighting» обеспечивает тёплый, приятный глазу тон.
Готовые решения: Архитектура и интерьер
А если объектом съёмки становится здание или комната? Здесь на первый план выходят геометрия и атмосфера. Важно указать стиль архитектуры и время суток.
Пример промта для современного интерьера:
«Modern living room interior, scandinavian style, beige and white color palette, big panoramic windows, sunlight streaming through curtains, cozy atmosphere, minimalist furniture, high resolution, architectural photography, magazine style.»
Фраза «magazine style» (журнальный стиль) здесь играет роль фильтра качества, подтягивая композицию до уровня глянцевых изданий. «Sunlight streaming…» добавляет жизни и воздуха, избавляя картинку от стерильности 3D-рендера.
Готовые решения: Предметная съёмка
Для бизнеса и рекламы часто нужны качественные изображения товаров. И здесь нейросети могут стать настоящим спасательным кругом. Главное — чистота фона и правильный свет.
Вот вариант для рекламы парфюма:
«Elegant glass perfume bottle on a dark marble podium, surrounded by water splashes, dramatic lighting, product photography, studio setup, sharp focus, reflection, 4k, luxury style.»
Тег «studio setup» (студийная установка) даёт команду имитировать профессиональный свет, исключая случайные тени. А «dark marble» создаёт дорогой, премиальный антураж.
Типичные ошибки новичков
Казалось бы, бери и копируй. Но даже с готовыми промтами можно получить «кашу». Самая распространённая ошибка — перегруз. Не стоит пытаться впихнуть в один запрос всё, что пришло в голову. Когда промт становится слишком длинным, нейросеть начинает игнорировать его части или смешивать их в непредсказуемых комбинациях. Лучше отказаться от лишних прилагательных, если они не несут смысловой нагрузки.
Ещё один подводный камень — использование абстрактных понятий. Слова вроде «любовь», «успех» или «счастье» машина понимает очень своеобразно. Лучше описывать конкретные визуальные проявления этих чувств: «улыбка», «объятия», «золотые монеты». Также новички часто забывают про негативные промты (negative prompt) — поле, куда вписывается то, чего на картинке быть НЕ должно. Туда стоит отправлять «deformed hands», «blur», «bad anatomy», «extra fingers». Это, кстати, существенно повышает качество итоговой картинки.
Впрочем, бывают ситуации, когда нейросеть упорно не хочет понимать запрос. Например, сложные позы или взаимодействие нескольких персонажей. Тут уж ничего не поделаешь, кроме как перебирать варианты, менять порядок слов или использовать режим img2img (генерация на основе картинки-референса). Махинации с весами слов (когда вы ставите коэффициенты важности, например, «(red hair:1.5)») тоже помогают, но это уже уровень для продвинутых пользователей.
Нужна ли постобработка?
Многие считают, что нейросеть выдаёт сразу готовый продукт. Однако это заблуждение. Даже самый удачный кадр часто требует доработки. Где-то нужно поправить цветокоррекцию, где-то убрать артефакт в фотошопе, а иногда — увеличить разрешение через апскейлер (upscaler). Сырая генерация — это как негатив в плёночной фотографии. Хорошая основа, но до шедевра её нужно довести руками. Тем более, что разрешение у большинства нейросетей по умолчанию не слишком высокое.
В заключение хочется сказать: промт-инжиниринг — это навык, который нарабатывается только практикой. Не бойтесь экспериментировать, смешивать стили и нарушать правила. Иногда самые безумные сочетания слов рождают те самые уникальные образы, которые невозможно придумать специально. Ваш идеальный кадр уже ждёт своего запроса, так что клавиатуру в руки — и удачи в творческих поисках!