В сети представлено множество галерей с невероятными, захватывающими дух изображениями, созданными искусственным интеллектом, но попытка повторить этот успех у новичка довольно часто заканчивается фиаско: то у модели шесть пальцев, то взгляд «стеклянный», то освещение напоминает дешёвый сериал из девяностых. Глядя на чужие шедевры, обыватель порой думает, что дело в удаче или какой-то платной подписке, хотя на самом деле весь секрет кроется в умении правильно формулировать мысли. Проблема ведь не в том, что нейросеть не умеет рисовать, а в том, что она слишком буквально воспринимает наши хаотичные команды. И если вы хотите получать стабильный, добротный результат, а не случайный набор пикселей, придётся освоить искусство написания промтов. Но чтобы не ошибиться и не тратить часы на генерацию мусора, начать стоит с понимания базовой структуры запроса.
Как составить запрос?
Формула идеального изображения вовсе не является тайной за семью печатями. Она довольно проста, но требует скрупулёзного подхода. В основе любого качественного промта лежит чёткая иерархия: сначала мы называем главный объект, затем описываем действие, окружающую обстановку, и только потом накидываем технические детали и стилистику. Многие игнорируют этот порядок, сваливая все слова в кучу. Это ошибка. Ведь нейросеть считывает информацию линейно: то, что стоит в начале, имеет для неё наибольший вес. Представьте, что вы режиссёр на съёмочной площадке. Если вы сначала начнёте кричать про освещение, а только потом скажете актёру выйти на сцену, возникнет путаница. Поэтому логика построения фразы — это фундамент. Сначала «Кто», потом «Где», и лишь в конце «Как снято».
Важна ли конкретика?
Безусловно. Слова «красивая девушка» для алгоритма — пустой звук, абстракция, которую он заполнит среднестатистическими шаблонами из своей базы данных. А вот «молодая женщина с веснушками, изумрудными глазами и растрёпанными рыжими волосами» — это уже конкретная задача. И здесь кроется важный нюанс. Не скупитесь на эпитеты. Вместо сухого «лес» лучше написать «туманный, густой хвойный лес на рассвете». Детализация творит чудеса. Она словно якорь удерживает фантазию машины в нужном русле. К слову, использование английского языка по-прежнему даёт более предсказуемые результаты в большинстве популярных нейросетей (Midjourney, Stable Diffusion), так как их обучали преимущественно на англоязычном контенте. Однако и на русском современные модели понимают нас довольно неплохо, если формулировать мысли ясно.
Портретная съёмка
Самый востребованный жанр — это, конечно же, портреты. Здесь львиная доля успеха зависит от описания света и текстуры кожи. Чтобы получить фотореалистичное лицо, а не пластиковую маску, стоит использовать такие маркеры, как «highly detailed skin», «skin texture» или «pores». Давайте разберём конкретный пример построения запроса для создания выразительного мужского портрета. Мы можем начать с основы: «Portrait of an old fisherman with a deeply wrinkled face, wearing a yellow raincoat» (Портрет старого рыбака с глубокими морщинами на лице, одетого в жёлтый дождевик). Но этого мало. Добавляем атмосферу и свет: «stormy weather background, cinematic lighting, dark moody atmosphere» (штормовая погода на фоне, кинематографичное освещение, мрачная атмосфера). И, наконец, техническая “приправа”, которая заставит картинку выглядеть как фото: «shot on Sony A7R IV, 85mm lens, f/1.8, hyperrealistic, 8k». Результат гарантированно будет внушительным.
А что насчёт женских образов? Здесь часто тяготеют к мягкому свету и эстетике глянца. Попробуйте такую комбинацию: «Close-up portrait of a futuristic cyborg woman, translucent skin with glowing circuits underneath, soft neon lighting, pink and blue color palette» (Крупный план женщины-киборга, полупрозрачная кожа со светящимися микросхемами под ней, мягкое неоновое освещение, розово-голубая палитра). Чтобы добавить реализма, в конце дописываем: «unreal engine 5 render, ray tracing, sharp focus». Такая связка слов обеспечивает невероятную глубину и объём. Кстати, упоминание конкретных движков рендеринга (Octane Render, Unreal Engine) часто работает лучше, чем просто слово «realistic».
Пейзажи и архитектура
Снимать природу или здания в виртуальном пространстве — одно удовольствие. Здесь нет капризной погоды, а солнце всегда светит под нужным углом. Главное — задать настроение. Допустим, мы хотим получить уютный домик в лесу. Банальный запрос выдаст скучную картинку. А если мы напишем: «Cozy wooden cabin in a snowy forest, warm light coming from windows, smoke from the chimney, twilight, mysterious atmosphere» (Уютная деревянная хижина в заснеженном лесу, тёплый свет из окон, дым из трубы, сумерки, таинственная атмосфера)? Картинка сразу оживает. Дополняем техническими параметрами для широкого угла: «wide angle lens, 16mm, architectural photography, hyper-detailed».
Любителям городской эстетики и киберпанка стоит взять на вооружение промты с акцентом на отражения и ночной свет. Пример готового решения: «Futuristic cyberpunk city street at night, rain, neon signs reflecting in puddles, towering skyscrapers, flying cars, crowd of people, busy atmosphere» (Футуристическая улица киберпанк-города ночью, дождь, неоновые вывески отражаются в лужах, возвышающиеся небоскрёбы, летающие машины, толпа людей, атмосфера суеты). Для усиления эффекта присутствия добавляем: «volumetric fog, cinematic composition, photorealistic». Это довольно мощная связка, создающая глубокую, насыщенную сцену.
Стилизация изображений
Иногда нам не нужен фотореализм. Душа просит чего-то рисованного, мультяшного или стилизованного под живопись. Нейросети — настоящий кладезь художественных стилей. Чтобы превратить ваше фото в рисунок, достаточно добавить имя известного художника или название направления. Например, запрос «Cat sitting on a windowsill» (Кот, сидящий на подоконнике) можно преобразить до неузнаваемости, добавив «in the style of Vincent van Gogh, oil painting, thick brushstrokes» (в стиле Винсента Ван Гога, масляная живопись, густые мазки). Текстура моментально изменится.
Для любителей аниме существуют свои ключевые слова-триггеры. Попробуйте такой промт: «Anime girl fighting a dragon, dynamic pose, magic effects, Studio Ghibli style, detailed background, vivid colors» (Аниме-девушка сражается с драконом, динамичная поза, магические эффекты, стиль студии Ghibli, детализированный фон, яркие цвета). Упоминание конкретной студии (Ghibli, Pixar, Disney) работает безотказно, задавая узнаваемую палитру и пластику персонажей. А если хочется мрачной готики, подойдёт «dark fantasy style, intricate details, ink drawing» (стиль тёмного фэнтези, сложные детали, чернильный рисунок). Вариативность здесь ограничена лишь вашей насмотренностью.
Технические параметры
Многие новички упускают из виду тот факт, что нейросеть знает терминологию профессиональных фотографов. И это знание стоит использовать. Указание конкретной модели камеры или объектива кардинально меняет восприятие кадра. Фраза «shot on GoPro» даст вам характерное искажение «рыбий глаз» и эффект присутствия в центре событий. А пометка «telephoto lens» или «200mm» сожмёт перспективу и размоет фон, выделив объект. Это же правило касается и плёнки. Хотите ретро? Добавьте «Kodak Portra 400» или «vintage Polaroid aesthetic». Зернистость и цветопередача тут же перестроятся под старую школу.
Светом управлять сложнее всего. Но есть проверенные термины. «Golden hour» (золотой час) обеспечит тёплый, мягкий закатный свет, идеальный для романтических сцен. «Blue hour» (синий час) создаст холодную, предрассветную тоску. Для студийных портретов отлично подходит «Rembrandt lighting» (рембрандтовский свет) — это классическая схема с выразительными тенями на лице. А если нужно что-то дерзкое и современное, смело пишите «harsh sunlight» (жёсткий солнечный свет) для чётких, контрастных теней. Эксперименты с этими параметрами порой дают результаты, превосходящие ожидания.
Ошибки новичков
Самая распространённая ошибка — это чрезмерная перегруженность запроса противоречивыми командами. Не стоит пытаться впихнуть в один промт «солнечный день» и «мрачную ночь» одновременно (если только это не сюрреализм), или требовать от сети «фотореалистичный рисунок карандашом». Машина просто «сойдёт с ума» и выдаст усреднённую кашу. Также лучше отказаться от отрицаний типа «no hands» или «no blur». Нейросети плохо понимают частицу «не». Увидев слово «hands», она, скорее всего, наоборот, добавит лишних рук. Для исключения объектов существуют специальные параметры негативного промта (negative prompt), куда и следует вписывать всё то, чего вы не хотите видеть.
Ещё один подводный камень — это использование слишком общих слов типа «amazing», «cool», «fantastic». Для ИИ это субъективная оценка, не несущая визуальной информации. Что «круто» для вас, может быть совсем не круто для алгоритма. Заменяйте эмоции на факты: вместо «страшный лес» пишите «лес с корявыми деревьями, туманом и паутиной». Конкретика всегда побеждает абстракцию. Ну и, конечно же, не забывайте про пропорции (aspect ratio). Если вы не укажете соотношение сторон, по умолчанию получите квадрат, что не всегда подходит для пейзажей или портретов.
Стоит ли использовать генераторы промтов?
В интернете сейчас полно сервисов, которые обещают составить промт за вас. Натыкаешься на них буквально на каждом шагу. Полезны ли они? С одной стороны, для новичка это неплохой спасательный круг. Они помогают структурировать запрос и подсказывают забытые термины. Но с другой стороны, полагаясь только на автоматику, вы рискуете так и не понять механику процесса. Лучшие промт-инженеры (да, такая профессия уже существует) пишут свои запросы вручную, чувствуя каждый нюанс слова. Генератор может накидать вам кучу красивых слов, но он не знает вашего замысла, вашей идеи, вашей «изюминки».
Тем более что ручное составление промта — это творческий процесс, похожий на написание стихов или заклинаний. Вы перебираете слова, меняете их местами, ищете тот самый синоним, который «выстрелит». Например, замена слова «big» (большой) на «colossal» (колоссальный) или «gigantic» (гигантский) может полностью изменить масштаб сцены. А использование «shimmering» (мерцающий) вместо «shiny» (блестящий) добавит динамики и жизни. Эти тонкости познаются только на практике.
Сложно ли этому научиться?
На первый взгляд кажется, что нужно выучить словарь английского языка и сдать экзамен по операторскому мастерству. Но на самом деле всё приходит с опытом. Достаточно начать с простых конструкций и постепенно наслаивать на них новые детали. Не бойтесь копировать чужие промты и видоизменять их. Это лучший способ обучения. Возьмите готовый запрос, который дал классный результат, и замените в нём «киберпанк» на «стимпанк», а «девушку» на «робота». Посмотрите, как изменится картинка. Анализируйте.
Помните, что нейросеть — это не волшебная палочка, которая читает мысли, а скорее очень талантливый, но немного аутичный художник, которому нужно предельно точно объяснить задачу. И чем богаче ваш словарный запас, чем точнее ваши ассоциации, тем ближе будет результат к тому, что вы нарисовали у себя в голове. Это увлекательный путь проб и ошибок, который со временем превращается в настоящее искусство. Ваши промты станут вашим уникальным стилем, вашим почерком в цифровом мире.
Создавайте, экспериментируйте с жанрами, смешивайте несовместимое и не бойтесь неудачных генераций — ведь именно за ними часто скрывается тот самый уникальный шедевр, который заставит зрителя замереть от восторга.