Казалось бы, что может быть проще: открыл диалоговое окно, вбил пару слов вроде «красивый кот на закате» и получил шедевр? В представлении многих обывателей именно так и работает генеративный искусственный интеллект, однако реальность довольно быстро спускает мечтателей на землю. Вместо эпичного полотна на экране часто появляется нечто с лишними конечностями, смазанными лицами или вовсе галлюциногенный хаос, далёкий от первоначальной задумки. Это же касается и стиля: без чётких указаний нейросеть выдает усреднённый цифровой арт, лишённый индивидуальности. Но чтобы превратить бездушный алгоритм в послушный инструмент художника, стоит освоить особый язык — язык промтов.
Что такое промт и как он работает?
Технически, промт — это текстовое описание, которое модель преобразует в визуальный образ, но на деле это скорее заклинание, где важен не только смысл слов, но и их порядок. Сложнее всего здесь то, что ИИ не понимает контекста так, как человек. Он видит набор токенов. Если вы напишете «девушка с цветами», машина может нарисовать девушку, держащую букет, девушку, лежащую на клумбе, или вообще портрет, состоящий из лепестков. Вариативность огромная. Поэтому опытные промпт-инженеры (да, такая профессия уже существует) выстраивают запросы по строгой иерархии. На первом месте всегда стоит основной объект. Именно ему нейросеть уделяет львиную долю внимания. А уже затем следуют детали окружения, стиль, освещение и технические параметры.
С чего начинается создание запроса?
С определения жанра и техники исполнения. Нейросеть всеядна: она может сымитировать мазок маслом, акварельные разводы, карандашный набросок или гиперреалистичную фотографию. Но сама она выбирать не будет. Умолчание — это всегда лотерея. Поэтому в самом начале описания, либо в его конце (в зависимости от конкретной модели), стоит указать медиум. Для фотореализма отлично подходят маркеры вроде «cinematic shot», «hyperrealistic», «photoshoot». Если же душа тяготеет к классическому искусству, на помощь приходят «oil painting», «watercolor», «charcoal drawing». К слову, упоминание конкретных художников творит настоящие чудеса. Добавьте «by Vincent van Gogh» или «by Greg Rutkowski», и картинка моментально обрастёт узнаваемой стилистикой.
Освещение
Свет — это, пожалуй, самый недооценённый инструмент в арсенале новичка. Плоский свет убивает объём, делая изображение скучным. А вот правильная работа с освещением способна вытянуть даже довольно простой сюжет. Одним из самых популярных решений остаётся «cinematic lighting» — кинематографичный свет, придающий сцене драматизм. Если хочется мягкости и романтики, идеально подойдёт «golden hour» (золотой час) — время перед закатом, когда всё залито теплым сиянием. Для футуристичных сюжетов незаменим «neon lighting» или «volumetric lighting», создающий эффект лучей, пробивающихся сквозь туман или пыль. Не стоит забывать и про тени: «dramatic shadows» добавят глубины и контраста. И всё же, перебарщивать с эпитетами не стоит, иначе нейросеть запутается в источниках света.
Детализация и качество
Чтобы картинка не выглядела мыльной, в запрос приходится внедрять своего рода «усилители качества». Это технические теги, которые подсказывают алгоритму, что мы ждём высокой чёткости. Стандартный набор включает в себя «8k resolution», «highly detailed», «sharp focus». Для имитации современной 3D-графики часто используют названия движков рендеринга, например, «Unreal Engine 5» или «Octane Render». Звучит странно применительно к рисунку, но для ИИ эти слова прочно ассоциируются с детализированной, сочной картинкой. А если речь идёт о фотографии, то нелишним будет указать параметры камеры, скажем, «35mm lens» или «f/1.8», что добавит красивое размытие фона (боке).
Готовые решения: Портреты
Создание лиц — задача не из лёгких. Нейросети часто ошибаются в пропорциях или взгляде. Однако есть проверенные формулы. Допустим, нам нужен атмосферный портрет пожилого мужчины. Запрос может выглядеть так:
Portrait of an old wise man with a long grey beard, wrinkles, deep eyes, staring into the distance, cinematic lighting, dark background, highly detailed, 8k, photorealistic, 85mm lens
Здесь мы видим чёткую структуру: объект, детали внешности, настроение, свет и технические параметры. Результат почти наверняка будет внушительным.
А если хочется чего-то более сказочного? Попробуем создать эльфийскую принцессу. Промт будет следующим:
Beautiful elven princess with silver hair, intricate floral crown, glowing blue eyes, magical forest background, ethereal atmosphere, soft moonlight, fantasy art style, by Alphonse Mucha and Artgerm, digital painting, sharp focus
Имена художников здесь играют ключевую роль: Муха добавит декоративности и линий, а Artgerm — современной комиксной эстетики. Смешение стилей порой даёт удивительно гармоничный результат.
Пейзажи и архитектура
Здесь простор для фантазии поистине безграничен. Главное — задать масштаб и атмосферу. Для любителей киберпанка подойдёт такой вариант:
Futuristic city street at night, rain, neon signs, flying cars, skyscrapers, cyberpunk style, wet reflections, purple and blue color palette, volumetric light, highly detailed, realistic texture, cinematic composition
Обратите внимание на упоминание палитры: цвета задают настроение всей работе. Без этого уточнения город мог бы получиться слишком пёстрым.
Для тех, кто предпочитает уют и пастораль, хорошим выбором станет следующий запрос:
Cozy cottage in the mountains, surrounded by blooming wildflowers, sunny day, fluffy clouds, green grass, watercolor style, soft pastel colors, dreamy atmosphere, intricate details
Слово «dreamy» (мечтательный) работает как фильтр, смягчая линии и делая картинку воздушной. Это добротный вариант для иллюстраций к детским книгам или открыткам.
Абстракция и концепт-арт
Иногда цель — не конкретный объект, а эмоция или форма. Абстрактные запросы сложны тем, что результат непредсказуем, но в этом и есть их изюминка. Попробуйте сгенерировать «визуализацию хаоса»:
Abstract representation of chaos, swirling shapes, explosion of colors, fluid liquid texture, fractal patterns, vibrant red and black, 3d render, surrealism, intricate geometry
Такие изображения часто используют в качестве фонов или элементов дизайна.
Ещё один интересный жанр — изометрия. Это маленькие, игрушечные миры. Промт для такого стиля выглядит примерно так:
Isometric cute magic potion shop, low poly 3d art, pastel colors, soft lighting, white background, blender render, minimal design
«Low poly» указывает на стиль с малым количеством полигонов, что создаёт эффект угловатой, но стильной компьютерной графики.
Вредно ли использовать негативные промты?
Многие новички игнорируют поле «Negative prompt», а зря. Это своеобразный спасательный круг. Сюда мы вписываем всё то, чего на картинке быть категорически не должно. Стандартный набор «исключений» помогает очистить изображение от артефактов. Обычно туда вписывают:
ugly, blurry, low quality, deformed hands, missing limbs, extra fingers, text, watermark, signature
Особенно это актуально для старых версий нейросетей, которые любили пририсовывать людям по шесть пальцев. Впрочем, даже современные модели иногда грешат подобным, так что перестраховаться не помешает. Негативный промт работает как фильтр, отсекая мусорные варианты генерации ещё на этапе просчёта.
Как выбрать стиль: от фотореализма до аниме
Стилизация — это мощнейший инструмент. Одно и то же описание, пропущенное через призму разных стилей, даёт кардинально отличные результаты. Хотите увидеть своего персонажа в виде героя аниме? Добавьте «anime style, Studio Ghibli, cel shading». Нужна мрачная готика? «Gothic style, dark fantasy, by H.R. Giger». А может быть, вам по душе советский ретрофутуризм? Попробуйте «Soviet retrofuturism, mosaic art style, brutalist architecture».
Интересно, что нейросети отлично понимают и материалы. Вы можете «слепить» картинку из пластилина («plasticine model, stop motion style»), вырезать из бумаги («paper cut craft, layered paper») или даже связать («knitted wool texture»). Указание материала меняет саму физику света и тени на изображении. Это открывает двери для самых смелых экспериментов, которые в реальности потребовали бы недель кропотливой работы.
Ошибки, которые портят всё
Самая распространённая ошибка — это многословие. Не стоит писать целые сочинения с деепричастными оборотами. ИИ путается в сложной грамматике. Лучше разбивать описание на короткие, ёмкие фразы, разделённые запятыми. Также не стоит использовать противоречивые команды. Если вы напишете «солнечный день» и «ночное небо» одновременно, нейросеть попытается совместить несовместимое, и результат будет, мягко говоря, странным (хотя иногда и забавным).
Ещё один нюанс — перегруженность деталями. Если попросить нарисовать «девушку в красном платье, с синей шляпой, держащую зелёное яблоко, на фоне Эйфелевой башни, рядом с собакой, под дождём», алгоритм наверняка забудет половину условий или смешает цвета в кашу. Лучше фокусироваться на главном. А второстепенные детали можно добавить позже, используя функцию inpainting (дорисовка), если софт это позволяет.
Насколько важен порядок слов?
Крайне важен. То, что стоит в начале промта, имеет наивысший приоритет. Если вы напишете «лес, в котором стоит маленький домик», вы получите лес. Если же напишете «маленький домик в лесу», акцент сместится на строение. К слову, некоторые нейросети позволяют регулировать вес отдельных слов с помощью скобок или коэффициентов (например, «(cat:1.5)»), но это уже уровень продвинутого пользователя. Для старта достаточно помнить правило пирамиды: основа — в начале, декор — в конце.
Практика и эксперименты
Ни один готовый промт не является истиной в последней инстанции. Это лишь база, фундамент, на котором вы строите своё здание. Результат всегда зависит от конкретной модели (Midjourney, Stable Diffusion, DALL-E), её версии и даже случайного зерна генерации (seed). Иногда стоит заменить всего одно прилагательное, чтобы картинка заиграла новыми красками. Например, замена «angry» (злой) на «furious» (яростный) может кардинально изменить мимику персонажа.
Не бойтесь копировать чужие промты и разбирать их на части. Это лучший способ обучения. Натыкаешься на красивую работу — смотришь описание, анализируешь, какие теги дали такой эффект. Постепенно в голове сложится собственная библиотека эффективных связок. Ведь генерация изображений — это не просто нажатие кнопки. Это диалог с машиной, где вы учитесь формулировать свои мысли так, чтобы их понял чужеродный разум.
Удачи в творческих поисках! Пусть ваши запросы всегда попадают в цель, а результаты превосходят самые смелые ожидания. Нейросети — это мощный инструмент, и в умелых руках он способен создавать настоящие миры. Вдохновение рядом, осталось лишь правильно его описать.