Устав от бесконечного скроллинг-ленты с безупречными, сгенерированными картинками, любой обыватель рано или поздно задается вопросом: «А почему у меня выходит какая-то мазня?». В сети представлено множество курсов и гайдов, обещающих сделать из вас цифрового художника за пару кликов, но реальность, как это часто бывает, оказывается куда прозаичнее. Нейросети — будь то Midjourney, Stable Diffusion или DALL-E — это не просто волшебная палочка, а скорее сложный музыкальный инструмент, на котором ещё нужно научиться играть. И если нажимать клавиши в случайном порядке, симфонии не выйдет. Львиная доля успеха скрыта не в выборе модели, а в умении формулировать запрос. Именно слова становятся кистью, а синтаксис — палитрой. Удивительно, но чтобы получить шедевр, начать стоит с изучения чужого опыта и разбора конкретных примеров.
С чего начинается запрос?
Сложно ли составить промт? Технически — нет, ведь достаточно написать «кот на диване», и система выдаст результат. Однако качество такой картинки, скорее всего, оставит желать лучшего. Главная проблема новичков — отсутствие конкретики. Нейросеть не умеет читать мысли, она работает с текстом. Поэтому структуру запроса стоит держать в голове всегда. Сначала мы определяем объект (кто?), затем действие (что делает?), а после нанизываем детали, словно бусины на нитку: окружение, освещение, стиль, ракурс. Это база. Но дьявол, как известно, кроется в деталях.
Один из рабочих методов — принцип «от общего к частному». Сначала вы задаете основу, например, A futuristic warrior in armor (Футуристический воин в броне). Но этого мало. Чтобы картинка заиграла, нужно добавить «мяса». В ход идут прилагательные и уточнения. Сразу после объекта стоит указать материалы или цвета: made of white carbon fiber and gold details (сделанный из белого углеродного волокна и золотых деталей). И вот уже безликий солдат превращается в дорогостоящий концепт-арт. А если ещё вспомнить про фон, добавив standing in a neon-lit rain forest (стоящий в неоновом дождевом лесу), сцена обретет глубину. Получается добротный каркас, на который можно накладывать художественные фильтры.
Стилизация и художники
Насколько важно указывать автора стиля? Безусловно, это один из самых мощных рычагов влияния на результат. Нейросети обучались на миллионах картин, и упоминание конкретных имён творит чудеса. Если вы хотите получить что-то эпичное и мрачное, попробуйте добавить в конец промта art by Greg Rutkowski или art by Zdzisław Beksiński. Для любителей аниме и детализированных фонов отлично подойдет art by Makoto Shinkai. Но не стоит перебарщивать. Смешивание десятка имён в одну кучу может привести к непредсказуемой «каше».
Довольно часто пользователи грезят о фотореализме. Здесь работают совсем другие триггеры. Забудьте про имена живописцев. Тут солируют термины из мира фотографии и 3D-графики. К слову, магическое заклинание Unreal Engine 5 render всё ещё работает безотказно, придавая изображению тот самый глянцевый, «дорогой» вид компьютерной графики. А если нужна именно фотография, используйте связку shot on Sony A7R IV или 35mm lens. Это заставит алгоритм имитировать оптические искажения и глубину резкости, свойственные реальной камере. Ну и, конечно же, нельзя не упомянуть 8k resolution и hyperrealistic — эти слова-маркеры словно говорят нейросети: «Старайся лучше, прорабатывай каждую пылинку».
Портретная съёмка
Как добиться живого взгляда? Портреты — это, пожалуй, самый популярный жанр в генерации, но и самый капризный. Ошибки анатомии тут всплывут мгновенно. Главное — угадать с описанием кожи и глаз. Сухой промт beautiful woman даст вам пластиковую куклу. Чтобы вдохнуть жизнь, придется попотеть над описанием текстур. Попробуйте такой вариант:
Close-up portrait of an elderly fisherman with a weathered face, deep wrinkles, detailed texture of skin, realistic eyes looking at the horizon, soft natural lighting, cinematic, 8k, highly detailed
Обратите внимание на акцент weathered face (поветренное лицо) и deep wrinkles (глубокие морщины). Именно несовершенства делают портрет живым.
Для создания женских образов в фэнтези-стиле подход меняется. Здесь мы тяготеем к идеализации, но сохраняем детализацию. Пример готового промта может выглядеть так:
Portrait of an elven princess with silver hair, intricate jewelry with emeralds, glowing blue eyes, ethereal atmosphere, soft focus, bokeh background, fantasy art style, digital painting, smooth rendering
Тут мы используем soft focus (мягкий фокус) и bokeh (размытие фона), чтобы отделить персонажа от заднего плана. Это классический прием, который всегда выглядит выигрышно. Да и результат, как правило, получается впечатляющим.
Освещение
Влияет ли свет на настроение кадра? Разумеется. Это едва ли не половина успеха. Плоский свет убивает объём, делая картинку скучной. Поэтому освещению стоит уделить особое внимание. Существует целый словарик терминов, которые нейросеть понимает с полуслова. Cinematic lighting (кинематографичное освещение) дает драматизм и контраст. Volumetric lighting (объёмный свет) добавляет в воздух туман и лучи, пробивающиеся сквозь препятствия. Это создает тот самый «божественный» эффект.
Рассмотрим конкретный пример для интерьера или архитектуры. Простое здание выглядит уныло. Но стоит добавить правильный свет, и всё меняется. Попробуйте такой промт:
Interior of a cozy coffee shop in Paris during rain, warm ambient lighting, reflections on the window, condensation on glass, moody atmosphere, hyper-detailed, photorealistic
Здесь warm ambient lighting (теплое рассеянное освещение) создает уют, контрастируя с холодным дождём за окном. А упоминание reflections (отражения) заставляет движок просчитывать физику света, что добавляет очков реализму.
Пейзажи и архитектура
Что насчет масштабных сцен? Здесь важно задать масштаб и перспективу. Слова wide angle (широкий угол) или aerial view (вид с воздуха) помогут охватить больше пространства. Довольно часто новички забывают про небо, и оно получается пустым. Не скупитесь на эпитеты: stormy clouds (грозовые облака), starry night (звёздная ночь) или golden hour (золотой час). Последнее, кстати, универсальный улучшайзер для любых уличных снимков.
Вот пример сложного архитектурного промта в стиле киберпанк, который пользуется бешеной популярностью:
Futuristic cyberpunk city street at night, neon signs with hieroglyphs, wet asphalt reflecting lights, towering skyscrapers, flying cars, heavy rain, mist, crowd of people in futuristic clothes, vibrant colors, ray tracing, detailed textures
Обратите внимание на наслоение деталей: мокрый асфальт, неон, туман. Всё это создает густой антураж. Ray tracing (трассировка лучей) здесь выступает гарантом правильных отражений. Это серьезное вложение символов в промт, но оно окупается сторицей.
Абстракция и сюрреализм
Можно ли создать то, чего не существует? Нейросети — идеальный инструмент для визуализации снов. Здесь логика отступает на второй план, уступая место фантазии. Главное достояние таких промтов — парадоксальность. Сочетайте несочетаемое. Например:
Melting clocks dripping over a dead tree in a desert, dali style, surrealism, vivid colors, dreamlike atmosphere, mysterious, intricate details
Ссылка на стиль Дали (dali style) сразу задает вектор генерации, а melting clocks (плавящиеся часы) служат якорем композиции.
Другой интересный вариант — использование материалов там, где их быть не должно. Представьте животное, сделанное из дыма или воды. Промт может звучать так:
A majestic lion made entirely of swirling smoke and fire, dark background, glowing eyes, dynamic pose, particles, fantasy concept art, magical, explosion of colors
Слово particles (частицы) добавит мелкие детали, искры и ошмётки дыма, что придаст динамику. Выглядит такое зрелище, как правило, грандиозно.
Отрицательные промты (Negative Prompts)
Обязательно ли указывать, чего ты НЕ хочешь? В большинстве продвинутых интерфейсов (например, Automatic1111 для Stable Diffusion) есть отдельное поле для негативного промта. И игнорировать его — значит стрелять себе в ногу. Дело в том, что нейросети склонны к галлюцинациям: лишние пальцы, размытые лица, водяные знаки, подписи. Чтобы этого избежать, нужно создать своего рода «фильтр».
Стандартный набор «спасательного круга» выглядит примерно так:
ugly, deformed, noisy, blurry, low quality, bad anatomy, extra limbs, missing limbs, watermark, text, signature, bad hands, mutated
Вписывая эти слова в негативный промт, вы буквально запрещаете алгоритму использовать плохие паттерны. Это, конечно, не панацея от всех бед, но количество брака снижает заметно. Тем более, что копировать этот список можно из раза в раз, лишь слегка корректируя под задачи. Впрочем, иногда стоит добавлять и специфические запреты, например, bw (чёрно-белое), если вам нужен только цвет.
Технические параметры и настройки
Играют ли роль цифры? Безусловно. Даже идеальный текстовый запрос можно испортить неправильными настройками соотношения сторон или стилизации. В Midjourney, например, параметры пишутся через два дефиса. –ar 16:9 сделает картинку широкоформатной, что идеально для обоев на рабочий стол. А –ar 9:16 подготовит контент для сторис в соцсетях. Забывать об этом не стоит, ведь композиция кадра напрямую зависит от формата. Квадратный портрет и вертикальный — это две разные истории.
Ещё один важный параметр — вес стилизации (Stylize) или хаос (Chaos). Высокие значения стилизации (–s 750 или выше) дают нейросети творческую свободу. Она начинает «додумывать» за вас, добавляя детали, которых не было в запросе. Это палка о двух концах. С одной стороны, результат может получиться неожиданно прекрасным, с другой — уйти слишком далеко от идеи. Если нужна точность, держите этот параметр в узде. Ну а, параметр хаоса (–c) — это выбор для смелых экспериментаторов, готовых к тому, что результат будет совершенно непредсказуемым.
Логотипы и векторы
Возможно ли использовать ИИ для работы? Да, и создание логотипов — отличный тому пример. Но здесь нужен особый подход. Никаких «фотореализмов» и «сложных текстур». Наоборот, мы требуем простоты. Промт должен быть лаконичным. Пример:
Minimalist vector logo of a fox head, flat design, white background, simple lines, orange and black colors, geometric style
Слова flat design (плоский дизайн) и white background (белый фон) критически важны. Они позволяют потом легко вырезать изображение и перевести его в настоящий вектор.
Также хорошо работают запросы на стикеры или иконки:
Set of cute stickers depicting coffee cups with different emotions, white border, cartoon style, bright colors, 2d, high quality
Указание white border (белая обводка) создает характерный вид наклейки. Это удобно. Ведь дизайнеру остается только «оттрассировать» изображение. И всё же, стоит помнить, что текст нейросети генерируют пока ещё плохо, так что название бренда лучше вписывать вручную в фотошопе.
Еда и предметная съёмка
Как вызвать аппетит у зрителя? Фуд-фотография требует сочности. Здесь работают макро-объективы и акцент на свежести. Представьте бургер. Если просто написать «бургер», вы получите резиновую булку. А теперь попробуйте так:
Delicious gourmet burger with melting cheese, dripping sauce, fresh lettuce and tomatoes, steam rising, macro photography, depth of field, professional food photography, studio lighting, 4k
Связка melting cheese (плавящийся сыр) и steam rising (поднимающийся пар) воздействует на рецепторы. Картинка становится «вкусной».
То же правило касается и предметной съёмки товаров. Например, флакон духов:
Elegant perfume bottle on a glass podium, surrounded by rose petals, water splashes, soft pink pastel background, advertising photography, glossy finish, luxury
Слова advertising photography (рекламная фотография) и luxury (роскошь) задают тон, который обычно мы видим в глянцевых журналах. Это серьезный инструмент для создания мудбордов или даже финальных промо-материалов.
Как не надо делать
Чего стоит избегать? Главная ошибка — это «словесный салат». Не пытайтесь впихнуть в один промт все красивые слова, которые вы нашли в интернете. «Киберпанк, средневековье, реализм, мультик, Пикассо, Ван Гог» — такой запрос сведет машину с ума. Выберите один стиль и придерживайтесь его. Противоречивые команды только ухудшают качество. Не стоит писать «очень длинный текст с описанием истории персонажа». Нейросеть не понимает сюжет, она понимает визуальные образы. Вместо «рыцарь, который грустит о потерянной любви», напишите sad knight sitting alone in ruins, head down (грустный рыцарь, сидящий в одиночестве в руинах, голова опущена).
Также откажитесь от абстрактных понятий вроде «мысли о вечном» или «смысл жизни». Переводите эти метафоры в конкретику. «Мысли» могут стать «светящимся ореолом вокруг головы» или «книгой в руках». ИИ — это визуал, а не философ. Скрупулезный подбор визуальных эквивалентов для абстрактных идей — вот ключ к успеху.
На самом деле, путь к идеальному промту — это путь постоянных экспериментов. Нет универсальной формулы, которая работала бы всегда и везде, ведь модели обновляются, а алгоритмы меняются. Однако понимание базы, знание терминологии и умение четко выражать свои желания на языке машины — это фундамент, без которого не обойтись. Не бойтесь копировать чужие промты, разбирать их на части и собирать заново. Ведь именно в процессе этой игры слов и смыслов рождается то самое уникальное изображение, которое заставит зрителя задержать взгляд. Творите, пробуйте, ошибайтесь и снова пробуйте. Ваша идеальная генерация уже ждёт своего запроса.
Удачи в творческих поисках, и пусть каждый ваш промт превращается в маленький цифровой шедевр!