Промт для улучшения изображения (с примерами готовых промтов)

Часами подбираешь слова, ждёшь генерацию, а на выходе получаешь не шедевр, а нечто с шестью пальцами и глазами, смотрящими в разные стороны? Ситуация, знакомая каждому, кто хоть раз пытался «договориться» с нейросетями. Кажется, что искусственный интеллект просто издевается, игнорируя замысел автора и выдавая размытые пятна вместо чётких линий. Обидно. Ведь в голове картинка выглядела идеально. Но чтобы превратить цифровую «мазню» в произведение искусства, порой достаточно добавить всего пару правильных команд, которые направят алгоритмы в нужное русло.

С чего начинается качество?

Существует ли волшебная кнопка «сделать красиво»? В прямом смысле её нет, но правильные токены действуют именно так. Основа любого добротного изображения — это технические дескрипторы. Обыватель часто пишет просто «красивая девушка» или «дом у озера», забывая, что для машины понятие красоты — вещь довольно абстрактная. Ей нужны чёткие ориентиры. Поэтому первым делом стоит обратить внимание на слова, определяющие разрешение и детализацию. Львиная доля успеха зависит от того, укажете ли вы нейросети, к какому стандарту качества ей нужно стремиться.

Самые простые, но действенные усилители — это обозначения разрешения. Добавление в конец промта маркировок 4k, 8k или UHD творит чудеса. Это сигнал для алгоритма прорисовать текстуры более тщательно. Но не стоит ограничиваться только цифрами. Отлично работают отсылки к профессиональному софту. Фраза Unreal Engine 5 или Octane Render заставляет ИИ имитировать освещение и детализацию, свойственную современной компьютерной графике высокого уровня. Картинка сразу становится более объёмной, сочной. А если добавить hyperrealistic или photorealistic, то нейросеть будет стараться убрать эффект «рисованности», приближая результат к фотографии.

Магия света и тени

Свет решает всё. Это аксиома. Для любого фотографа. И для нейросети — тоже. Без указания типа освещения изображение часто получается плоским, скучным, словно снятым со вспышкой «в лоб». Чтобы добавить драматизма и глубины, нужно управлять светом через текст. Один из самых мощных инструментов здесь — cinematic lighting (кинематографичное освещение). Этот токен добавляет контраст, делает тени глубже, а свет — выразительнее.

Если же хочется чего-то более мягкого, утреннего, стоит попробовать volumetric lighting (объёмный свет). Он создаёт эффект лучей, пробивающихся через туман или пыль, что придаёт сцене невероятную атмосферность. Для портретов же отлично подходит studio lighting — студийный свет, который гарантирует, что лицо модели будет освещено ровно, без провалов в черноту. А вот любителям киберпанка и неона не обойтись без bioluminescent или neon light. Эти слова буквально зажигают кадр яркими красками. Главное — угадать с палитрой, чтобы не превратить изображение в кислотный хаос.

Детализация

Как избавиться от «мыла»? Ведь часто бывает, что общий план хорош, а стоит приблизить — и детали расплываются. Здесь на помощь приходят слова-усилители резкости. Токен sharp focus (чёткий фокус) указывает ИИ, что объект должен быть резким, а не размытым. Ещё один полезный инструмент — intricate details (сложные детали). Он заставляет генератор прорисовывать мелкие элементы: узоры на одежде, морщинки, текстуру камня или коры дерева.

Для особых случаев, когда нужна запредельная чёткость, можно использовать связку highly detailed и masterpiece. Ходят споры, работает ли слово «шедевр» как технический токен или это просто плацебо, но практика показывает, что с ним композиция часто становится более сбалансированной. А вот для прорисовки лиц (самая больная тема для многих) стоит добавить detailed face и detailed eyes. Это, конечно, не стопроцентная гарантия от косоглазия, но шанс получить нормальный взгляд повышается в разы. Тем более, что исправить мелкие огрехи потом проще, чем перегенерировать всё с нуля.

Настройки камеры

Можно ли управлять виртуальным объективом? Разумеется. Нейросети обучены на миллионах фотографий, и они прекрасно понимают терминологию фотографов. Если вы хотите получить портрет с красивым размытым фоном (боке), смело пишите f/1.8 или f/2.8. Это имитирует открытую диафрагму. А слово bokeh усилит этот эффект, превратив фон в мягкие кругляшки света.

Для пейзажей и архитектуры логичнее использовать wide angle (широкий угол) или указать конкретное фокусное расстояние, например, 16mm. Это позволит захватить в кадр больше пространства и придаст изображению эпический размах. Напротив, для макросъёмки насекомых или ювелирных украшений идеально подойдёт macro lens или 100mm. Такие уточнения делают картинку не просто «сгенерированной», а похожей на работу профессионала с дорогой техникой. Нюанс лишь в том, что нужно понимать физику процесса: нельзя требовать от широкого угла макро-детализации на горизонте.

Стилистика: Цифровое искусство

Но что, если реализм — не цель? Иногда хочется создать что-то сказочное, рисованное или стилизованное. В этом случае технические параметры уходят на второй план, уступая место художественным стилям. Кладезь идей здесь бесконечен. Хотите мрачности и величия? Добавьте dark fantasy. Нужна лёгкость и воздушность? Ваш выбор — watercolor (акварель) или pastel art.

Довольно популярным остаётся стиль cyberpunk — неоновые вывески, дождь, хром. А для любителей ретро-футуризма подойдёт steampunk с его шестерёнками и латунью. Интересный эффект даёт упоминание конкретных художников. Например, in the style of Alphonse Mucha мгновенно добавит в генерацию характерные виньетки и плавные линии модерна. А Greg Rutkowski (любимец пользователей Midjourney) привносит эпичность и живописность, свойственную фэнтези-артам. Однако не стоит бездумно копировать имена. Лучше смешивать стили, создавая свой уникальный микс. Например, cyberpunk mixed with oil painting может дать совершенно неожиданный и крутой результат.

Негативный промт

О нём забывают. А зря. Негативный промт (параметр –no в Midjourney или отдельное поле в Stable Diffusion) — это то, чего на картинке быть НЕ должно. Это ваш спасательный круг. Сюда нужно вписывать все дефекты, которые нейросеть любит плодить. Стандартный набор выглядит так: blur, low quality, bad anatomy, bad hands, extra fingers, missing fingers, watermark, text, signature.

Удивительно, но исключение слова ugly (уродливый) часто работает лучше, чем добавление слова beautiful. Дело в том, что ИИ отсекает пути, ведущие к заведомо плохим результатам. Для фотореализма в негативный промт стоит добавить cartoon, illustration, 3d render, чтобы избежать «пластикового» эффекта кожи. А если генерируете одиночный портрет, не забудьте вписать multiple people, иначе за спиной героя могут появиться жутковатые фантомы.

Примеры готовых решений

С теорией разобрались, теперь перейдём к практике. Как же выглядят готовые «формулы» успеха? Рассмотрим несколько вариантов для разных задач. Эти конструкции можно использовать как базу, заменяя объекты на нужные вам.

Для создания фотореалистичного портрета девушки конструкция может выглядеть следующим образом. Начинаем с объекта, затем нанизываем улучшения. Portrait of a young woman with freckles, natural lighting, looking at camera, 8k resolution, photorealistic, highly detailed skin texture, sharp focus, cinematic lighting, shot on 85mm lens, f/1.8, bokeh background. Обратите внимание: мы указали и текстуру кожи, и объектив, и свет. Результат будет максимально живым.

Если ваша цель — эпический пейзаж, попробуйте такой вариант. Majestic mountain landscape, sunset, dramatic clouds, volumetric lighting, reflection in the lake, wide angle, 8k, unreal engine 5 render, hyperrealistic, intricate details. Здесь акцент сделан на масштаб (majestic, wide angle) и атмосферу (sunset, dramatic clouds). Движок unreal engine добавит той самой «игровой» красоты и глубины.

Для любителей фэнтези-арта подойдёт более художественное описание. Elven archer in a dark forest, magic glowing arrows, fantasy art style, intricate armor design, mystical atmosphere, fireflies, night, soft moonlight, digital painting, artstation trends, sharp details. Упоминание artstation trends — это хитрый ход. Нейросеть обратится к базе популярных и качественных работ с сайта ArtStation, подтягивая стилистику под этот высокий стандарт.

А вот пример для предметной съёмки (например, кроссовки). Product photography of futuristic sneakers, floating in the air, neon background, dynamic lighting, 8k, sharp focus, advertising style, high detail. Словосочетание product photography сразу переключает алгоритм в режим рекламной съёмки: чистый свет, акцент на товаре, отсутствие лишнего мусора в кадре.

Стоит ли копировать?

Соблазн взять чужой промт и просто нажать кнопку велик. Да, это сэкономит время. И результат, скорее всего, будет неплохим. Но есть один нюанс.

Идеальный промт — это всегда компромисс между вашей идеей и капризами конкретной модели нейросети. То, что сработало у соседа в Midjourney v5, может выдать кашу в Stable Diffusion XL. Разные версии понимают слова по-разному.

К тому же, слепое копирование убивает творчество. Самые интересные результаты получаются тогда, когда вы начинаете экспериментировать. Попробуйте заменить cinematic lighting на rembrandt lighting. Или вместо 8k напишите oil painting style. Иногда абсурдные, на первый взгляд, сочетания (например, «киберпанк в стиле Ван Гога») рождают настоящие шедевры. Промт-инжиниринг — это не столько наука, сколько перебор вариантов и интуиция.

Поэтому не бойтесь ошибаться. В конце концов, каждая неудачная генерация приближает вас к пониманию логики машины. Собирайте свою коллекцию удачных слов, миксуйте стили, играйте со светом и камерой. Искусственный интеллект — это мощный инструмент, но дирижёром оркестра всё равно остаётесь вы. Пусть ваши запросы будут смелыми, а результаты — впечатляющими.