Промт для улучшения качества фото (с примерами готовых промтов)

Размытые лица, лишние пальцы, «мыльная» кожа или странный цифровой шум, убивающий всю эстетику кадра, — с этим сталкивался каждый, кто хоть раз пытался генерировать изображения. Казалось бы, нейросеть обучена на миллионах шедевров, но почему-то на выходе мы довольно часто получаем результат, далёкий от идеала, а кнопка «Upscale» лишь увеличивает размер катастрофы, но не её художественную ценность. Многие винят в этом саму модель или недостаток вычислительных мощностей, считая, что только дорогая видеокарта способна сотворить чудо. Однако львиная доля успеха кроется вовсе не в железе. Всё дело в словах. Ведь алгоритм — это не художник с интуицией, а сложная математическая функция, которой нужны чёткие координаты. Поэтому, прежде чем ставить крест на неудачной генерации, стоит разобраться, как именно нужно попросить машину сделать «красиво».

Как работает магия слов?

Сложно ли объяснить машине понятие красоты? Безусловно, ведь для искусственного интеллекта эстетика — это всего лишь набор весов и связей между пикселями. Когда мы пишем просто «хорошее фото», алгоритм теряется в догадках, поскольку в его базе данных этим тегом помечены и профессиональные студийные снимки, и любительские кадры с «мыльниц» двадцатилетней давности. Ему нужна конкретика. Нюанс здесь в том, что улучшение качества через промт — это не просьба «сделать лучше», а указание на технические параметры, присущие высококлассным фотографиям. Мы словно подсовываем нейросети шпаргалку, заставляя её имитировать работу дорогой оптики и профессионального света. И тут на сцену выходят специфические термины, которые обычному обывателю могут показаться бессмысленным набором букв, но для ИИ они звучат как приказ.

Технический словарь

Начинать конструирование запроса стоит с фундаментальных определений разрешения и детализации. Первым делом в строку обычно вписывают маркеры высокого разрешения. Самый распространенный и действенный вариант — это связка «8k» или «4k». Она задаёт вектор на сверхчёткость. Далее следует усилить эффект словами «ultra-detailed» или «hyper-detailed». Эти теги заставляют модель прорисовывать мельчайшие текстуры, будь то поры на коже или прожилки на листьях. Отдельно стоит упомянуть термин «masterpiece». Звучит пафосно, но в латентном пространстве нейросети это слово связано с изображениями, получившими наивысшие оценки на арт-платформах. К тому же, не стоит забывать про технические характеристики исходника. Добавление фразы «raw photo» сигнализирует системе, что нам нужно необработанное, максимально информативное изображение без сжатия, характерного для формата JPEG. Ну и, наконец, отличным дополнением станет «sharp focus». Ведь именно фокус отвечает за то, чтобы главный объект не расплывался в тумане.

Освещение

Свет творит чудеса. Плоское освещение способно убить даже самую детализированную модель, превратив её в картонную фигуру. Чтобы этого избежать, нужно управлять светом через промт. Если вы хотите объёма и драматизма, отличным решением станет «cinematic lighting» или «volumetric lighting». Эти токены добавляют глубину, создают красивую игру теней и бликов, делая картинку живой. Для портретов же лучше подходит «studio lighting». Это имитация профессионального студийного света, который выравнивает тон кожи и подчёркивает достоинства. А вот любителям естественности стоит обратить внимание на «natural light» или «golden hour» (золотой час) — время перед закатом, когда свет становится мягким и тёплым. Освещение не просто делает картинку ярче; оно задаёт настроение и, что важнее, помогает скрыть мелкие огрехи генерации за счёт контраста.

Оборудование и оптика

Зачем упоминать название камеры, если её не существует? Дело в том, что нейросети обучались на метаданных реальных фотографий. Если вы укажете конкретную модель камеры или тип плёнки, ИИ попытается сымитировать их характерный почерк. К слову, упоминание «Fujifilm XT3» часто даёт приятную, кинематографичную цветопередачу. А если добавить «Kodak Portra 400», то изображение приобретёт благородную зернистость и тёплые оттенки, свойственные этой легендарной плёнке. Не менее важен выбор объектива. Для портретов идеально подходит «85mm lens». Это фокусное расстояние считается классическим, оно дает правильные пропорции лица и красивое размытие фона (боке). Если же нужен широкий охват, например, для пейзажа, то выручит «35mm» или «wide angle». Такие уточнения действуют на алгоритм как калибровочный инструмент, отсекая варианты с искаженной перспективой или неестественным углом обзора.

Примеры для портретов

Теория — это хорошо, но как это выглядит на практике? Допустим, нам нужен реалистичный женский портрет. Базовый запрос может выглядеть так: «Portrait of a woman». Результат, скорее всего, будет средним. Теперь попробуем применить наши знания. Добротный, рабочий промт будет звучать следующим образом:

Hyper-realistic portrait of a young woman, shot on 85mm lens, f/1.8, natural lighting, global illumination, 8k resolution, highly detailed skin texture, sharp focus, eyes detailed, masterpiece

Разберём, что здесь происходит. Мы задали фокусное расстояние и диафрагму (f/1.8), что обеспечит размытый фон и акцент на лице. Упоминание «global illumination» добавит реалистичных рефлексов света. А «highly detailed skin texture» — это именно тот ключ, который запрещает нейросети делать кожу «пластиковой». Разумеется, можно добавить и настроение, например, «melancholic look» или «vibrant colors», но технический каркас должен оставаться неизменным.

Пейзаж и архитектура

С масштабными сценами дело обстоит немного иначе. Здесь на первый план выходит не текстура кожи, а глубина и проработка мелких деталей на дальнем плане. Если мы генерируем городской пейзаж, промт может быть таким:

Futuristic city street, wide angle shot, cyberpunk style, neon lights, wet asphalt reflection, unreal engine 5 render, octane render, 8k, ultra detailed, atmospheric perspective

Обратите внимание на «unreal engine 5 render» и «octane render». Казалось бы, причём тут движки для создания игр и 3D-графики? Однако в базе данных нейросетей изображения с этими тегами обычно обладают запредельной чёткостью и потрясающим освещением. Это своего рода лайфхак. Для природы же отлично подойдёт:

Majestic mountain landscape, morning mist, god rays, lush vegetation, national geographic style, high resolution, photorealistic, wide shot

Здесь «national geographic style» выступает гарантом качества композиции и естественности цветов.

Вредно ли игнорировать негативные промты?

Безусловно. Негативный промт (параметр --no в Midjourney или отдельное поле в Stable Diffusion) — это ваш спасательный круг. Это список того, чего на изображении быть НЕ должно. И порой он даже важнее основного запроса. Чтобы качество фото выросло, нужно в обязательном порядке отсечь мусор. Стандартный набор для «чистки» выглядит так:

blur, haze, noise, low quality, worst quality, jpeg artifacts, ugly, deformed, extra fingers, bad anatomy, watermark, text, signature

Если не указать эти слова, нейросеть может решить, что лёгкая размытость или зернистость — это художественный замысел. Особенно коварен «jpeg artifacts». Этот тег убирает характерные для сжатых картинок искажения, делая изображение чистым и гладким. Не стоит перебарщивать с негативом, но базовый санитарный контроль необходим.

Стилизация и художественные приёмы

Иногда качество — это не про фотореализм, а про стиль. Высококлассная иллюстрация тоже требует правильных слов. Если цель — создать детализированный арт, стоит использовать такие маркеры, как «intricate details» (запутанные, сложные детали). Это словосочетание творит чудеса с одеждой, бронёй или архитектурным декором. Ещё один мощный инструмент — «rule of thirds» (правило третей). Этот композиционный приём делает кадр сбалансированным и приятным глазу. Профессиональные фотографы используют его постоянно, и нейросеть прекрасно понимает эту команду. А для придания эпичности можно добавить «dramatic angle» или «low angle shot» (съёмка с нижнего ракурса). Это визуально возвеличивает объект съёмки, делая его внушительным и монументальным.

Помогает ли “Upscale”?

Многие считают, что достаточно сгенерировать маленькую картинку, а потом просто увеличить её через встроенный апскейлер. Это опасное заблуждение. Программное увеличение часто добавляет артефакты, если исходник был беден на детали. Задача промта — создать исходник, в котором уже заложена высокая плотность информации. Тогда при увеличении алгоритму будет за что зацепиться. Но если вы всё же используете сторонние сервисы для улучшения (вроде Magnific AI или Topaz), то и для них существуют свои текстовые подсказки. В поле “Creativity” или “Resemblance” часто можно вписать промт, описывающий текстуры. Например, при увеличении портрета полезно продублировать в настройках апскейлера: «detailed skin pores, realistic eyes, individual hair strands». Это поможет программе не просто размазать пиксели, а достроить недостающую информацию на основе вашего описания.

Разбор ошибок

Свалка тегов — главная беда новичков. Кажется, что если написать все красивые слова сразу, то получится шедевр. Но на самом деле перегруженный промт сбивает нейросеть с толку. Когда в одном запросе встречаются «cyberpunk», «medieval», «studio lighting» и «sunlight», модель выдает усредненную кашу. Важно соблюдать логику. Если мы снимаем в студии, там не может быть «солнечных лучей сквозь листву». Если это макросъёмка, не нужно требовать «wide angle». Ещё один нюанс — порядок слов. То, что стоит в начале промта, имеет для ИИ наибольший вес. Поэтому главные характеристики качества (best quality, masterpiece, 8k) лучше ставить либо в самом начале, либо в самом конце как закрепляющий блок, но не терять их в середине описания сюжета.

Программные особенности

Стоит отметить, что разные нейросети имеют свои диалекты. Midjourney, например, тяготеет к более художественным, образным описаниям и меньше зависит от жёстких технических терминов, хотя и любит --v 6.0 и --style raw для фотореализма. Stable Diffusion, напротив, требует скрупулезного перечисления тегов через запятую и очень чувствительна к весам (скобочкам и цифрам). В DALL-E 3 лучше всего работают естественные, описательные предложения на разговорном языке, без нагромождения ключевых слов. Там вместо «woman, 8k, detailed» лучше написать «A photo showing a woman in high resolution with clearly visible details». Понимание этой разницы сэкономит вам часы времени и нервные клетки. Тем более, что принципы света и композиции везде остаются общими.

Практика макросъёмки

Отдельный интерес вызывает макросъёмка. Это тот жанр, где детализация играет первую скрипку. Чтобы получить завораживающий кадр глаза насекомого или капли росы, нужно использовать специфический набор слов. Начните с «macro photography» или «close-up». Обязательно добавьте «depth of field» (глубина резкости), чтобы размыть фон и выделить объект. Промт может выглядеть так:

Extreme close-up of a human eye, iris details, macro photography, 100mm macro lens, sharp focus, reflection in the eye, high contrast, 8k, detailed texture

Здесь «iris details» подсказывает модели, на чем именно сконцентрировать вычислительные ресурсы. Результат часто выглядит впечатляюще, порой даже лучше, чем реальные фото, ведь у ИИ нет проблем с дрожанием рук или недостатком света.

И всё же, почему получается плохо?

Бывает и так: промт идеальный, настройки верные, а на выходе — монстр. Причина может крыться в конфликте стилей. Например, если вы просите «масляную живопись» и одновременно «фотореализм 8k», нейросеть попытается скрестить ужа с ежом. Результат будет предсказуемо странным. Ещё один подводный камень — слишком абстрактные понятия. Слова вроде «красиво», «невероятно», «душевно» для машины — пустой звук. Их нужно переводить на язык визуальных образов. Вместо «страшно» пишите «dark atmosphere, shadows, fog». Вместо «радостно» — «bright colors, smiling, warm light». Чем точнее перевод эмоции в визуал, тем качественнее результат.

Эксперименты с материалами

Для повышения реалистичности полезно указывать материалы. Если это одежда, пишите «cotton», «silk», «leather texture». Если интерьер — «wood grain», «marble floor», «brushed metal». Упоминание фактуры заставляет нейросеть прорисовывать микроконтраст на поверхностях. Сравните просто «jacket» и «worn leather jacket with scratches». Во втором случае вы получите вещь с историей, с объёмом и характером. Это именно те мелочи, из которых складывается ощущение высокого качества. Зритель верит изображению, когда видит знакомые физические свойства материалов. И для этого не нужно быть писателем, достаточно просто быть внимательным наблюдателем.

Финальный аккорд

Работа с промтами — это не столько программирование, сколько умение видеть кадр ещё до его появления. Это постоянный поиск баланса между технической сухостью и художественным замыслом. Не бойтесь копировать удачные решения, комбинировать их и подстраивать под свои задачи. Ведь каждая генерация — это лотерея, но с правильным билетом шансы на джекпот возрастают многократно. Пробуйте, меняйте объективы в описании, играйте со светом, и рано или поздно вы найдёте ту самую формулу, которая превратит ваши идеи в безупречные цифровые полотна. Пусть ваши генерации всегда будут чёткими, а вдохновение — бесконечным.