Промты для фотографий на русском (с примерами готовых промтов)

Знакома ли вам ситуация, когда вместо ожидаемого шедевра цифрового искусства на экране появляется нечто невразумительное с тремя ногами и лишним глазом? В сети представлено множество красивых картинок, сгенерированных нейросетями, и обывателю порой кажется, что достаточно нажать одну «волшебную кнопку», чтобы получить результат уровня галереи. Устав от суеты и бесконечных попыток подобрать нужные слова, многие новички бросают это занятие, так и не раскрыв весь потенциал искусственного интеллекта. Ведь проблема зачастую кроется не в глупости машины, а в неумении человека объяснить ей свою задачу. Глобальная сеть наполнена советами на английском, но что делать, если хочется творить на родном языке? А начать стоит с понимания того, как именно алгоритм воспринимает наши с вами слова.

Понимает ли нейросеть великий и могучий?

Вопрос этот не так прост, как кажется на первый взгляд. С одной стороны, львиная доля популярных моделей (вроде Midjourney или Stable Diffusion) обучалась на англоязычных датасетах. Это значит, что русский язык для них — своего рода иностранный, требующий перевода. И здесь кроется первый подвох. Когда вы вводите запрос на русском, встроенный переводчик может исказить смысл, превратив «лук» (оружие) в «лук» (овощ), или «косу» (прическу) в инструмент для покоса травы. Однако спектр инструментов не ограничивается только западными разработками. Отечественные решения, такие как Kandinsky или Шедеврум, изначально «думают» на русском, и для них наши сложные метафоры и культурные коды — родная стихия. Впрочем, даже работая с западными сетями, можно добиться впечатляющих результатов на кириллице, если знать определённые правила построения фразы. Главное — избегать двусмысленности.

Анатомия идеального запроса

Сложно ли составить работающий промт? Вовсе нет, если разложить этот процесс по полочкам. Любой качественный запрос строится по принципу наслоения смыслов, подобно тому, как художник накладывает мазки на холст. Основу всегда составляет главный объект. Это может быть «рыжий кот», «киберпанк-самурай» или «заброшенный маяк». Без чёткого указания субъекта нейросеть начнёт галлюцинировать. Сразу за объектом следует действие или состояние. Что делает наш герой? Сидит, бежит, спит или задумчиво смотрит вдаль? Это придает динамику. Следующий важный слой — окружение. Где происходит действие? В лесу, в открытом космосе или на кухне хрущёвки? Ну и, наконец, стиль и технические параметры. Именно они превращают обычную картинку в «фотореалистичный снимок» или «картину маслом».

Освещение и атмосфера

Свет творит чудеса. Именно от него зависит, будет ли ваше изображение выглядеть плоским и скучным или объёмным и драматичным. Обыватель часто забывает про этот нюанс, а ведь нейросеть нуждается в подсказке. Если вы хотите получить тёплое, уютное изображение, стоит добавить в описание фразу «золотой час» или «мягкий солнечный свет». Это сразу задаст нужную тональность. Для более драматичных и загадочных сцен идеально подойдёт «кинематографичное освещение» или «объёмный свет». А если душа просит чего-то современного и технологичного, то выручит «неоновая подсветка» или «киберпанк-свет». К слову, довольно часто новички используют просто слово «красиво», но для машины это пустой звук. Конкретика — вот залог успеха. Попробуйте написать: «Портрет девушки у окна, естественный свет из окна, падающие тени от жалюзи, мягкий контраст». Результат вас удивит.

Портретная съёмка

Создание реалистичных лиц — задача не из лёгких. Малейшая ошибка в описании, и взгляд персонажа становится стеклянным, а кожа напоминает пластик. Чтобы этого избежать, нужно использовать специальные маркеры качества. Начать нужно с детализации кожи. Фразы вроде «высокая детализация кожи», «видны поры», «реалистичная текстура» дают алгоритму понять, что мы не хотим видеть кукольное лицо. Глаза — зеркало души, даже если душа цифровая. Поэтому не скупитесь на эпитеты: «выразительные глаза», «детальная прорисовка радужки», «живой взгляд». Тем более, что современные модели прекрасно справляются с макросъёмкой. Пример хорошего промта для портрета может звучать так:

Крупный план, портрет пожилого рыбака с бородой, глубокие морщины, обветренное лицо, реалистичные глаза, взгляд в камеру, детальная текстура кожи, мягкий естественный свет, размытый фон, профессиональное фото, 8к

Здесь каждое слово работает на результат.

Как выбрать стиль?

Иногда нам нужно не фото, а иллюстрация. И тут фантазия может разгуляться вовсю. Но чтобы нейросеть поняла ваш замысел, ей нужен четкий референс. Можно указывать конкретных художников (Айвазовский, Ван Гог, Шишкин), но с этим стоит быть осторожнее, так как не все модели знают всех живописцев. Надёжнее использовать названия стилей и техник. «Акварельный рисунок», «масляная живопись», «карандашный набросок», «цифровой арт», «стиль аниме» — всё это понятные команды. А вот если хочется чего-то необычного, попробуйте смешивать несовместимое. Например:

Советская панелька в стиле киберпанк, неоновые вывески на русском, дождь, отражения в лужах, мрачная атмосфера, реалистичный рендер, движок Unreal Engine 5

Такой подход позволяет создавать уникальные миры, которых нет в реальности.

Пейзажи и архитектура

Природа и здания даются нейросетям довольно просто. Однако и здесь есть свои подводные камни. Главная ошибка — отсутствие масштаба. Чтобы горы выглядели величественными, а небоскрёбы — грандиозными, используйте слова, задающие перспективу. «Широкий угол», «панорамный вид», «вид с дрона», «вид снизу вверх» — эти уточнения меняют восприятие кадра кардинально. Представьте себе разницу между просто «лес» и:

дремучий хвойный лес в тумане, вид с высоты птичьего полёта, утренняя заря, пробивающиеся лучи солнца, высокая детализация листвы

Во втором случае картинка буквально оживает. К тому же, стоит упоминать время года и погоду. «Дождливый осенний день» создаст меланхоличное настроение, а «яркий солнечный полдень» наполнит кадр позитивом.

Технические параметры и качество

В погоне за сюжетом многие забывают о качестве картинки. А ведь именно технические теги подсказывают нейросети, как должен выглядеть финальный рендер. Слова-маркеры здесь играют решающую роль. «4k», «8k», «высокое разрешение», «HDR», «четкий фокус» — это обязательный джентльменский набор для получения чёткого изображения. Если вы хотите имитировать работу реальной камеры, укажите её модель или параметры объектива. Например: «снято на Canon 5D Mark IV, объектив 50mm, диафрагма f/1.8». Это добавит снимку то самое благородное боке (размытие фона), за которым охотятся фотографы. Разумеется, не стоит перебарщивать и писать все известные вам термины подряд, но пара-тройка технических уточнений значительно улучшит результат.

Что насчёт ошибок?

К сожалению, генерация изображений — процесс непредсказуемый. Артефакты, лишние пальцы, странная геометрия — всё это встречается довольно часто. Бороться с этим помогает так называемый Negative Prompt (негативный промт). Это то, чего на картинке быть НЕ должно. В русскоязычных интерфейсах это поле часто называется «Исключить» или «Чего избегать». Туда стоит вписать: «размытость», «плохое качество», «уродство», «лишние конечности», «плохая анатомия», «водяные знаки», «текст». Это своего рода фильтр, отсекающий брак. И всё же, даже с идеальным промтом первая генерация может оказаться неудачной. Это нормально. Не стоит опускать руки, просто нажмите кнопку «Сгенерировать» ещё раз или слегка измените формулировку.

Примеры готовых промтов: Люди

Перейдём от теории к практике. Допустим, нам нужен образ деловой женщины. Сухой запрос «женщина в костюме» даст скучный результат. Попробуем насытить его деталями.

Вариант 1 (Реализм):

Фотореалистичный портрет молодой женщины в строгом деловом костюме, белая рубашка, уверенный взгляд, сидит за столом в современном офисе, на заднем плане панорамное окно с видом на Москва-Сити, дневной свет, высокая детализация, профессиональное фото.

Вариант 2 (Фэнтези):

Эльфийская принцесса в доспехах из серебра и золота, стоит в зачарованном лесу, магическое свечение вокруг, светлячки, мистическая атмосфера, длинные светлые волосы, высокая детализация брони, кинематографичный свет, стиль фэнтези-арт.

Заметьте, мы не используем сложные конструкции, а просто нанизываем характеристики одну за другой через запятую (или просто в строку, нейросети понимают и так).

Примеры готовых промтов: Еда и предметы

Фуд-фотография — отдельный вид искусства. Чтобы еда выглядела аппетитно, нужно описывать не только продукты, но и их состояние.

Вариант 1 (Бургер):

Сочный чизбургер на деревянной доске, расплавленный сыр стекает по котлете, капли жира, свежие листья салата, блестящая булочка с кунжутом, тёмный фон, профессиональный студийный свет, макросъёмка, высокая детализация текстур, пар идёт от котлеты.

Вариант 2 (Натюрморт):

Старинная книга в кожаном переплёте лежит на дубовом столе, рядом горит свеча в медном подсвечнике, перо и чернильница, пыль в лучах света, атмосфера таинственности, тёплый свет от свечи, реалистичный рендер, текстура старой бумаги.

Такие описания позволяют нейросети «почувствовать» материал и передать его свойства.

Примеры готовых промтов: Абстракция и сюрреализм

Когда логика отключается, начинается настоящее творчество. Здесь можно сочетать несочетаемое.

Вариант 1:

Кот, состоящий из облаков, парит в небе над городом, сюрреализм, мягкие формы, голубые и белые тона, мечтательная атмосфера, высокая детализация, цифровое искусство.

Вариант 2:

Город внутри стеклянной бутылки, плавающей в океане, корабли, крошечные домики, волны бьются о стекло, закатное солнце, магический реализм, яркие цвета, сложное освещение, 8к разрешение.

Главное в таких запросах — дать волю воображению и не бояться экспериментировать с формами и материями.

Русский культурный код

Отечественные нейросети (да и многие зарубежные) отлично понимают нашу специфику. Это открывает простор для создания уникального контента.

Вариант 1 (Сказка):

Избушка на курьих ножках в тёмном дремучем лесу, мох на крыше, свет в окне, мистический туман, стиль русских сказок, иллюстрация Билибина, высокая детализация брёвен, атмосфера таинственности.

Вариант 2 (Ретро):

Советский дворик летом, дети играют в футбол, старые качели, автомобиль Волгу, солнечный свет, ностальгическая атмосфера, плёночная фотография, зернистость, тёплые цвета.

Использование знакомых образов позволяет создавать эмоционально насыщенные изображения, которые откликаются в душе зрителя.

Сложности перевода

И всё же, почему иногда промт на русском не срабатывает в западных сетях? Дело в том, что нюансы языка могут потеряться. Слово «коса» (инструмент) и «коса» (волосы) для переводчика — головная боль. Поэтому, если вы работаете с Midjourney через автоматический переводчик, старайтесь использовать синонимы. Вместо «лук» напишите «овощ лук» или «оружие лук». Вместо «ключ» (родник) — «источник воды». Такие уточнения (в скобках или через тире) помогут избежать курьезов. Кроме того, порядок слов в русском языке не так важен, как в английском, но для нейросети лучше ставить самое важное в начало предложения. Сначала «Кот», потом «Рыжий», потом «На диване». Это повышает шансы на то, что алгоритм правильно расставит акценты.

Влияние длины запроса

Существует миф, что чем длиннее промт, тем лучше результат. На самом деле это не совсем так. Чрезмерно длинные описания могут запутать нейросеть, и она просто проигнорирует половину слов. Оптимальный размер — это 3-5 предложений или набор из 10-15 ключевых тегов. Главное — это не количество слов, а их вес. Слово «гигантский» весит больше, чем «большой», а «разрушенный» конкретнее, чем «старый». Учитесь отсекать лишнее. Не пишите «на картинке изображен красивый пейзаж, который мне очень нравится». Пишите просто: «Впечатляющий горный пейзаж, снежные вершины, горное озеро». Экономия слов позволяет сосредоточить вычислительную мощь на главном.

Генерация и постобработка

Не стоит забывать и о том, что генерация — это лишь первый этап. Полученное изображение часто нуждается в доработке. В графических редакторах можно поправить цветокоррекцию, убрать мелкие огрехи или кадрировать снимок. Однако опытные «промт-инженеры» стараются получить максимум сразу. И для этого они используют параметры соотношения сторон. В Midjourney это команда –ar 16:9 (для широкого экрана) или –ar 9:16 (для сторис). В других сетях это настройки интерфейса. Правильно выбранный формат сразу задает композицию кадра. Ведь вертикальный портрет и горизонтальный пейзаж строятся по совершенно разным законам композиции.

Этика и авторское право

Вопрос, который волнует многих: кому принадлежат права на сгенерированные изображения? С юридической точки зрения ситуация пока остается неоднозначной (во многих странах). Но есть и этическая сторона медали. Использование имен современных художников в промтах вызывает споры в арт-сообществе. Некоторые считают это кражей стиля, другие — данью уважения. Решать, конечно, вам, но создание собственного уникального стиля путем смешивания разных направлений — процесс куда более увлекательный и творческий. Тем более, что нейросети позволяют стать творцом каждому, у кого есть воображение и словарный запас.

Практические советы для старта

С чего же начать свой путь в мир нейроарта? Не пытайтесь сразу создать шедевр всех времён и народов. Начните с простого. Возьмите один предмет, например, «яблоко», и попробуйте изменить его материал. «Стеклянное яблоко», «меховое яблоко», «яблоко из огня». Посмотрите, как меняется свет и фактура. Затем добавьте окружение. «Стеклянное яблоко на снегу». Затем — стиль. «Стеклянное яблоко на снегу в стиле киберпанк». Такой пошаговый метод (итеративный подход) позволяет понять логику работы алгоритма лучше любых учебников. Экспериментируйте с прилагательными, меняйте местами слова, добавляйте и убирайте детали.

Роль насмотренности

Нельзя не упомянуть и о таком важном аспекте, как насмотренность. Чтобы писать хорошие промты, нужно знать, чего вы хотите. Изучайте работы других авторов, анализируйте их запросы (многие сервисы позволяют подсмотреть промт у чужой картинки). Обращайте внимание на то, как свет падает на объектах в кино, как художники работают с цветом. Весь этот багаж знаний неизбежно осядет в вашей голове и в нужный момент всплывет в виде точного и ёмкого слова. Ведь нейросеть — это всего лишь инструмент, кисть в ваших руках. А картина рождается в голове художника.

Стоит ли гнаться за платными сервисами?

Бытует мнение, что качественный результат дают только дорогие подписки. Конечно, Midjourney остается лидером рынка по качеству детализации, однако бесплатные аналоги наступают ему на пятки. Тот же Kandinsky от Сбера или Шедеврум от Яндекса выдают совершенно потрясающие результаты, особенно в стилизации и понимании русского культурного кода. Stable Diffusion требует мощного компьютера, но дает абсолютную свободу и бесплатность. Так что не стоит думать, что отсутствие бюджета — это приговор. Начать можно и с бесплатных телеграм-ботов или веб-версий популярных нейросетей. Главное — желание экспериментировать и учиться.

Вместо послесловия

Мир нейросетевого искусства развивается стремительно. То, что вчера казалось фантастикой, сегодня становится обыденностью. Промт-инжиниринг — это новый язык общения человека и машины, и овладеть им может каждый. Не бойтесь совершать ошибки, ведь каждая неудачная генерация приближает вас к пониманию того, как мыслит цифровой разум. Пробуйте, смешивайте стили, играйте со светом и тенью. И пусть каждый ваш запрос превращается в маленькое цифровое чудо, которое украсит этот мир. Удачи в творческих поисках!