Промты для фото на русском языке (с примерами готовых промтов)

Сколько раз вы вводили запрос в строку генерации, ожидая увидеть шедевр цифрового искусства, а получали нечто несуразное с лишними пальцами или пластиковой кожей? Ощущение, знакомое многим. В сети представлено множество гайдов, утверждающих, что только английский язык способен “достучаться” до нейросети, однако это распространённое заблуждение всё чаще разбивается о реальность. Современные алгоритмы, будь то отечественные разработки вроде Kandinsky и Шедеврума или же монструозные западные модели с встроенными переводчиками, научились понимать великий и могучий довольно неплохо. Но чтобы не ошибиться, нужно не просто переводить слова, а чувствовать логику машины, выстраивая запрос по определённым правилам.

Как работают нейросети с русским языком?

Сразу стоит оговориться: “понимание” у искусственного интеллекта весьма специфическое. Он не видит образов, как мы с вами. Для него слова – это лишь векторы в многомерном пространстве. Когда вы пишете «красивая девушка», нейросеть обращается к своей базе данных и вытаскивает усреднённое, часто шаблонное представление о красоте. А вот если добавить конкретики, результат изменится кардинально. Русскоязычные модели, такие как Кандинский или Шедеврум, обучались на массивах данных, где присутствовал наш культурный код, поэтому запрос «русская тоска в деревне» они поймут куда глубже, чем условный Midjourney. Впрочем, и зарубежные сервисы, прогоняя ваш текст через внутренний переводчик, вполне способны выдать добротный результат, если вы избегаете сленга и двусмысленностей. Главное – угадать с семантикой.

Анатомия идеального запроса

С чего начинается выбор правильной формулировки? С определения структуры. Хаотичный набор слов редко творит чудеса. Представьте, что вы режиссёр на съёмочной площадке, а ИИ – ваш оператор, который выполняет команды буквально. Сначала мы обозначаем главный объект (субъект). Это фундамент. Далее следует описание действия или состояния этого объекта. Затем мы наслаиваем окружение, фон и атмосферу. И только в самом конце стоит добавлять технические параметры: стиль, освещение, тип камеры.

Порядок слов имеет значение. То, что стоит в начале предложения, для алгоритма весит больше. Если вы напишете «Кот в космосе», вы получите кота. Если же напишете «Космос, в котором летит кот», акцент может сместиться на звёзды и туманности, а животное станет лишь малым элементом композиции. К слову, знаки препинания тоже играют роль, хоть и второстепенную. Запятые и точки помогают разграничить смысловые блоки, не давая “красному платью” смешаться с “синим небом” и превратиться в фиолетовую кашу.

Портретная съёмка: готовые решения

Создание портретов – задача не из лёгких. Нюанс в том, чтобы кожа выглядела натурально, а взгляд был живым. Для получения реалистичного фото студийного качества можно использовать конструкцию, где упор делается на детализацию лица и свет.

Попробуем собрать образ:

“Молодая девушка с веснушками, крупные планы, пронзительный взгляд голубых глаз, естественная текстура кожи, лёгкая улыбка, волосы развеваются на ветру, мягкое утреннее освещение, гиперреализм, высокое разрешение 8к”.

Такой запрос даст нам свежий, живой образ без лишней “пластмассовости”.

А если нам нужен мужской портрет с характером? Тут стоит добавить жёсткости.

“Пожилой рыбак с глубокими морщинами, седая борода, уставший взгляд, на голове старая вязаная шапка, идёт дождь, мрачное освещение, драматичная атмосфера, кинематографичный кадр, детальная прорисовка”.

Обратите внимание: мы задаём настроение через погоду и свет. Это работает безотказно.

Ну и, конечно же, нельзя не упомянуть фэшн-съёмку. Здесь важен антураж и стиль одежды.

“Модель в футуристическом костюме из хрома и неона, киберпанк стиль, ночной город на фоне, яркие розовые и голубые огни, неоновая подсветка, взгляд в камеру, профессиональное фото, журнал Vogue”.

Результат, скорее всего, будет глянцевым и броским.

Пейзажи и архитектура

Перейдём к более масштабным сценам. Природа в исполнении нейросетей часто выглядит даже слишком идеально, поэтому нам нужно добавить немного “шероховатости” или специфических погодных условий.

Для любителей спокойствия подойдёт такой вариант:

“Одинокий деревянный домик на берегу горного озера, зеркальное отражение в воде, вокруг густой хвойный лес, туманное утро, рассвет, лучи солнца пробиваются сквозь ветви, спокойствие и умиротворение, фотореалистичность, широкий угол обзора”.

Здесь слова “туман” и “лучи” создают объём и глубину кадра.

Любителям урбанистики стоит поэкспериментировать с текстурами:

“Старая кирпичная стена заброшенного завода, граффити, разбитые окна, прорастающая трава сквозь бетон, пасмурное небо, индустриальный пейзаж, высокая детализация, мрачная эстетика”.

В данном случае слова “разбитые” и “прорастающая” дают тот самый необходимый конфликт живого и мёртвого, который так ценится в художественной фотографии.

А если захочется сказки? Тогда вход идут эпитеты:

“Волшебный лес с гигантскими светящимися грибами, маленькие феи в воздухе, фиолетовая и изумрудная цветовая гамма, магическое сияние, фэнтези арт, 3d рендер, сказочная атмосфера, как в мультфильмах Disney”.

Нейросеть прекрасно понимает отсылки к известным студиям или стилям, это довольно мощный инструмент управления результатом.

Стоит ли указывать технические параметры?

Безусловно. Обыватель часто забывает об этом, полагаясь на случай. Но именно указание техники съёмки превращает картинку в фотографию. Когда вы пишете просто “фото”, ИИ берёт что-то среднее. Но стоит добавить пару терминов, и картинка преображается.

Во-первых, это объективы. Упоминание “широкоугольный объектив” или “рыбий глаз” (fisheye) растянет перспективу, добавив динамики. А фраза “макросъёмка” или “объектив 100mm” заставит алгоритм сфокусироваться на мельчайших деталях, размыв фон.

Во-вторых, это свет. Это же основа фотографии! Используйте такие маркеры: “объёмный свет” (volumetric lighting) для лучей в пыли, “студийный свет” (studio lighting) для идеальных теней на лице, “золотой час” (golden hour) для тёплого, мягкого солнца. “Рембрандтовский свет” создаст драматичный треугольник света на щеке модели. Звучит сложно? На самом деле, нейросети знают эти термины наизусть.

Пример технически насыщенного промта:

“Автомобиль Ford Mustang 1967 года на гоночной трассе, вид сбоку, эффект размытия в движении (motion blur), жёсткий солнечный свет, контрастные тени, снято на Canon 5D Mark IV, объектив 50mm, f/1.8, глубина резкости, фотореализм”.

Такой набор данных практически гарантирует, что машина не будет выглядеть как игрушка.

Стилизация под художников и эпохи

Иногда нам нужно не фото, а имитация искусства. И здесь русский язык справляется отлично, особенно если речь идёт о наших культурных кодах. Попробуйте попросить ИИ нарисовать “деревню в стиле Шишкина” или “портрет в стиле Врубеля”. Результаты могут удивить своей точностью.

Вот интересный вариант для экспериментов:

“Космический корабль в стиле хохломы, чёрная роспись на золотом фоне, узоры из ягод и листьев, традиционный русский стиль, высокая детализация орнамента, 3d модель на белом фоне”.

Такое смешение технологий и фольклора (миксбашинг) часто рождает уникальные визуальные решения.

Или, скажем, советский ретро-футуризм:

“Город будущего глазами советских фантастов 60-х годов, летающие “Волги”, монументальная архитектура, сталинский ампир, красные флаги, солнечный день, плакатная графика, ретро-стиль”.

Тут мы задействуем “память” нейросети о конкретной исторической эпохе и её визуальном языке.

Тем более, что можно миксовать и западные стили:

“Портрет кота в костюме викторианской эпохи, цилиндр, монокль, строгий костюм, масляная живопись, крупные мазки, стиль Ван Гога”.

Словосочетание “крупные мазки” является командой для текстурирования изображения.

Типичные ошибки и подводные камни

Казалось бы, пиши что хочешь – и получай картинку. Но есть нюансы, о которые спотыкается каждый второй новичок. Самая распространённая ошибка – абстракции.

Понятия вроде “любовь”, “успех”, “счастье” или “свобода” для машины слишком размыты. “Истинная любовь” на картинке может превратиться в пару лебедей, сердце или просто держащихся за руки людей. Лучше описывать визуальное проявление чувства: “пара влюблённых смотрит на закат, держась за руки”.

Вторая проблема – отрицания. Человеческий мозг понимает фразу “не красный”, а нейросеть часто видит слово “красный” и игнорирует частицу “не”. В итоге вы получаете именно то, чего не хотели. Вместо “не старый дом” лучше написать “новый современный коттедж”. Позитивные формулировки работают намного точнее.

Также не стоит перебарщивать с длиной. Гигантские “простыни” текста, где описывается каждая пуговица на пальто, скорее запутают алгоритм. Внимание модели рассеивается. Львиная доля успеха зависит от умения выделить главное и отсечь лишнее. Оставьте место для случайности – иногда ИИ додумывает детали лучше, чем мы сами.

Ещё один момент – противоречивые команды. Если вы напишете “яркий солнечный день” и “мрачная готическая атмосфера” в одном запросе, результат будет непредсказуемым. Скорее всего, получится визуальная каша. Логика кадра должна быть цельной.

Особенности работы с Kandinsky и Шедеврум

Поскольку мы говорим о промтах на русском, нельзя обойти стороной отечественные разработки. Они имеют свою специфику. Кандинский, например, отлично понимает сложные культурные отсылки к российской действительности.

Запрос “панелька в спальном районе зимой” для него – родная стихия. Он нарисует именно те серые бетонные плиты и то унылое небо, которое мы видим из окна, тогда как западный аналог может выдать аккуратный европейский кондоминиум. Используйте это. Просите “берёзки”, “балалайки”, “бабушкин ковёр на стене” – и получите колоритный результат.

Шедеврум от Яндекса тоже тяготеет к пониманию контекста. Он хорошо работает с короткими, ёмкими фразами. “Кот-баюн в лесу” сработает лучше, чем длинное описание мифического существа. Тем более, эти сети постоянно дообучаются, и их словарный запас расширяется.

Однако есть и минусы. Детализация лиц в сложных ракурсах у них иногда хромает по сравнению с последними версиями Midjourney. Поэтому для портретов стоит добавлять слова-усилители: “чёткие черты лица”, “высокая детализация глаз”, “правильная анатомия”. Это своеобразный спасательный круг.

Примеры креативных промтов для разных задач

Иногда муза покидает нас, и нужен толчок. Вот несколько готовых шаблонов, которые можно брать за основу и докручивать под себя.

Для рекламного фото еды:

“Сочный бургер на тёмном деревянном столе, сыр плавится и стекает, капли воды на свежих овощах, пар идёт от мяса, драматичное освещение, фуд-фотография, макро, аппетитно, рекламный постер”.

Здесь ключевые слова – “стекает”, “пар”, “капли”. Они создают вкус.

Для создания логотипа или иконки:

“Минималистичный логотип кофейни, контур кофейного зерна в виде совы, векторная графика, плоский стиль (flat design), белый фон, чёрный цвет, простота и элегантность”.

Важно указать “векторная графика” и “белый фон”, чтобы потом было легко вырезать изображение.

Для интерьерного дизайна:

“Просторная гостиная в скандинавском стиле, белые стены, деревянный пол, много естественного света, уютный диван с пледом, зелёные растения в горшках, минимализм, фото для журнала Architectural Digest”.

Упоминание известного журнала сразу задаёт планку качества и стилистики.

А если нужно что-то совсем безумное?

“Астронавт верхом на динозавре на Марсе, ретро-комикс стиль, яркие кислотные цвета, взрывы на фоне, динамичная поза, эпичность, поп-арт”.

Смешивайте несмешиваемое. Нейросети это любят.

Что насчёт 18+ и цензуры?

Тема деликатная, но важная. Большинство публичных нейросетей имеют строгие фильтры (NSFW). Запросы с откровенным содержанием будут заблокированы или смазаны. Однако это не значит, что нельзя создавать привлекательные образы.

Вместо прямых анатомических терминов используйте описания настроения и одежды. “Роковая женщина в вечернем красном платье с открытой спиной, элегантная поза, атмосфера нуара, чувственный взгляд”. Это пройдёт фильтры и даст красивый, эстетичный результат. Грань между эротикой и искусством в промтинге проходит именно по лексике. Не стоит пытаться обмануть систему грубыми словами, лучше действовать тоньше, через намёки и атмосферу.

Будущее промт-инжиниринга на русском

Сфера развивается стремительно. Буквально вчера мы мучились с переводчиками, а сегодня пишем “Нарисуй мне красиво” и получаем вполне сносный арт. Модели становятся умнее, они начинают понимать не только слова, но и контекст, иронию, скрытые смыслы.

Тем не менее, навык правильного составления запросов никуда не денется. Это как умение гуглить – вроде бы умеют все, но находят единицы. Человек, способный точно и образно выразить свою мысль, всегда будет получать от ИИ больше, чем тот, кто ограничивается парой существительных.

Ваш идеальный кадр уже ждёт своего часа где-то в недрах цифрового кода. Экспериментируйте со словами, играйте со стилями, не бойтесь смешивать несовместимое. Ведь творчество – это поиск, и нейросеть здесь выступает отличным напарником. Удачи в генерациях, и пусть каждый ваш промт попадает точно в цель!