Промты для генерации фото в нейросетях (с примерами готовых промтов)

Ни одна творческая сфера за последние годы не переживала такого бурного потрясения, как визуальное искусство, столкнувшееся с возможностями нейросетей. Казалось бы, ещё вчера для создания качественной иллюстрации требовались годы обучения в художественной академии или дорогостоящее фотооборудование, а сегодня любой желающий может получить шедевр за пару минут. Но так ли всё просто? Сталкиваясь с интерфейсом Midjourney или Stable Diffusion, новичок довольно часто испытывает разочарование: вместо ожидаемой картины на экране появляется нечто странное, с искажённой анатомией или совершенно не той композицией. Иллюзия простоты разбивается о суровую реальность. Ведь машинный разум не умеет читать мысли, он умеет лишь скрупулёзно исполнять команды. Поэтому, чтобы результат не вызывал недоумения, а вызывал восторг, стоит освоить язык общения с искусственным интеллектом — искусство написания промтов.

Как это работает?

Сложно ли понять логику машины? На самом деле, нейросеть — это не волшебная палочка, а огромная база данных, где каждому слову соответствует определённый визуальный образ. Промт (от английского prompt — подсказка) служит тем самым ключом, который открывает нужную ячейку памяти. Львиная доля успеха зависит от того, насколько точно вы сможете описать свою идею. Обыватель часто пишет просто: «кот в космосе». И получает довольно примитивный, скучный результат. Профессионал же действует иначе. Он понимает, что системе нужны детали, стиль, освещение и технические характеристики. Это же правило касается и выбора самой модели: одни тяготеют к фотореализму, другие — к аниме или живописи.

Структура запроса

С чего начинается построение идеального промта? С фундамента. Первым делом стоит определить главный объект. Это может быть портрет девушки, футуристический город или винтажный автомобиль. Сразу после субъекта необходимо добавить действие и контекст. Что делает объект? Где он находится? К слову, порядок слов имеет значение: чем ближе слово к началу запроса, тем больший вес оно имеет для нейросети. Далее следует описание художественного стиля и среды. Здесь в игру вступают такие понятия, как освещение, палитра цветов и настроение. Ну и, наконец, технические параметры, которые задают соотношение сторон, уровень детализации и версию движка.

Фотореализм: Портреты

Самый востребованный жанр — это, безусловно, реалистичные портреты. Создать человека, которого невозможно отличить от живого, — задача не из лёгких, но выполнимая. Для достижения эффекта «фотографии» стоит использовать специфическую терминологию фотографов. Упоминание конкретной камеры и объектива творит чудеса. Например, связка «shot on Sony A7R IV» и «85mm lens» сразу даёт понять алгоритму, что нужно размыть фон (эффект боке) и сделать акцент на лице. Важный нюанс: кожа. Чтобы избежать «пластикового» эффекта, нужно добавить текстуру.

Готовый пример для портрета может выглядеть так:

«Hyper-realistic close-up portrait of a young woman with freckles, natural lighting, shot on 35mm film, grain, detailed skin texture, pores, soft eyes, cinematic lighting, depth of field –ar 3:2»

В данном случае мы указали не только объект, но и технические особенности плёнки, что придаст снимку тот самый «ламповый» антураж. А если хочется чего-то более брутального, подойдёт другой вариант:

«Portrait of an old fisherman with a white beard, wearing a yellow raincoat, storm at sea background, dramatic lighting, rain drops on face, highly detailed, 8k resolution, raw photo style»

Здесь акцент смещён на детализацию и атмосферу стихии.

Освещение и атмосфера

Свет. Именно он формирует объём и настроение кадра. Просто написав «light», вы отдаёте инициативу случаю. А ведь вариантов освещения — великое множество. «Golden hour» (золотой час) зальёт сцену тёплым, мягким светом, идеально подходящим для пейзажей и романтических сцен. «Neon lighting» перенесёт зрителя в атмосферу киберпанка или ночного клуба. «Volumetric lighting» добавит в воздух пылинки и лучи, пробивающиеся сквозь туман или листву. Это выглядит впечатляюще. Также не стоит забывать про «Cinematic lighting» — универсальный маркер для создания киношной картинки с глубокими тенями.

Представьте себе уютную кофейню. Простой запрос даст скучную картинку интерьера. Но стоит добавить правильный свет, и сцена оживает. Пример промта:

«Cozy coffee shop interior, rainy evening, view through a wet window, warm candlelight inside, reflection of city lights on the glass, jazz atmosphere, hyper-detailed, photorealistic, 4k»

Заметьте, как описание погоды и источников света (свечи, городские огни) меняет восприятие. Или другой пример, но уже для студийной съёмки:

«Fashion photography of a model in a red silk dress, rim lighting, dark background, sharp focus, elegant pose, studio lighting setup, softbox reflection in eyes»

Здесь «rim lighting» (контровой свет) очерчивает силуэт, отделяя модель от фона.

Стилизация и искусство

Ограничивается ли всё реализмом? Разумеется, нет. Нейросети — это настоящий кладезь для любителей живописи и графики. Можно попросить искусственный интеллект подражать манере великих мастеров или создавать иллюстрации в современных стилях. Если вы грезят о картинах маслом, стоит использовать такие слова, как «oil painting», «thick brushstrokes» (толстые мазки), «impasto». Для любителей комиксов подойдут маркеры «comic book style», «line art», «vibrant colors».

Допустим, нам нужен пейзаж в стиле импрессионизма. Запрос будет следующим:

«Landscape of a blooming lavender field in Provence at sunset, oil painting style, Vincent Van Gogh style, thick strokes, vibrant blue and orange colors, swirling clouds, artistic, masterpiece»

А вот пример для создания концепт-арта персонажа в стиле фэнтези:

«Full body concept art of a elven warrior in silver armor, magical forest background, glowing sword, digital painting, ArtStation style, intricate details, sharp focus, fantasy illustration»

Упоминание платформы ArtStation часто повышает качество генерации, так как нейросеть обучалась на лучших работах с этого ресурса.

Технические параметры

Сухой язык цифр иногда важнее лирики. В конце промта (особенно в Midjourney) обычно ставятся параметры через двойное тире. Это своего рода тонкая настройка. Самый популярный — соотношение сторон (–ar). Для сторис это 9:16, для киношного кадра — 16:9 или 21:9. Ещё один полезный инструмент — параметр стилизации (–s). Низкие значения делают картинку более точной к запросу, но менее художественной. Высокие же значения дают нейросети творческую свободу. Впрочем, с этим не стоит перебарщивать, иначе результат может уйти слишком далеко от изначальной задумки.

Негативные промты

Чего избегать? Иногда проще сказать, чего на картинке быть не должно. Для этого существуют негативные промты (в Stable Diffusion для них есть отдельное поле, в Midjourney используется параметр –no). Это спасательный круг, когда нейросеть упорно рисует лишние пальцы, размытые лица или водяные знаки. Стандартный набор слов-исключений выглядит так:

«ugly, deformed, noisy, blurry, low quality, watermark, signature, bad anatomy, extra limbs»

Использование этого инструмента позволяет очистить изображение от визуального мусора. Ведь обидно, когда отличный добротный кадр портит какая-нибудь нелепая надпись в углу.

Архитектура и дизайн

Отдельного внимания заслуживает генерация интерьеров и зданий. Дизайнеры и архитекторы всё чаще используют ИИ для поиска вдохновения. Здесь важна точность в описании материалов и стилей. «Loft», «Minimalism», «Baroque» — эти слова задают тон. Но чтобы картинка выглядела профессионально, стоит добавить названия рендер-движков, например, «Unreal Engine 5» или «Octane Render». Это звучит немного странно для обывателя, но для нейросети это сигнал к созданию изображения с идеальным расчётом света и теней.

Попробуем создать современный дом в лесу. Промт:

«Modern architectural house made of glass and concrete in a deep pine forest, morning fog, interior visible through large windows, minimalist design, photorealistic, 8k, architectural photography, architectural digest style»

Ссылка на журнал Architectural Digest добавляет изображению определённый лоск и журнальную эстетику. А если нужно создать дизайн интерьера кухни:

«Luxury modern kitchen design, white marble island, gold fixtures, panoramic window with ocean view, daylight, clean lines, interior design, high resolution, photorealistic render»

Фантастика и абстракция

Где фантазия может разгуляться на полную? Конечно, в нереалистичных сюжетах. Абстрактные понятия, сюрреализм, смешение несовместимого — здесь ИИ часто выдаёт неожиданно гениальные результаты. Можно смешивать биологию и технику, космос и океан. Понятие «биомеханика» или стиль Гигера (создателя Чужого) дают очень фактурные, хоть и мрачные изображения.

Пример для сюрреалистичной сцены:

«Surreal dreamscape, melting clocks in a desert, giant floating whales in the sky, clouds made of cotton candy, Salvador Dali style, vibrant colors, intricate details, dreamlike atmosphere»

Или что-то более технологичное:

«Cyberpunk samurai robot in a rainy neon city, glowing katana, reflections in puddles, intricate mechanical parts, wires and cables, cinematic shot, atmosphere of solitude»

Такие запросы позволяют создать уникальный мир, который невозможно сфотографировать.

Макросъёмка и детали

Маленький мир под большим увеличением выглядит грандиозно. Макросъёмка — это отличный способ проверить способность нейросети прорабатывать мельчайшие детали. Секрет успеха кроется в словах «macro photography», «extreme close-up» и описании текстур. Будь то капля росы на листке или глаз насекомого — результат часто завораживает.

Вот пример запроса для макросъёмки:

«Extreme macro shot of a blue human eye iris, highly detailed texture, reflection of a galaxy in the pupil, eyelashes, 8k resolution, sharp focus, hyper-realistic»

Здесь мы не просто просим глаз, мы просим вселенную внутри него. Или пример с природой:

«Macro photography of a snowflake on a wool scarf, crystalline structure, icy blue tones, depth of field, magical lighting, winter atmosphere»

Ошибки и нюансы

Перегруженность — главный враг хорошего промта. Многие считают, что если написать полотно текста на тысячу знаков, результат будет идеальным. Но на самом деле нейросеть может «запутаться» в обилии противоречивых команд. Лучше использовать короткие, ёмкие фразы, разделённые запятыми. Также не стоит использовать слишком абстрактные понятия без уточнения. Слово «красивый» для машины ничего не значит. Красивый как что? Как закат? Как модель? Как цветок? Конкретика — вот залог успеха. Ещё один подводный камень — грамматика. Нейросети лучше понимают английский язык, поэтому даже если интерфейс позволяет вводить русский текст, качественнее результат будет именно на английском. Тем более, что переводчики сейчас работают довольно сносно.

Специфический лексикон

Существуют слова-усилители, которые помогают «вытянуть» картинку на новый уровень. «Masterpiece» (шедевр), «Trending on ArtStation» (в тренде на ArtStation), «Award winning» (получивший награду). Эти маркеры заставляют алгоритм обращаться к базе данных самых качественных и высокооценённых изображений. Однако не стоит лепить их везде бездумно. Если вы генерируете эскиз карандашом, «photorealistic» будет только мешать.

Финансовый вопрос и доступность

Бьёт ли увлечение нейросетями по бюджету? Вопрос неоднозначный. Midjourney, безусловно, лидер по качеству, но требует платной подписки, и для многих это серьёзное вложение. Однако существует Stable Diffusion, который можно развернуть на своём мощном компьютере совершенно бесплатно. Есть и промежуточные варианты, вроде DALL-E (встроенного в ChatGPT) или Bing Image Creator, которые дают добротный результат и часто доступны бесплатно или за внутренние баллы. Выбор инструмента зависит от целей. Если нужна быстрая картинка для презентации — хватит и простых сервисов. Если же цель — художественный принт или профессиональный дизайн, кошелёк станет легче, но качество того стоит.

Заключение и практика

Получится ли шедевр с первого раза? Скорее всего, нет. Генерация изображений — это процесс перебора, настройки и вечного поиска. Иногда достаточно изменить одно слово, чтобы скучная картинка заиграла красками. Не бойтесь экспериментировать с порядком слов, добавлять странные эпитеты или смешивать стили. Ведь именно в этом творческом хаосе и рождаются уникальные визуальные образы, способные удивить даже самого искушённого зрителя. Удачи в создании ваших цифровых миров, пусть каждый ваш промт попадает точно в цель!