Промты для flux (с примерами готовых промтов)

Казалось бы, сфера нейросетевого искусства уже давно поделена между признанными гигантами, а удивить искушённого пользователя чем-то принципиально новым практически невозможно. Ленты социальных сетей переполнены “пластиковыми” красавицами из Midjourney, а энтузиасты Stable Diffusion годами оттачивают свои сборки, собирая их по крупицам. Но тут на сцену выходит Flux — разработка выходцев из Black Forest Labs, которая моментально приковала внимание комьюнити своей невероятной способностью следовать инструкциям и, что немаловажно, адекватно генерировать текст. И это действительно меняет правила игры. Ведь теперь, чтобы получить желаемый результат, приходится переучиваться писать запросы, отходя от привычных тегов к естественному языку. Поэтому перед началом экспериментов стоит разобраться, как именно “думает” эта модель и какие слова-триггеры творят чудеса.

Чем Flux отличается от конкурентов?

Сложно ли заметить разницу с первого взгляда? На самом деле, довольно просто, если знать, куда смотреть. Главная изюминка Flux заключается в её архитектуре, которая позволяет модели понимать сложные логические связи внутри предложения. Если в старых версиях Stable Diffusion мы привыкли накидывать «салат» из тегов через запятую, надеясь на удачу, то здесь такой подход часто выдаёт посредственный результат. Flux тяготеет к описательному, почти литературному стилю. Ей нужно рассказать историю. К слову, именно эта особенность делает её похожей на DALL-E 3, но с гораздо более гибкими настройками и, разумеется, отсутствием цензуры в локальных версиях. А ещё она наконец-то научилась рисовать пальцы. Да, проблема лишних конечностей всё ещё всплывает, но происходит это довольно редко.

Особый интерес вызывает работа с текстом. Раньше, чтобы добавить надпись на футболку или вывеску, приходилось запускать Photoshop. Flux же справляется с этой задачей играючи. Вы просто пишете в кавычках нужное слово, и оно появляется на изображении именно там, где вы попросили. Это открывает колоссальные возможности для создания логотипов, постеров и обложек без лишних танцев с бубном. Впрочем, идеализировать модель не стоит. Она довольно требовательна к ресурсам (если мы говорим о локальном запуске), и “тяжёлые” версии Dev или Pro могут серьёзно ударить по производительности видеокарты. Но результат того стоит.

Анатомия правильного запроса

С чего начинается построение промта для Flux? С чёткого определения субъекта и действия. Здесь работает правило: чем конкретнее, тем лучше. Не стоит писать просто «девушка в лесу». Модель, конечно, что-то нарисует, но это будет усреднённый, скучный образ. Лучше сформулировать так: «Молодая женщина с рыжими вьющимися волосами стоит в густом туманном лесу, на ней надето зелёное бархатное платье, освещение мягкое и кинематографичное». Чувствуете разницу? Flux обожает детали. Ей важно знать не только кто на картинке, но и во что он одет, какой свет падает, какая камера используется.

Кстати, о камерах. Упоминание конкретной техники и параметров съёмки для этой модели — настоящий спасательный круг. Фразы вроде «shot on 35mm lens», «f/1.8 aperture» или «captured with Sony A7R IV» кардинально меняют восприятие картинки. Изображение перестаёт быть плоским рисунком и приобретает тот самый добротный фотореализм, за которым все и охотятся. Ну и, конечно же, нельзя забывать про стиль. Если вам нужно фото, пишите «raw photo», «realistic». Если же душа просит живописи, уточняйте технику: «oil painting», «watercolor», «illustration».

Важен ли порядок слов? Безусловно. То, что стоит в начале промта, имеет для модели наибольший вес. Поэтому главные объекты и действия выносим вперёд, а детали, освещение и технические параметры оставляем на десерт. А вот негативные промты (Negative Prompts), к которым так привыкли пользователи Automatic1111, во Flux играют гораздо меньшую роль. Зачастую модель прекрасно понимает задачу и без них, а перегруженный негатив может даже испортить композицию.

Фотореализм: примеры и нюансы

Создать человека, которого невозможно отличить от реального — задача не из лёгких. Но Flux справляется с ней на удивление хорошо. Весь секрет кроется в текстуре кожи. Модели предыдущего поколения грешили излишней “гладкостью”, превращая людей в восковые фигуры. Чтобы избежать этого здесь, стоит использовать слова-маркеры, подчёркивающие несовершенства.Попробуем составить запрос для максимально реалистичного портрета. Звучать он будет примерно так:

A raw photo of an elderly fisherman with a weathered face and deep wrinkles, wearing a yellow raincoat, standing on a stormy pier, rain drops on face, intense gaze, cinematic lighting, shot on Fujifilm GFX 100, 85mm lens, sharp focus, high detail.

Здесь мы видим сразу несколько слоёв. Сначала идёт субъект с характерными признаками (weathered face, wrinkles). Затем — контекст (pier, rain). И, наконец, техническая часть, задающая тон всей картинке.

А вот пример для студийной съёмки, где важен свет и макияж:

Fashion portrait of a model with cybernetic makeup, neon lighting reflecting on skin, dark background, glossy texture, shot on Canon EOS R5, studio lighting, softbox, 4k resolution.

В данном случае мы делаем акцент на отражениях и текстуре (glossy), что Flux отрисовывает просто великолепно. Львиная доля успеха здесь зависит от указания источника света. «Softbox» или «Rim lighting» (контровой свет) мгновенно придают объём.

Отдельно стоит упомянуть любительскую эстетику. Сейчас в тренде кадры, мимикрирующие под снимки со смартфонов или старых «мыльниц». Для этого используем следующую конструкцию: «CCTV footage of a night street market» или «Polaroid photo of a friends party in 90s style, flash glare, grainy texture, imperfect composition». Слово «imperfect» (неидеальный) здесь работает как волшебная палочка, добавляя ту самую живую небрежность.

Работа с текстом и типографикой

Написать слово правильно нейросеть просили давно. И Flux наконец-то услышала эти мольбы. Но чтобы магия сработала, нужно соблюдать синтаксис. Текст, который вы хотите видеть на изображении, обязательно должен быть заключён в двойные кавычки, а перед ним лучше поставить глагол-действие: «written», «says», «sign with text».

Представьте, что вам нужно создать неоновую вывеску для киберпанк-бара. Запрос может выглядеть так:

A futuristic neon sign on a brick wall raining night, the sign says “CYBER CAFE” in glowing pink letters, wires hanging around, wet surface reflections, cyberpunk atmosphere.

Модель считает текст в кавычках и перенесёт его на вывеску. Ошибки, конечно, случаются, особенно с длинными фразами, но короткие словосочетания выходят почти всегда корректно.

Другой сценарий — принт на одежде. Это же настоящая находка для дизайнеров мерча. Промт:

A young man wearing a white t-shirt with a text print “JUST DO IT” written in bold black font, standing in a gym, realistic photo, daylight.

Flux понимает не только содержание текста, но и (иногда) указания на шрифт. Можно попробовать добавить «handwritten font» или «gothic style letters», чтобы уточнить стилистику надписи. Тем более, что модель хорошо интегрирует текст в геометрию складок одежды, а не просто лепит его поверх картинки плоским слоем.

Художественные стили и иллюстрация

Не стоит думать, что Flux — это только про фото. С рисованными изображениями она справляется не менее виртуозно. Особенно хорошо ей даются сложные, детализированные иллюстрации в духе современных цифровых художников.Вот пример для создания фэнтезийной иллюстрации:

A digital illustration of a magical floating island with waterfalls, vibrant colors, fantasy style, intricate details, artstation trends, wide angle, soft glowing light.

Обратите внимание, здесь мы убираем упоминания камер и объективов, заменяя их на «digital illustration» и «artstation trends».

Любителям комиксов и графических новелл понравится следующий вариант:

Comic book panel showing a detective smoking in rain, noir style, high contrast, black and white ink drawing, cross-hatching shading, dramatic shadows.

Слова «ink drawing» (чернильный рисунок) и «cross-hatching» (штриховка) дают понять модели, что мы ждём имитацию ручной графики. Выглядит это зачастую очень стильно и самобытно.

А как насчёт чего-то более абстрактного? Попробуем сюрреализм.

Surreal painting of a clock melting over a tree branch in a desert, style of Salvador Dali, oil painting texture, dreamlike atmosphere, vivid colors.

Упоминание конкретных художников всё ещё работает, хотя Flux интерпретирует их стиль довольно вольно, смешивая с собственной базой знаний. Получается некий гибрид, который, впрочем, часто выглядит свежо.

Сложности и подводные камни

Есть ли у этой модели минусы? Безусловно. И главный из них — это “размытость” заднего плана по умолчанию. Flux очень любит боке (размытие фона). Иногда даже слишком. Если вам нужна резкость по всему полю кадра, придётся прописывать это отдельно и настойчиво. Фразы «deep depth of field», «sharp background», «f/8» или «f/16» (закрытая диафрагма) помогают исправить ситуацию. Но иногда модель упорно продолжает “мылить” фон, считая это художественным приёмом.

Ещё один нюанс — статичность поз. Если не задать динамику, персонажи часто стоят столбом, глядя прямо в камеру. Это наследие обучающего датасета, где, судя по всему, преобладали портретные фото. Чтобы “расшевелить” героя, используйте активные глаголы: «running», «jumping», «fighting», «dancing dynamic pose». И добавляйте «action shot» или «motion blur», чтобы усилить эффект движения.

Настройки генерации: что крутить?

Помимо самих слов, на результат влияют параметры генератора. Во Flux они немного отличаются от привычных по SD 1.5.Главный параметр — Guidance Scale (иногда его называют Distilled CFG Scale). Для Flux оптимальное значение лежит в диапазоне от 2.0 до 4.0. Если выкрутить больше, картинка может начать “жариться”, цвета станут кислотными, а детализация превратится в кашу. Обычно значение 3.5 является золотой серединой.Количество шагов (Steps) тоже имеет значение. Flux — модель шустрая (относительно), и хорошие результаты выдаёт уже на 20-25 шагах. Ставить 50 или 100 часто нет смысла — качество не улучшится кардинально, а время ожидания вырастет. Но для версии Flux Schnell (облегчённой) достаточно и 4 шагов. Это же просто спасение для владельцев слабых ПК.

Интерьерный дизайн и архитектура

Архитекторы и дизайнеры тоже найдут во Flux верного помощника. Способность модели соблюдать перспективу и геометрию вызывает уважение. Стены не заваливаются, мебель стоит на полу, а не левитирует.Пример промта для современного интерьера:

Interior design of a spacious living room in minimalist style, large panoramic windows with view on mountains, beige sofa, wooden floor, warm sunlight filling the room, architectural photography, magazine style, symmetrical composition.

Ключевое словосочетание здесь — «architectural photography». Оно заставляет нейросеть выравнивать вертикали и строить правильную композицию кадра.

Если же нужно создать экстерьер здания, попробуйте такой вариант:

Futuristic skyscraper facade covered in vertical gardens, eco-architecture, glass and steel materials, sunny day, blue sky, wide angle shot, photorealistic, high detail.

Добавление материалов (glass, steel) помогает модели правильно передать отражающую способность поверхностей. Выглядит впечатляюще.

Макросъёмка и еда

Один из самых аппетитных жанров — фуд-фотография. Flux генерирует еду так, что хочется немедленно пойти к холодильнику. Текстуры хлеба, блеск соуса, запотевшее стекло бокала — всё это получается очень натурально.Вот промт для создания “вкусной” картинки:

Close-up macro shot of a delicious juicy burger with melted cheese and fresh lettuce, water droplets on ingredients, dramatic food photography lighting, dark background, shallow depth of field, 8k resolution.

Здесь мы используем «macro shot» для максимального приближения. Нюанс в том, что Flux иногда пытается сделать еду слишком идеальной, пластиковой. Чтобы добавить реализма, можно дописать «crumbs on the table» (крошки на столе) или «messy plating» (небрежная сервировка).

Абстракции и фоны

Иногда нужно просто создать красивый фон или абстрактную композицию для веб-дизайна. Flux отлично понимает запросы на текстуры.

Liquid gold texture mixed with black oil, swirling patterns, glossy surface, top view, abstract art, 3d render style, high contrast.

Такие изображения отлично подходят для обоев на рабочий стол или подложек для сайтов. А главное, они уникальны и не требуют покупки на стоках.Или, например, геометрическая абстракция:

Isometric composition of colorful matte cubes and spheres, pastel colors, soft lighting, 3d render, minimal design.

Чистота линий и мягкость теней у этой модели на высоте.

Настраиваем Flux под себя

Можно ли улучшить работу модели? Энтузиасты уже вовсю тренируют LoRA (дополнительные мини-модели) для Flux. Они позволяют добавить конкретные стили, лица или объекты, которых нет в базовой версии. Процесс подключения LoRA не сложный, но кропотливый, особенно если вы используете интерфейс ComfyUI. Но результат того стоит. С помощью LoRA можно научить Flux рисовать в стиле советских открыток, аниме 90-х или делать фото в стилистике конкретного плёночного фотоаппарата.Однако стоит помнить, что Flux — модель довольно “упрямая”. Перебить её базовый стиль иногда сложнее, чем кажется. Она стремится к реализму, и чтобы получить, скажем, детский рисунок мелками, придётся очень постараться с подбором слов.

Выводы и напутствие

Окунуться в мир Flux — это как пересесть с надежного, но старого седана в современный электрокар. Сначала непривычно: кнопки не там, педали реагируют иначе, но скорость и комфорт захватывают дух. Да, придётся потратить время на изучение новых конструкций промтов. Да, придётся забыть про старые привычки нанизывания тегов. Но та свобода, которую даёт понимание естественного языка, открывает двери для настоящего творчества. Не бойтесь экспериментировать со светом, ракурсами и стилями. И главное — не скупитесь на слова. Описывайте то, что хотите увидеть, так, словно рассказываете об этом другу. Удачи в генерациях, и пусть каждый ваш промт превращается в маленький шедевр!