Львиная доля пользователей Midjourney довольно быстро осваивает базовые промты — вбивает описание сцены, добавляет пару прилагательных, жмёт Enter и ждёт чуда. Иногда чудо случается. Но чаще результат напоминает что-то среднее между стоковой иллюстрацией и обложкой фантастического романа из девяностых. Ведь нейросеть без точных указаний тяготеет к собственному «вкусу» — усреднённому, гладкому, предсказуемому. А ведь в арсенале генератора есть мощный инструмент тонкой настройки, о котором новички либо не слышали, либо пользуются им вслепую. Речь о параметре —style и целом семействе связанных с ним приёмов, способных превратить типовую картинку в нечто по-настоящему самобытное. Но чтобы не тратить время на хаотичные эксперименты, стоит разобраться в механике этого параметра от и до.
Что скрывается за параметром —style?
Вся суть в том, что Midjourney при генерации каждого изображения опирается на внутреннюю «эстетическую модель» — набор визуальных предпочтений, заложенных разработчиками. Параметр —style позволяет отклоняться от этого усреднённого вкуса в ту или иную сторону. Появился он не сразу: ранние версии движка такой гибкостью похвастаться не могли, и пользователи вынуждены были выкручиваться через многословные текстовые описания. Сейчас же достаточно одной короткой приписки в конце промта, и картинка заметно меняет характер. К слову, путать —style с параметром —stylize (он же —s) не стоит — это совершенно разные вещи, хотя названия и звучат похоже. Первый задаёт тип визуальной подачи, второй регулирует степень художественности в целом.
Нюанс в том, что набор доступных значений для —style зависит от версии модели. В Midjourney V5 существовал один комплект опций, в V6 часть из них убрали, а часть переосмыслили. Да и с появлением режима Niji (заточенного под аниме-эстетику) добавился свой отдельный набор стилей. Поэтому прежде чем экспериментировать, нужно убедиться, какую именно версию движка вы используете — иначе промт просто проигнорирует неизвестный параметр.
Чем —style отличается от —stylize?
Путаница между этими двумя настройками — настоящий бич новичков. Разложить по полочкам тут довольно просто. Параметр —stylize (или сокращённо —s) принимает числовое значение от 0 до 1000. Чем оно выше, тем сильнее нейросеть «украшает» изображение по собственному разумению — добавляет драматичное освещение, насыщает палитру, усложняет композицию. При нулевом значении картинка получается максимально буквальной, почти сухой. А вот —style работает иначе: он переключает саму логику визуальной интерпретации. Это как если бы вы не громкость на колонках крутили, а полностью меняли музыкальный жанр.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Грубый пример: промт «medieval castle on a cliff» с параметром —s 750 выдаст роскошный замок с кинематографическими лучами света, пробивающимися сквозь облака. Тот же промт, но с —style raw, покажет тот же замок куда проще — без лишнего лоска, ближе к документальной фотографии. И вот тут начинается самое интересное. Ведь именно комбинация обоих параметров открывает по-настоящему широкий простор для экспериментов.
Режим raw — спасательный круг для реалистов
Пожалуй, самый популярный вариант использования —style raw. Этот режим снижает влияние встроенной эстетической модели Midjourney и заставляет генератор строже следовать текстовому описанию. Картинка становится менее «приукрашенной», более сдержанной. Особый интерес вызывает то, как raw меняет работу с фотореалистичными промтами — кожа людей перестаёт выглядеть пластиковой, освещение приобретает естественную мягкость, а композиция не стремится к вычурным ракурсам.
Многие считают, что raw — это просто «режим попроще». На самом деле это совсем не так. Дело в том, что стандартный стиль Midjourney довольно агрессивно интерпретирует промт, добавляя от себя детали, которые вы не заказывали. Написали «woman in a park» — получили модель с идеальной кожей на фоне парка, утопающего в золотистом закатном свете, хотя ни о каком закате речи не шло. Режим raw эту самодеятельность урезает. И для тех, кто работает с коммерческими проектами (где важно контролировать каждый элемент кадра), raw становится тем самым спасательным кругом.
Какие ещё значения принимает —style?
Задача не из лёгких — описать все варианты, потому что Midjourney периодически обновляет список. Но основные направления выделить можно. В режиме Niji (аниме-модель) доступны значения —style cute, —style scenic, —style original и —style expressive. Каждый из них смещает визуальный акцент в свою сторону. Cute делает персонажей мягче, округлее, с преувеличенными пропорциями — идеальный вариант для создания стикеров или детских иллюстраций. Scenic, напротив, тяготеет к проработанным фонам и масштабным пейзажам, где персонаж словно растворяется в окружении.
А вот expressive заслуживает отдельного разговора. Этот стиль добавляет в изображение что-то неуловимо «авторское» — мазки становятся более выразительными, палитра смелее, эмоции на лицах персонажей ярче. Ну и, конечно же, original — возврат к эстетике ранних версий Niji, которая у части сообщества до сих пор вызывает ностальгию. Каждый из этих режимов при грамотном использовании творит чудеса, но вслепую переключать их — занятие неблагодарное. Стоит потратить вечер на тестовые генерации с одним и тем же промтом, меняя только значение style, и сохранить результаты для сравнения.
Комбинирование параметров: где начинается настоящая магия
Одиночный параметр — это полдела. Настоящая изюминка появляется, когда —style начинает работать в связке с другими настройками. Во-первых, стоит поэкспериментировать с комбинацией —style raw —s 50 — это даёт предельно сухой, почти репортажный результат. Во-вторых, обратная крайность: —style raw —s 750 создаёт парадоксальный эффект, где сдержанная интерпретация промта сочетается с высокой степенью художественной обработки. Результат бывает довольно неожиданным — и в этом вся прелесть.
Отдельно стоит упомянуть взаимодействие с параметром —chaos. Этот параметр (принимающий значения от 0 до 100) отвечает за разнообразие между четырьмя картинками в одной генерации. При высоком хаосе и включённом raw нейросеть начинает выдавать совершенно непредсказуемые вариации, среди которых порой натыкаешься на жемчужины, которые невозможно было бы получить сознательно. Впрочем, львиная доля результатов при chaos 80–100 окажется непригодной. Это нормально. Такой подход — скорее метод «золотого лота», когда из десятка генераций отбирается одна достойная.
Стоит ли использовать стилевые референсы вместо —style?
С появлением команды —sref (style reference) в Midjourney V6 ситуация кардинально изменилась. Буквально год назад для стилизации приходилось выкручиваться через длинные текстовые описания типа «in the style of watercolor painting with muted tones and visible brush strokes». Сейчас же достаточно скормить нейросети ссылку на референсное изображение, и она попытается воспроизвести его визуальную манеру. Это мощнейший инструмент, который во многих случаях удобнее классического —style.
Но есть подводные камни. Нейросеть не всегда корректно «считывает» стиль с референса — иногда она копирует цветовую палитру, игнорируя текстуру, а иногда наоборот. Тем более что сила влияния референса регулируется через —sw (style weight), принимающий значения от 0 до 1000, где 100 стоит по умолчанию. При значении 1000 нейросеть практически полностью подчиняется стилю референса, порой жертвуя содержанием промта. Золотая середина — где-то в районе 250–400 — обычно даёт самый добротный результат. И вот здесь комбинация —sref и —style raw особенно интересна: raw не даёт нейросети «переукрасить» картинку, а референс задаёт нужное визуальное направление.
Как подобрать оптимальное значение —stylize?
Раз уж мы заговорили о связке параметров, нельзя не упомянуть щепетильный вопрос подбора числового значения —s. Нужно отметить, что дефолтное значение в V6 — сотня. Это довольно нейтральная отправная точка. При —s 0 генератор выдаёт максимально буквальную интерпретацию: что написали, то и получили, без прикрас. Выглядит это зачастую скучновато, но для технических иллюстраций или схем — самое то.
Диапазон от 200 до 400 — любимая территория большинства опытных пользователей. Здесь Midjourney начинает проявлять «вкус», но ещё не перетягивает одеяло на себя. А вот при значениях выше 600 начинается настоящее шоу: нейросеть может полностью переосмыслить композицию, сменить ракурс, добавить элементы, которых в промте не было и в помине. Зрелище бывает впечатляющим, но контроль над результатом стремительно падает. Тем более при сочетании высокого stylize с режимом, отличным от raw, — картинка рискует превратиться в кашу из спецэффектов. Не стоит гнаться за красивыми числами: лучше двигаться с шагом 50–100 и внимательно отслеживать, на каком значении стиль «звучит» гармоничнее всего.
Промт-инжиниринг и стилевые модификаторы в тексте
Сами параметры — лишь половина дела. Вторая половина — грамотно составленный текстовый промт, который работает в унисон с выбранным стилем. Распространённая ошибка — перегружать описание абстрактными эпитетами вроде «beautiful», «amazing», «stunning». Нейросеть на подобные слова реагирует довольно вяло, потому что они не несут конкретной визуальной информации. Куда эффективнее указать конкретную технику: «oil painting with thick impasto texture» сработает в разы лучше, чем «beautiful painting».
К тому же стоит обращать внимание на порядок слов в промте. Midjourney придаёт больший вес тому, что стоит ближе к началу. Если написать «a dark forest with a glowing mushroom», акцент будет на лесе. Переставьте местами — «a glowing mushroom in a dark forest» — и гриб станет главным героем кадра. Этот нюанс многие упускают, а он порой важнее любых числовых параметров. И ещё один неочевидный приём: двойное упоминание. Если хочется, чтобы определённый элемент точно попал в кадр, его можно упомянуть дважды в разных формулировках. Не «red car, red automobile» (это топорно), а что-то вроде «vintage red car parked on a wet street, crimson vehicle reflecting city lights». Нейросеть «поймёт намёк».
Частые ошибки при работе со стилями
Первая и самая распространённая — попытка применить параметр —style с несовместимой версией модели. Каждый раз всплывают вопросы в тематических сообществах: «Почему —style cute не работает?» А ответ прост — потому что cute доступен только в Niji, а человек генерирует в стандартной V6. Ошибка банальная, но встречается с удручающей частотой.
Вторая ошибка — одновременное использование взаимоисключающих модификаторов. Попытка совместить «photorealistic» в промте с —style expressive в Niji — это примерно как просить повара приготовить суши из борща. Результат будет хаотичным. Третья проблема — игнорирование параметра —no (negative prompt). Иногда проще сказать нейросети, чего вы не хотите видеть, чем пытаться описать всё, что хотите. Не стоит забывать об этом инструменте, особенно при стилизации: если raw-режим выдаёт слишком мрачные тона, можно добавить —no dark shadows desaturated — и палитра заметно посветлеет.
Практический рабочий процесс: от идеи до финальной картинки
Начать нужно с формулировки цели. Не «хочу красивую картинку», а конкретно: «нужна обложка для подкаста в стиле ретро-коллажа семидесятых, тёплые тона, зернистая текстура». Когда цель ясна, подбор параметров становится осмысленным процессом, а не лотереей. Далее следует тестовая серия — пять-шесть генераций с разными комбинациями —style и —s при одном и том же промте. Результаты стоит сохранить в отдельную папку с пометками, какие именно параметры использовались (Midjourney, к слову, позволяет просматривать историю промтов, но при большом объёме работы это превращается в настоящие махинации с поиском).
После выбора наиболее удачного направления приходит время тонкой доводки. На этом этапе в ход идут вариации (кнопки V1–V4), апскейл и, если нужно, повторная генерация с чуть скорректированным промтом. Кстати, многие опытные пользователи на финальном этапе специально понижают —s на 50–100 пунктов от тестового значения — это убирает лишний «глянец», который при многократных вариациях имеет свойство накапливаться. А если результат всё равно выглядит чересчур «нейросетевым», можно пропустить изображение через внешний редактор (тот же Photoshop или даже бесплатный Photopea) и добавить лёгкие текстурные шумы, хроматические аберрации или виньетку. Это мелочь, но она порой превращает очевидную генерацию во вполне правдоподобную иллюстрацию.
Нестандартные приёмы стилизации
Приём с «мёртвыми стилями». Суть в том, чтобы указывать в промте не популярные направления (cyberpunk, art deco — ими нейросеть перекормлена), а малоизвестные. Попробуйте «Zorn palette painting» (палитра шведского художника Андерса Цорна, всего четыре пигмента) или «Risograph print» (техника трафаретной печати с характерными неточностями совмещения цветов). Midjourney удивительно хорошо справляется с нишевыми стилями, потому что в обучающей выборке они встречались реже и нейросеть не успела их «замылить» до стандартного шаблона.
Ещё один колоритный приём — «временная капсула». Вместо описания стиля напрямую стоит указать эпоху и носитель: «photograph taken on Kodachrome 64 film in 1973» даст совершенно иной результат, чем просто «vintage photo». Нейросеть подхватывает характерную цветопередачу конкретной плёнки, зернистость, даже типичные для той эпохи композиционные решения. К тому же добавление —style raw к таким промтам усиливает эффект правдоподобия в разы. И вот тут результат приковывает внимание — потому что выглядит не как стилизация, а как настоящий архивный снимок.
Что насчёт коммерческого использования?
Вопрос неоднозначный. С точки зрения подписки Midjourney (платный план) все сгенерированные изображения можно использовать в коммерческих целях. Но стилизация добавляет юридический нюанс: если в промте указано имя конкретного художника (а это один из самых популярных способов задать стиль), готовая картинка может слишком близко подойти к узнаваемой авторской манере. Формально закон об авторском праве не защищает «стиль» как таковой, но на практике всплывут проблемы с репутацией, если заказчик или аудитория распознает заимствование.
Безопаснее всего комбинировать несколько стилевых референсов, размывая прямую ассоциацию с одним конкретным автором. Скажем, вместо «in the style of [Художник]» стоит описать визуальные характеристики его манеры словами: «muted earth tones, visible canvas texture, loose brushstrokes, asymmetric composition». Это даёт похожий эстетический результат, но без прямого указания на источник вдохновения. Да и с этической стороны такой подход выглядит куда более щепетильным — уважение к чужому труду ещё никому не мешало.
Экспериментировать с параметрами Midjourney — процесс не сложный, но кропотливый, требующий терпения и внимательного наблюдения за результатами. Каждый новый промт с изменённым значением —style или —s — это маленький эксперимент, из которого можно извлечь крупицу знания о том, как именно нейросеть «думает». Со временем формируется собственная библиотека проверенных комбинаций, и генерация из лотереи превращается в осознанный творческий инструмент. Удачи в поисках своего визуального почерка — он точно стоит потраченного времени.

