Нейросети для генерации изображений буквально за пару лет превратились из забавной игрушки в серьёзный рабочий инструмент — дизайнеры, маркетологи и даже архитекторы всё чаще прибегают к ним, когда нужно быстро визуализировать идею. Midjourney среди подобных сервисов занимает особое место: картинки на выходе получаются настолько выразительными, что отличить их от работы живого иллюстратора порой довольно сложно. Но вот парадокс — львиная доля новичков ограничивается парой слов в промте, даже не подозревая, какой арсенал тонких настроек скрывается за лаконичным интерфейсом бота. А ведь именно параметры и стили превращают случайный результат в осознанное творчество, поэтому разобраться в них стоит ещё до первой серьёзной генерации.
Что такое параметры и зачем они нужны?
Параметры в Midjourney — это своего рода рычаги управления, которые дописываются в конце текстового промта через двойное тире. Без них нейросеть сама решает, какие пропорции выбрать, насколько «вольно» интерпретировать запрос и в каком стиле отрисовать сцену. Результат при этом бывает неожиданным. Иногда приятно неожиданным, а иногда — удручающе далёким от замысла. Дело в том, что алгоритм по умолчанию тяготеет к усреднённым значениям, и без явных указаний он выдаёт нечто «на свой вкус». Стоит добавить хотя бы пару параметров — и контроль над картинкой резко возрастает. Это как переключиться с автоматического режима фотоаппарата на ручной: результат зависит уже не от электроники, а от вашего понимания процесса.
Соотношение сторон и разрешение
Первое, с чего начинается осознанная работа, — формат изображения. Параметр —ar (от английского aspect ratio) задаёт соотношение сторон. По умолчанию Midjourney генерирует квадрат 1:1, но стоит указать —ar 16:9, и на выходе получится широкоформатная панорама, идеально подходящая для обложки сайта или баннера. Для вертикальных форматов — скажем, сторис в соцсетях — подойдёт —ar 9:16. А вот классическое —ar 3:2 напоминает пропорции фотоплёнки и придаёт кадру кинематографичность. Нюанс в том, что слишком экстремальные соотношения (например, 1:5) нейросеть обрабатывает хуже: композиция «расползается», объекты деформируются. Не стоит гнаться за необычными пропорциями ради самих пропорций — лучше отталкиваться от конкретной задачи.
Вопрос разрешения тоже всплывает довольно часто. Midjourney по умолчанию генерирует изображения с базовым разрешением около 1024×1024 пикселей (в пятой и шестой версиях). Для увеличения до печатного качества существует встроенный апскейл, а также сторонние инструменты вроде Topaz Gigapixel. Но тут важно понимать: апскейл не дорисовывает детали волшебным образом, он лишь «растягивает» то, что уже заложено в картинку. И если исходник получился размытым или шумным, никакое масштабирование чуда не сотворит.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Стилизация: параметр —stylize
Пожалуй, самая неоднозначная настройка. Параметр —stylize (сокращённо —s) управляет тем, насколько «художественно» нейросеть интерпретирует промт. Значение варьируется от 0 до 1000. При нуле Midjourney старается следовать запросу буквально — никакой отсебятины, минимум эстетических вольностей. Выглядит это порой скупо, зато точно. На противоположном полюсе — значение 1000, при котором алгоритм пускается во все тяжкие: добавляет декоративные элементы, усиливает контрасты, выкручивает палитру до предела. Красиво? Безусловно. Но исходный замысел может утонуть в этом визуальном бомонде.
Золотая середина для большинства задач — значения в диапазоне от 100 до 250. При —s 100 картинка сохраняет баланс между точностью и эстетикой, а при —s 250 нейросеть позволяет себе чуть больше «художественной свободы», оставаясь при этом в рамках промта. К слову, значение по умолчанию — 100, так что если вы ни разу не трогали этот параметр, то уже работали именно с ним. Стоит поэкспериментировать с крайностями хотя бы разок — чтобы прочувствовать, как именно стилизация влияет на результат.
Как работает —chaos?
Хаос. Само слово звучит пугающе, но в контексте Midjourney этот параметр — настоящий кладезь сюрпризов. —chaos (или —c) определяет степень разнообразия в сетке из четырёх изображений, которую бот выдаёт на каждый запрос. При значении 0 все четыре картинки будут довольно похожи друг на друга — как вариации одной и той же композиции. А вот при —c 100 каждая из четырёх превращается в отдельную интерпретацию промта, иногда радикально отличающуюся от соседних.
Зачем это нужно? Когда вы ищете свежую идею и сами толком не знаете, чего хотите, высокий хаос выручает. Он работает как мозговой штурм: подбрасывает неожиданные ракурсы, цветовые решения и композиционные ходы. Но если задача конкретная — скажем, нарисовать логотип строго по ТЗ — хаос лучше свести к минимуму. Ведь каждый «лишний» вариант отнимает генерацию, а бюджет подписки не резиновый. Да и время дорого.
Параметр —quality и его подводные камни
Многие считают, что —quality (или —q) напрямую влияет на «красоту» картинки. На самом деле всё несколько сложнее. Этот параметр определяет, сколько вычислительных ресурсов нейросеть потратит на генерацию одного изображения. Значение по умолчанию — 1. При —q 0.25 бот работает в четыре раза быстрее, но с ощутимой потерей деталей. При —q 2 (если версия поддерживает) время генерации удваивается, а на выходе — более проработанные текстуры и мелкие элементы.
Ложка дёгтя: разница между —q 1 и —q 2 далеко не всегда бросается в глаза. Для простых сцен (один объект на однотонном фоне) повышенное качество практически ничего не меняет. Зато для сложных многофигурных композиций, насыщенных деталями, разница ощутима. Тем более что каждая генерация с —q 2 «съедает» вдвое больше GPU-минут из подписки. Не стоит бездумно выкручивать этот параметр на максимум — разумнее приберечь ресурсы для по-настоящему ответственных работ.
Версии модели: —v и —niji
Midjourney развивается стремительно. Буквально полтора года назад пятая версия модели казалась вершиной возможностей, а сейчас на дворе уже шестая (и на подходе седьмая). Параметр —v позволяет указать конкретную версию движка. Зачем это бывает нужно? Каждая версия отличается стилистикой: пятая тяготеет к фотореалистичности, шестая лучше работает с текстом на изображениях и точнее следует длинным промтам. Иногда для определённой задачи старая версия подходит лучше — скажем, —v 4 давала тот самый «живописный» эффект, который в более поздних итерациях сгладился.
Отдельно стоит упомянуть режим —niji. Это специализированная модель, заточенная под аниме и японскую иллюстрацию. Разрабатывалась она совместно со Spellbrush, и результаты действительно впечатляют: персонажи получаются выразительными, линии — чистыми, палитра — характерной для манги. Для всего, что связано с анимационной стилистикой, —niji работает на порядок лучше базовой модели. Впрочем, для фотореалистичных портретов или архитектурных визуализаций этот режим совершенно не годится — тут нужно понимать границы инструмента.
Негативный промт: что скрывается за —no?
Бывает так: промт составлен идеально, пропорции выставлены, стилизация подобрана, а на картинке всё равно появляется что-то лишнее. Деревья, которых вы не просили. Люди на заднем плане. Водяные знаки. Вот тут на помощь приходит параметр —no. По сути, это негативный промт — список того, чего на изображении быть не должно. Написали —no trees, people — и нейросеть постарается исключить деревья и людей из генерации.
Работает ли это безупречно? Нет. Ведь Midjourney — не редактор с ластиком, а генеративная модель, и «убирать» объекты ей сложнее, чем добавлять. Иногда нежелательные элементы всё равно просачиваются, особенно если они тесно связаны с остальной сценой. К тому же перегружать —no большим количеством слов тоже не стоит — алгоритм начинает «путаться» и может выдать совсем неожиданный результат. Два-три исключения — оптимально. Больше — уже рискованно.
Стоит ли разбираться в —weird?
Экспериментальный параметр. Появился относительно недавно, и многие о нём даже не слышали. —weird (или —w) добавляет в генерацию долю «странности» — необычные ракурсы, сюрреалистические сочетания, нестандартные цветовые решения. Значение от 0 до 3000, где 0 — стандартная генерация, а 3000 — настоящий калейдоскоп абсурда. На практике значения выше 500 уже дают ощутимо «безумные» результаты: объекты сращиваются, пространство искривляется, а логика композиции уступает место чистому визуальному эксперименту.
Кому это нужно? Прежде всего художникам, ищущим вдохновение. Дизайнерам обложек, работающим в жанрах фантастики и хоррора. Создателям концепт-арта, которым важно выйти за рамки привычного. А вот для коммерческих задач — интернет-магазинов, презентаций, корпоративной графики — —weird скорее помеха. Тем более что высокие значения довольно сильно бьют по предсказуемости результата.
Веса в промте и параметр —iw
Тонкий инструмент. В Midjourney можно не просто описать желаемое изображение словами, но и загрузить референс — картинку, на которую нейросеть будет ориентироваться. Параметр —iw (image weight) определяет, какой «вес» придаётся загруженному изображению по сравнению с текстовым описанием. При —iw 0.5 текст доминирует, а картинка служит лишь лёгким намёком. При —iw 2 ситуация обратная — нейросеть максимально копирует стиль и композицию референса, а текст отходит на второй план.
Эта настройка — настоящий спасательный круг для тех, кто работает с брендбуками и фирменным стилем. Загрузил мудборд или пример из каталога, выкрутил —iw повыше — и получил результат, стилистически близкий к оригиналу. Но тут есть подводный камень: слишком высокий вес изображения превращает генерацию в банальное копирование, а это уже территория авторских прав. Да и творческой ценности в таком подходе немного. Золотая середина снова где-то в районе 1–1.5.
К слову, помимо веса изображения существуют ещё и веса отдельных частей текстового промта. Записываются они через двойное двоеточие: sunset::2 ocean::1 — в этом случае закат будет «звучать» в два раза громче, чем океан. Механика довольно простая, но результаты порой удивляют. Особый интерес вызывают отрицательные веса (например, trees::-0.5), которые работают похоже на —no, только тоньше и точнее.
Стили и эстетические настройки
Кроме числовых параметров, в Midjourney есть целый пласт стилевых указаний, которые вписываются прямо в текст промта. Хотите фотореалистичное изображение — добавляете «photorealistic» или «photograph». Нужна акварель — «watercolor painting». Ретрофутуризм, арт-деко, киберпанк, импрессионизм — нейросеть понимает сотни стилевых направлений и откликается на них с разной степенью точности. Ведь именно стиль задаёт эмоциональную тональность изображения, и менять его — всё равно что менять жанр фильма при одном и том же сюжете.
Нужно отметить, что Midjourney версии 6 обзавелась ещё и параметром —style, который принимает предустановленные значения — raw, к примеру. Режим —style raw снижает «фирменную» эстетику Midjourney (ту самую глянцевую, немного «пересвеченную» красоту) и выдаёт более нейтральные, приближённые к реальности изображения. Это бывает крайне полезно, когда нужен документальный, а не рекламный стиль. Многие фотографы-концептуалисты перешли именно на raw, потому что он даёт материал, ближе всего напоминающий необработанный снимок.
Как сочетать параметры между собой?
Задача не из лёгких. Ведь параметры не работают изолированно — они взаимодействуют, и результат этого взаимодействия бывает непредсказуемым. Высокий —chaos в сочетании с высоким —stylize превращает генерацию в лотерею: картинки получаются яркими и разнообразными, но совершенно неуправляемыми. А вот —chaos 0 плюс —s 0 — другая крайность: результат сухой, буквальный, предсказуемый до скуки.
На практике опытные пользователи нередко начинают с «разведочной» генерации — высокий хаос, средняя стилизация, дефолтное качество. Из четырёх получившихся вариантов выбирают наиболее перспективный, а затем переделывают его с уточнёнными параметрами: снижают хаос, подкручивают стилизацию, при необходимости включают —no для исключения ненужных элементов. Этот метод последовательного сужения — пожалуй, самый эффективный подход для новичков. Он экономит и время, и GPU-минуты, да и нервы тоже.
Промт-инжиниринг: несколько практических нюансов
Сам промт — это не совсем параметр, но без грамотно составленного текста никакие —ar и —stylize не помогут. Первый совет, которым делятся все опытные «миджорнисты»: конкретика важнее абстракции. «Красивый пейзаж» — это практически ни о чём. «Туманное утро в сосновом лесу, лучи солнца пробиваются сквозь кроны, на переднем плане — мшистый валун» — совсем другое дело. Нейросеть тяготеет к деталям, и чем больше «зацепок» вы ей дадите, тем ближе к задуманному окажется результат.
Следующий важный момент — порядок слов в промте. Midjourney придаёт больший вес словам в начале текста. Поэтому главный объект сцены стоит ставить первым, а уточнения — после него. Среда, освещение, настроение, стилистика — всё это идёт следом. Кстати, многие забывают про указание камеры и объектива: «shot on Canon EOS R5, 85mm lens, shallow depth of field» — такая приписка порой творит чудеса с фотореализмом. И ещё один нюанс: короткие промты (до пяти слов) Midjourney интерпретирует вольнее, чем длинные. Это не хорошо и не плохо — просто стоит учитывать при работе.
Repeat, seed и другие «скрытые» параметры
Есть несколько менее известных настроек, о которых новички узнают обычно не сразу. Параметр —seed задаёт «зерно» — числовое значение, от которого отталкивается генератор случайных чисел внутри нейросети. Если указать одинаковый сид при одинаковом промте, результат будет воспроизводимым (или почти воспроизводимым — мелкие отличия всё же возможны). Это удобно, когда нужно сравнить влияние разных параметров на одну и ту же сцену: меняешь, допустим, только —stylize, а сид оставляешь прежним.
Параметр —repeat (или —r) позволяет запустить один и тот же промт несколько раз подряд. На первый взгляд — расточительство. Но для конкурсов, где нужно выбрать лучшее из десятков вариантов, функция незаменима. А —tile превращает изображение в бесшовный паттерн — находка для дизайнеров текстильных принтов и фоновых текстур. Ну и, конечно же, —stop: этот параметр прерывает генерацию на определённом проценте завершения (от 10 до 100). При —stop 50 картинка выглядит «недорисованной», полупрозрачной, слегка абстрактной — и иногда именно такой эффект оказывается изюминкой всей работы.
Частые ошибки новичков
Первая и самая распространённая — попытка «впихнуть» в промт всё и сразу. Десяток объектов, три стиля, пять настроений, да ещё и параметры на максимум. Результат получается мутный, перегруженный, далёкий от каждого из описанных элементов. Нейросеть — не всемогущий художник, а скорее добротный исполнитель, которому нужны чёткие рамки. Чем яснее задача, тем точнее результат. Это, пожалуй, главный постулат работы с Midjourney.
Вторая ошибка — игнорирование отрицательного промта. Многие мучаются с нежелательными элементами, переформулируя основной текст снова и снова, хотя одно коротенькое —no решило бы проблему за секунду. Третья — слепое копирование чужих промтов из интернета без понимания того, что за каждым параметром стоит. Промт, идеально работающий в пятой версии модели, в шестой может выдать совершенно иной результат. Да и стилистические предпочтения у каждого свои. Не стоит гнаться за чужими «рецептами» — лучше потратить вечер на эксперименты со своими, благо бесплатных генераций для этого вполне хватит.
Ну, а третий подводный камень — переоценка параметра —quality. Новички часто думают, что —q 2 автоматически превращает посредственный промт в шедевр. Увы. Качество генерации определяется прежде всего текстовым описанием, а —q лишь добавляет деталей к тому, что уже «решено» нейросетью на этапе интерпретации промта. Без хорошего текста высокий —quality — это как дорогая рама для пустого холста.
Midjourney продолжает развиваться с впечатляющей скоростью, и параметры, актуальные сегодня, через полгода могут измениться до неузнаваемости. Но понимание логики — зачем нужен каждый «рычаг» и как он взаимодействует с остальными — останется с вами надолго. Освоив базовые настройки, экспериментируя со стилями и не боясь ошибаться, вы довольно скоро начнёте чувствовать инструмент интуитивно. А там и до собственного визуального почерка недалеко. Удачи в творческих экспериментах — пусть каждая генерация приближает вас к той самой идеальной картинке, которая давно живёт в воображении.

