Какие параметры можно изменить в промпте Midjourney: полное руководство

Ни одна нейросеть для генерации изображений не вызывает столько восторга и одновременно столько разочарования, как Midjourney. Восторг — когда с первой попытки получается нечто потрясающее, словно кадр из нереализованного фильма Ридли Скотта. Разочарование — когда вместо фотореалистичного портрета нейросеть выдаёт нечто с шестью пальцами, кривым горизонтом и неведомым артефактом на заднем плане. Львиная доля неудач связана вовсе не с капризами алгоритма, а с тем, что пользователь попросту не знает, какие рычаги управления ему доступны. Ведь промпт в Midjourney — это не просто текстовое описание картинки, а целый набор инструментов, каждый из которых тонко влияет на конечный результат. А чтобы разобраться во всех этих нюансах и перестать получать «кота в мешке», стоит разложить по полочкам каждый параметр, доступный для настройки.

Все топовые нейросети в одном месте

Что такое промпт и из чего он состоит?

Текстовый запрос. Казалось бы, чего проще — напиши, что хочешь увидеть, и жди результата. Но на деле промпт в Midjourney устроен сложнее, чем кажется на первый взгляд. Условно его можно разделить на две большие части: собственно текстовое описание (то, что нейросеть должна сгенерировать) и параметры, которые указываются через двойное тире в конце строки и определяют, как именно генерация будет происходить. Текстовая часть отвечает за содержание — объекты, сцену, настроение и стилистику. А вот параметры — это технические «ручки громкости», которыми регулируется всё остальное: от пропорций холста до степени хаотичности результата. Именно параметры чаще всего игнорируют новички, а ведь в них-то и кроется основная магия.

Соотношение сторон: параметр —ar

Первое, с чего начинается осмысленная работа с Midjourney, — выбор пропорций изображения. По умолчанию нейросеть генерирует квадратную картинку в соотношении 1:1. Это довольно удобно для аватарок и иконок, но совершенно не подходит, скажем, для обложки блога или вертикального постера. Параметр —ar (от английского aspect ratio) позволяет задать нужные пропорции. Например, —ar 16:9 даст широкоформатное изображение, привычное глазу по кинематографу. А —ar 9:16 — вертикальную картинку, идеальную для Stories в социальных сетях. Не стоит забывать и про менее очевидные варианты вроде —ar 3:2, которое тяготеет к классической фотографии, или —ar 21:9 для ультрашироких панорам. Нюанс в том, что при слишком экстремальных пропорциях (допустим, 1:5) нейросеть может «растянуть» композицию и потерять детали, так что с экспериментами стоит быть аккуратнее.

Как управлять хаосом и вариативностью?

Два довольно близких, но всё-таки разных параметра отвечают за то, насколько «дикими» будут результаты генерации. Первый — —chaos (или сокращённо —c). Значение варьируется от 0 до 100, и чем оно выше, тем сильнее разброс между четырьмя вариантами в сетке. При —c 0 все четыре картинки окажутся довольно похожими друг на друга — нейросеть как бы придерживается одной интерпретации промпта. А вот при —c 80 или —c 100 каждый из вариантов может выглядеть так, будто его генерировали по разным запросам. Это настоящий кладезь вдохновения, когда точного видения ещё нет и хочется увидеть максимум идей.

Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸

Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.

Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL

Второй параметр — —weird (или —w). Он работает иначе. Если —chaos разводит варианты между собой, то —weird сдвигает все результаты в сторону необычного, сюрреалистичного и порой откровенно странного. Значение тоже принимает от 0 до 3000. При небольших значениях (250–500) картинки приобретают лёгкую нестандартность, этакую изюминку. А вот при 2000–3000 нейросеть начинает творить чудеса — впрочем, не всегда приятные. Многие считают, что —weird бесполезен, но на самом деле для концепт-арта и абстрактных иллюстраций он незаменим.

Параметр —stylize и степень «художественности»

Вот где начинается самое интересное. Параметр —stylize (или —s) регулирует, насколько сильно Midjourney будет привносить собственное художественное видение в результат. Низкие значения — скажем, —s 0 или —s 50 — заставляют нейросеть максимально точно следовать тексту промпта, почти не «украшая» картинку от себя. Результат при этом может выглядеть несколько сырым, зато он ближе к тому, что было описано. С ростом значения (стандартное — 100, максимальное — 1000) нейросеть всё больше «отпускает поводья» и начинает добавлять эффектное освещение, выразительную цветовую палитру и кинематографичную композицию. Выглядит это впечатляюще, но есть ложка дёгтя: чем выше —stylize, тем меньше контроля остаётся у автора. Дело в том, что нейросеть начинает жертвовать точностью ради красоты. И если в промпте описан строгий минимализм, а —s выкручен на максимум, результат может оказаться далёким от задуманного. Золотая середина у каждого своя, но для начала стоит попробовать диапазон от 100 до 300.

Стоит ли возиться с весами промпта?

Безусловно. Веса — один из самых мощных инструментов точной настройки, и при этом один из самых недооценённых. Синтаксис прост: после нужного слова или фразы ставится двойное двоеточие и число. Например, cat::2 forest::1 говорит нейросети, что кот в два раза важнее леса. Без весов Midjourney сама решает, какой элемент промпта «главнее», и решает она далеко не всегда так, как хотелось бы автору. К тому же существует отрицательный вес — ::-0.5, который помогает убрать нежелательные элементы из картинки. Допустим, если нейросеть упорно добавляет людей в пейзаж, можно дописать people::-0.5, и шансы получить безлюдную сцену заметно возрастут. Впрочем, нет смысла ставить отрицательные веса на всё подряд — это запутывает алгоритм. Лучше сосредоточиться на одном-двух элементах, которые действительно мешают.

Версия модели: параметр —v

Midjourney не стоит на месте. Буквально пару лет назад верхом совершенства считалась четвёртая версия модели, а сегодня доступна уже шестая (и даже её подварианты). Параметр —v позволяет указать, на какой именно версии движка запускать генерацию. Зачем это может понадобиться? Дело в том, что каждая версия по-разному интерпретирует текст и по-разному «рисует». Пятая версия славилась фотореализмом, но порой «замыливала» мелкие детали. Шестая стала гораздо щепетильнее в работе с текстом внутри изображений и в передаче рук (о, эти печально известные руки!). Но у неё своя цветовая палитра и своя манера работы с освещением. Иногда для конкретной задачи старая версия подходит лучше — например, —v 5.2 до сих пор выдаёт потрясающие стилизации. Ну и, конечно же, отдельно стоит упомянуть модель —niji, заточенную под аниме-стилистику. Она живёт по своим законам и прекрасно справляется с иллюстрациями в японской эстетике.

Качество генерации: параметр —quality

Не стоит путать этот параметр с разрешением или детализацией. —quality (или —q) определяет, сколько вычислительного времени нейросеть потратит на каждое изображение. Стандартное значение — 1. При —q 0.25 генерация происходит в четыре раза быстрее, но результат получается менее проработанным — этакий черновой набросок. Это удобно, когда нужно быстро проверить десятки идей и не тратить на каждую полные ресурсы. А при —q 2 (доступно не во всех версиях) нейросеть тратит вдвое больше времени и ресурсов, что иногда — но далеко не всегда — улучшает результат. Подводный камень заключается в том, что повышенное качество «сжигает» больше GPU-минут из подписки. Если подписка базовая, кошелёк станет легче ощутимо быстрее, чем хотелось бы.

Как работает —no и чем он отличается от отрицательных весов?

Параметр —no — это, по сути, быстрый способ исключить что-то из генерации. Вместо того чтобы писать element::-0.5, можно просто добавить в конце промпта —no trees, и нейросеть постарается не рисовать деревья. Разница между —no и отрицательным весом довольно тонкая. Параметр —no работает грубее: он просто «вычёркивает» указанный элемент. А отрицательный вес позволяет задать степень исключения. Для большинства задач —no справляется отлично, тем более что синтаксис у него проще. Но если нужна ювелирная точность, стоит задуматься о весах.

Затравка: параметр —seed

Каждый раз, когда Midjourney генерирует картинку, она использует случайное число — так называемый seed (затравку). Этот параметр определяет начальное состояние «шума», из которого потом вырастает изображение. Если указать конкретное значение — например, —seed 12345 — и при этом не менять остальной промпт, результат будет воспроизводимым. Не на сто процентов идентичным (особенно между разными версиями модели), но очень близким. Зачем это нужно? Допустим, получилась удачная композиция, но хочется немного изменить цветовую гамму или добавить деталь. Фиксируя —seed, можно вносить точечные правки и наблюдать, как каждое изменение в тексте промпта влияет на результат. Без фиксированного сида каждая генерация — это лотерея. С ним — скрупулёзный эксперимент.

Стоит ли использовать —tile?

Об этом параметре знают немногие, а ведь он открывает грандиозные возможности для дизайнеров. —tile заставляет нейросеть генерировать бесшовные текстуры — такие, которые можно «замостить» без видимых стыков. Это настоящий спасательный круг для тех, кто работает с паттернами для обоев, тканей, упаковки или фонов сайтов. Результат, сгенерированный с —tile, после простого дублирования в Photoshop превращается в бесконечный однородный узор. Конечно, не каждый промпт хорошо ложится на бесшовную генерацию. Абстрактные узоры и текстуры (камень, дерево, мозаика) работают идеально, а вот с конкретными объектами вроде животных или людей дело обстоит сложнее.

Параметр —stop и незавершённая генерация

Нетривиальный инструмент. —stop принимает значения от 10 до 100 и буквально останавливает генерацию на указанном проценте. При —stop 50 нейросеть прервёт работу на полпути, и результат будет выглядеть как недорисованный эскиз — мягкий, размытый, с нечёткими контурами. Многие используют это намеренно: недогенерированные изображения обладают своеобразным живописным шармом, напоминающим импрессионистские работы. К тому же такие «заготовки» отлично подходят для последующей доработки в других программах — например, в img2img-пайплайне Stable Diffusion или в Adobe Photoshop с нейрофильтрами. Ещё один сценарий — экономия ресурсов на этапе поиска идеи. Вместо того чтобы «дожигать» генерацию до конца, можно остановиться на семидесяти процентах, оценить направление и уже потом запустить полноценный вариант.

Что насчёт —repeat?

Параметр —repeat (или —r) позволяет запустить один и тот же промпт несколько раз подряд — от двух до сорока повторений в зависимости от уровня подписки. Казалось бы, зачем генерировать одно и то же? Но вся суть в том, что каждый запуск использует новый случайный seed, а значит, результаты будут разными. Это невероятно удобно, когда промпт уже отточен и хочется получить максимум вариантов для выбора. Вместо того чтобы вручную запускать генерацию десять раз, достаточно дописать —r 10 и заняться другими делами. Через несколько минут в канале или личных сообщениях бота появится целая галерея.

Все топовые нейросети в одном месте

Работа с изображениями-референсами

Добротный промпт не ограничивается текстом. Midjourney умеет принимать ссылки на изображения, которые используются как визуальные референсы. Достаточно вставить URL картинки в начало промпта перед текстом, и нейросеть учтёт её стиль, цветовую палитру и общую композицию. А параметр —iw (image weight) позволяет задать, насколько сильно нейросеть будет опираться на этот референс. Значение —iw 0.5 — лёгкий намёк, —iw 2 — практически копирование стилистики. К слову, в шестой версии модели появилась ещё и функция —sref (style reference), которая отделяет стиль от содержания. Если —iw влияет и на композицию, и на палитру, и на объекты, то —sref берёт от референса только визуальный стиль — мазки, текстуры, колорит. Это похоже на то, как художник вдохновляется чужой манерой письма, но рисует совершенно другой сюжет. Отдельно стоит упомянуть параметр —sw (style weight), который регулирует силу влияния стилевого референса от 0 до 1000. Значение по умолчанию — 100, и для большинства задач оно вполне подходит.

Промпт-мультипромпт и разделитель ::

Мало кто из обывателей знает, что двойное двоеточие без пробела — это не только инструмент для весов, но и полноценный разделитель понятий. Midjourney по умолчанию воспринимает словосочетание «hot dog» как единый концепт — хот-дог, то есть булку с сосиской. Но если написать hot:: dog, нейросеть разделит это на два отдельных концепта: «горячий» и «собака». И результат окажется совершенно другим — вполне возможно, появится пёс в окружении пламени. Этот приём особый интерес вызывает при работе со сложными составными понятиями, где Midjourney склонна «склеивать» слова в устоявшиеся значения.

Как выбрать правильную комбинацию параметров?

Задача не из лёгких. Ведь параметры не существуют в вакууме — они взаимодействуют друг с другом, порой довольно неожиданным образом. Высокий —chaos в сочетании с высоким —stylize может выдать абсолютно непредсказуемый, но визуально ошеломляющий результат. А тот же —chaos 100 при —s 0 превратит генерацию в набор сырых, разрозненных эскизов. Опытные пользователи, как правило, начинают с «чистого» промпта — без каких-либо параметров — и смотрят, что выдаёт нейросеть «из коробки». Далее следует точечная настройка: сначала пропорции, потом стилизация, потом хаос. И лишь после нескольких итераций добавляются тонкие инструменты вроде весов и отрицательных промптов. Такой поэтапный подход экономит и время, и нервы, и GPU-минуты.

Мир параметров Midjourney на первый взгляд может показаться запутанным — столько «ручек», двоеточий и числовых значений, что голова идёт кругом. Но стоит провести вечер за экспериментами, и логика начнёт проступать сама собой. Каждый параметр — это не абстрактная настройка, а вполне конкретный способ сказать нейросети: «Мне нужно вот так, а не вот эдак». И чем точнее этот диалог, тем ближе результат к замыслу. Ну, а самый верный добротный совет — не бояться крутить все эти «ручки» и фиксировать удачные комбинации в отдельной заметке. Со временем у каждого складывается свой арсенал любимых настроек, и генерация из лотереи превращается в управляемый творческий процесс. Удачи в укрощении нейросети — пусть каждый промпт приносит именно тот результат, который задумывался.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *