Любой, кто хотя бы пару вечеров провёл в Midjourney, знает это чувство: нейросеть выдаёт почти идеальную картинку, но какая-нибудь мелочь всё портит. То лицо персонажа «поплыло», то фон оказался слишком пёстрым, то рука с шестью пальцами приковывает внимание сильнее, чем весь остальной арт. Раньше приходилось заново прогонять промт, молясь на генератор случайных чисел. Сейчас же у пользователей под рукой довольно мощный инструмент тонкой доработки — функция Vary, которая способна перерисовать фрагмент изображения, не трогая остальное. Но чтобы извлечь из неё максимум, стоит разобраться в нюансах.
Что такое Vary и зачем она вообще нужна?
Vary — это, по сути, механизм контролируемой вариации. Дело в том, что при стандартной генерации Midjourney каждый раз создаёт изображение «с чистого листа», опираясь на промт и случайный seed. А Vary берёт уже готовый результат и вносит в него точечные изменения, сохраняя общую композицию и настроение. Появилась эта функция не сразу — её добавили начиная с пятой версии модели, а по-настоящему удобной она стала в версии 5.2 и позднее. К слову, львиная доля пользователей до сих пор путает Vary с обычным Reroll, хотя разница между ними принципиальная. Reroll полностью перегенерирует картинку, тогда как Vary работает скорее как хирургический скальпель — аккуратно и прицельно.
Нельзя не упомянуть и другой важный момент. Midjourney предлагает два режима вариации: Vary (Subtle) и Vary (Strong). Первый вносит минимальные коррективы — чуть-чуть меняет текстуры, слегка корректирует освещение, подправляет мелкие детали вроде складок на одежде или блика в глазах. Второй же действует смелее и может ощутимо перекроить отдельные элементы, сохраняя при этом каркас исходника. Выбор между ними зависит от того, насколько сильно текущий результат отличается от задуманного. И если расхождение невелико, не стоит сразу бросаться к Strong — тонкая настройка через Subtle даёт куда более предсказуемый результат.
Vary (Region) — хирургия для изображения
Настоящая изюминка. Именно Vary (Region) превращает Midjourney из лотереи в полноценный рабочий инструмент. Суть проста: пользователь выделяет конкретную область на картинке — прямоугольником или произвольной кистью — и задаёт новый промт только для этого участка. Всё остальное изображение нейросеть не трогает. Звучит просто, но подводных камней хватает.
Нереальный визуал и кинематографичное видео в пару кликов 🎬
Нужен крутой концепт-арт, реалистичная анимация или профессиональный апскейл? Теперь у вас есть единый доступ к лучшим визуальным нейросетям планеты: Midjourney, Runway, Kling и Sora. Улучшайте качество готовых роликов до максимума с помощью встроенных ИИ-инструментов. Никаких сложных настроек, мощного ПК или зарубежных карт. Всё работает прямо в браузере или в Telegram-боте!
Откройте новые горизонты для творчества. Жмите на ссылку, регистрируйтесь и создавайте шедевры 👉 https://clck.ru/3RNCRL
Во-первых, размер выделенной области имеет значение. Если захватить слишком маленький фрагмент (менее 20% от общей площади картинки), модель с большой вероятностью проигнорирует правки или внесёт едва заметные изменения. Во-вторых, стоит помнить, что Midjourney «видит» контекст всего изображения, и если попросить вставить в зимний пейзаж пальму через Region, результат вряд ли порадует — нейросеть попытается согласовать добавленный объект с окружением, но довольно часто терпит фиаско на таких контрастных задачах. Ну и, наконец, есть нюанс с границами: переход между перерисованной областью и оригиналом иногда получается с заметным «швом». Это особенно бросается в глаза на однородных текстурах вроде неба или воды.
Как правильно выделять область?
Задача не из лёгких. Ведь от того, насколько грамотно очерчена зона редактирования, зависит весь результат. Прямоугольная рамка работает быстрее и удобнее для крупных элементов — фона, архитектурных объектов, больших деталей одежды. А вот для мелкой правки (глаза персонажа, украшение на шее, отдельный цветок в букете) лучше подходит инструмент свободного выделения, напоминающий кисть. Этот «лассо»-режим позволяет обвести нужный участок с точностью до пикселя, хотя на практике такая скрупулёзность редко требуется.
Важный совет — не стоит выделять область «впритык» к объекту, который нужно изменить. Лучше захватить небольшой запас вокруг, буквально на 10–15% больше. Это связано с тем, что модели проще вписать новый элемент, когда она «видит» окружающий контекст прямо внутри рабочей зоны. Без этого запаса границы получаются резкими. А если ещё вспомнить, что Midjourney пересчитывает только выделенный фрагмент, становится очевидным: чем больше «подсказок» из окружения попадёт в рамку, тем естественнее будет склейка.
Промт для Region — тот же, но другой
Многие считают, что при использовании Vary (Region) нужно просто повторить исходный промт, дописав нужные изменения. На самом деле это не совсем так. Когда открывается окно Region, пользователь может ввести совершенно новый текстовый запрос, который будет применяться только к выделенной области. Причём оригинальный промт всей картинки продолжает действовать как фоновая директива — он задаёт общий стиль, палитру и атмосферу. А региональный промт работает поверх него, уточняя детали.
Вся суть в том, чтобы не дублировать информацию. Если в основном промте уже указано «cinematic lighting, 8k, photorealistic», нет смысла повторять это в региональном запросе. Достаточно написать конкретику: «golden necklace with emerald pendant» или «red brick wall with ivy». Короткие точные промты для Region дают куда более стабильные результаты, чем длинные описания на полстраницы. К тому же перегруженный промт сбивает нейросеть с толку, и она начинает «галлюцинировать» — добавлять лишние объекты или искажать пропорции.
Стоит ли комбинировать Subtle и Region?
Безусловно. И это, пожалуй, самая эффективная стратегия для тех, кто хочет добиться от Midjourney результата, максимально близкого к задуманному. Схема выглядит примерно так: сначала из четырёх миниатюр (grid) выбирается наиболее удачный вариант через Upscale. Затем, если общая картинка устраивает, но хочется чуть-чуть подкрутить атмосферу — мягче тени, теплее свет — применяется Vary (Subtle). Эта операция занимает буквально секунды и часто творит чудеса с настроением изображения. А уже после этого, если осталась какая-то конкретная деталь, которая не даёт покоя, в дело вступает Vary (Region).
Впрочем, обратный порядок тоже имеет право на жизнь. Иногда проще сначала убрать раздражающий элемент через Region, а потом «отполировать» всё через Subtle. Тем более что каждая итерация вариации создаёт новый сид, и откатиться назад к промежуточному результату можно в любой момент — достаточно сохранить job ID. Это действительно удобно. Ведь экспериментировать без страха потерять удачный вариант — кладезь спокойствия для любого дизайнера.
Частые ошибки при работе с Vary
Одна из самых распространённых проблем — попытка изменить через Vary то, что нужно менять через промт. Допустим, пользователь сгенерировал портрет человека в деловом костюме, но хочет полностью сменить позу — из фронтальной в профильную. Vary с такой задачей не справится, потому что общая композиция для неё — неприкосновенный каркас. Тут нужен новый промт или как минимум существенная переработка через Strong. И даже Strong не гарантирует кардинальной смены ракурса.
Другая ложка дёгтя — злоупотребление итерациями. Каждое последовательное применение Vary слегка «размывает» исходное качество, словно многократная перезапись аудиокассеты. После трёх-четырёх итераций подряд изображение может потерять чёткость мелких текстур, а цвета начнут «плыть» в непредсказуемую сторону. Не стоит загонять один и тот же арт через бесконечный цикл правок. Если после двух-трёх попыток результат по-прежнему далёк от идеала, разумнее вернуться на этап промта и переформулировать запрос. Да и по кошельку бесконечные итерации бьют ощутимо — минуты GPU складываются в часы быстрее, чем кажется.
Как сохранить стиль при региональных правках?
Эстетическая целостность — вот что отличает добротный результат от «франкенштейна», сшитого из кусков. Когда Vary (Region) перерисовывает фрагмент, она опирается на стиль всего изображения, но не всегда угадывает точно. Особенно часто проблемы всплывают при работе с иллюстрациями в выраженном авторском стиле — аниме, пиксельарт, акварель. Нейросеть может вставить в акварельную картину элемент, отрисованный ближе к фотореализму, и весь антураж рушится.
Спасательный круг здесь — параметр —style в сочетании с —sref (style reference), появившийся в более поздних версиях Midjourney. Указав ссылку на референсное изображение через —sref, пользователь фиксирует стилистику, и Region начинает ориентироваться на неё при перерисовке фрагмента. Это не панацея, но в большинстве случаев результат получается заметно более согласованным. К тому же стоит дублировать в региональном промте ключевые стилистические слова из основного: если в оригинале было «watercolor illustration, soft edges, muted palette», те же маркеры нужно вписать и в запрос для области.
Практический сценарий: портрет с правкой фона
Допустим, получился выразительный портрет женщины в стиле ренессансной живописи, но фон — какая-то невнятная серо-коричневая мешанина, больше напоминающая грязную стену, чем благородный интерьер. Начать нужно с апскейла понравившегося варианта. Дальше — кнопка Vary (Region). Инструментом прямоугольного выделения захватывается весь фон вокруг фигуры, стараясь не задеть контур волос и плеч (тут как раз пригодится запас в 10–15%, о котором говорилось выше). В региональный промт вписывается что-то вроде «ornate Renaissance interior, marble columns, warm candlelight, oil painting texture». И через несколько секунд нейросеть выдаёт четыре варианта того же портрета, но уже с изысканным интерьером на заднем плане.
Если ни один из четырёх результатов не устроил — не беда. Нужно отметить, что Region можно применять повторно к тому же изображению с тем же или изменённым промтом. Каждый прогон генерирует новый набор из четырёх вариаций. А ещё разумно попробовать изменить размер выделения: чуть увеличить или уменьшить зону. Иногда буквально сантиметр (в экранных пропорциях) решает, поймает ли нейросеть идею или промахнётся мимо.
Vary и версии Midjourney — что нужно учитывать?
Функциональность Vary менялась от версии к версии, и это тот случай, когда обновления действительно имели значение. В v5.0 вариации были довольно грубыми: Strong мог перерисовать половину картинки до неузнаваемости, а Subtle порой вообще ничего не менял. Модель v5.2 ситуацию заметно улучшила — именно тогда появился Region, и точность локальных правок выросла в разы. Но по-настоящему гибкой система стала с выходом v6, где алгоритм вариации научился лучше понимать контекст и сохранять связность между оригиналом и правкой.
Кстати, версия модели влияет и на то, как интерпретируется региональный промт. В v5 нейросеть довольно вольно обращалась с текстовыми инструкциями для Region — могла проигнорировать половину слов или добавить что-то от себя. В v6 же следование промту стало значительно точнее, хотя совершенством это всё ещё не назовёшь. Тем более что разработчики Midjourney продолжают экспериментировать с архитектурой, и с каждым минорным обновлением поведение Vary может слегка меняться. Отсюда простой вывод: не стоит полагаться на старые туториалы двухлетней давности, ведь то, что работало в v5, в v6 может дать совершенно иной результат.
Неочевидные приёмы для продвинутых пользователей
Первый трюк — использование Vary (Region) для удаления объектов. Да, Midjourney это умеет, хотя и косвенно. Достаточно выделить ненужный элемент и в региональном промте описать то, что должно быть на его месте: «empty grass field», «clear blue sky», «plain wooden table». Нейросеть дорисует фон, и объект исчезнет. Конечно, до точности специализированных инструментов вроде Photoshop Generative Fill этому методу далеко, но для быстрой «косметики» он вполне годится.
Второй приём — последовательная работа с несколькими регионами. Ничто не мешает применить Region сначала к одной части изображения, затем к другой, потом к третьей. Это напоминает послойное рисование: сначала правится фон, потом одежда персонажа, потом аксессуары. Каждый этап сохраняет изменения предыдущего. Способ, конечно, кропотливый, но результат бывает впечатляющим — на выходе получается картинка, которую нейросеть никогда бы не выдала с первой генерации. Отдельно стоит упомянуть и комбинирование Vary с другими функциями: Pan (расширение холста) и Zoom Out. Сначала довести центральную часть до совершенства через Vary, а потом раздвинуть границы кадра — получается масштабная добротная сцена с проработанной серединой.
Когда Vary не поможет?
Честность прежде всего. Vary — не волшебная палочка, и ряд задач ей откровенно не по зубам. Если исходное изображение получилось откровенно неудачным — кривая композиция, неправильные пропорции тела, перекошенная перспектива — никакие локальные правки положение не спасут. Это как пытаться улучшить плохую фотографию, ретушируя по пикселю: формально возможно, но бессмысленно. Грамотнее переписать промт и сгенерировать заново.
Также Vary плохо справляется с текстом на изображениях. Midjourney в принципе не слишком дружит с буквами и надписями, и попытка «перерисовать» криво написанное слово через Region чаще всего заканчивается ещё более причудливой абракадаброй. Для таких задач лучше взять внешний графический редактор и наложить типографику вручную. Ну, а если изображение планируется для печати в высоком разрешении, любые следы «швов» от Region станут заметнее при увеличении — и тут без постобработки в Photoshop или Affinity Photo не обойтись.
Пара слов о рабочем процессе
У каждого, кто серьёзно работает с Midjourney, со временем формируется собственный добротный пайплайн. Однако общая логика при использовании Vary обычно сводится к нескольким этапам, перетекающим один в другой. Сначала — генерация базовой сетки через хорошо проработанный промт. Затем — выбор лучшего варианта и апскейл. Далее — оценка: что именно не устраивает? Если общее настроение — Subtle. Если конкретный элемент — Region. И уже на финальной стадии — экспорт и при необходимости доработка во внешнем редакторе.
Стоит завести привычку сохранять промежуточные результаты и записывать job ID удачных генераций. Midjourney хранит историю, но найти в ней нужную картинку спустя пару недель — то ещё удовольствие. А ведь именно возможность вернуться к удачному промежуточному варианту и попробовать другую ветку вариаций — одно из главных преимуществ Vary перед полной перегенерацией.
Освоив Vary в связке с Region, Subtle и Strong, вы получите контроль над генерацией, о котором ещё пару лет назад можно было только грезить. Экспериментов этот инструмент требует немало, но каждый удачный результат — маленькая победа, которая со временем превращается в стабильный навык. Удачи в укрощении нейросети — пусть каждый арт получается именно таким, каким задумывался.

