Параметр ar в Midjourney: как изменить соотношение сторон изображения

Львиная доля новичков, впервые открывших для себя Midjourney, натыкается на одну и ту же досадную проблему — все сгенерированные картинки выходят квадратными. Красивыми, детализированными, порой даже поражающими воображение, но упрямо квадратными. А ведь далеко не каждый проект укладывается в формат 1:1. Обложка для YouTube-канала, вертикальный сторис, широкоформатный баннер на сайт, обои для смартфона — у каждой из этих задач свои пропорции, и квадрат тут попросту не годится. Дело в том, что по умолчанию нейросеть генерирует изображение именно в равностороннем формате, и без специальной команды менять его она не станет. Но стоит освоить всего один маленький параметр — —ar — и контроль над пропорциями полностью переходит в руки пользователя.

Все топовые нейросети в одном месте

Что такое параметр ar и зачем он нужен?

Само сокращение ar происходит от английского aspect ratio, что в переводе означает «соотношение сторон». По сути, это инструкция для нейросети, задающая пропорцию ширины к высоте итогового изображения. Записывается параметр в самом конце промта через двойной дефис: —ar 16:9, —ar 2:3, —ar 9:16 и так далее. Цифры до двоеточия отвечают за ширину, после — за высоту. Казалось бы, нюанс мелкий. Но именно он отделяет любительские эксперименты от осмысленной работы с визуалом, когда каждая картинка чётко заточена под конкретную площадку или задачу.

Стоит отметить, что параметр ar не изменяет разрешение в привычном понимании — он не добавляет пикселей и не увеличивает вес файла. Нейросеть просто перераспределяет доступное «полотно» в соответствии с заданными пропорциями. И вот тут всплывает довольно важный момент: чем экстремальнее соотношение сторон, тем меньше площади приходится на одну из осей. Картинка 1:4, к примеру, окажется крайне узкой, и детализация на ней пострадает. Ведь нейросети приходится «размазывать» генерацию по вытянутому прямоугольнику, а это неизбежно сказывается на качестве мелких элементов.

Как правильно прописать соотношение сторон в промте?

Синтаксис простейший. Промт пишется как обычно — описание сцены, стиль, настроение, а в самом конце через пробел добавляется —ar и нужная пропорция. Выглядит это примерно так: a cozy cabin in the winter forest, soft light, cinematic —ar 16:9. Между двойным дефисом и буквами «ar» пробела нет, а вот перед самим параметром пробел обязателен. Казалось бы, мелочь — но именно из-за лишнего пробела или его отсутствия параметр частенько не срабатывает у тех, кто только начал работать с Midjourney.

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

Нужно ли запоминать какие-то жёсткие ограничения? Да, кое-какие подводные камни существуют. В ранних версиях нейросети (до пятой модели) максимальное соотношение ограничивалось 2:1 по любой стороне. Сейчас же, начиная с модели v5 и новее, допускаются куда более свободные пропорции — вплоть до 7:1 и даже шире. Впрочем, на практике соотношения экстремальнее 3:1 мало кто использует. Это связано с тем, что результат получается слишком вытянутым, а нейросеть начинает «додумывать» содержание не самым удачным образом. К тому же дробные значения (вроде 1.5:1) система не принимает — только целые числа через двоеточие.

Популярные соотношения сторон и где они пригодятся

Стартовая точка. Формат 1:1 — тот самый квадрат, который нейросеть выдаёт по умолчанию. Он отлично подходит для аватарок в социальных сетях, карточек товаров и иконок. Но стоит задуматься о чём-то более масштабном — и квадрат сразу начинает тесниться. Для горизонтальных обложек YouTube-каналов, шапок сайтов, презентаций и широкоформатных баннеров лучше всего себя зарекомендовало соотношение 16:9. Это же, кстати, стандарт современных мониторов и телевизоров, поэтому картинка в таком формате визуально воспринимается как нечто привычное, «кинематографичное» даже.

Отдельно стоит упомянуть вертикальные форматы. Соотношение 9:16 — зеркальное отражение предыдущего, идеально для Instagram Stories, TikTok, Reels и обоев на смартфон. А вот 2:3 тяготеет к классическим книжным пропорциям и замечательно подходит для обложек, пинов в Pinterest и постеров. Чуть шире — 3:4, формат, знакомый фотографам по среднеформатным камерам (да и по старым телевизорам с соотношением 4:3, только перевёрнутый). Для панорам же и сверхшироких десктопных обоев выручит 21:9, совпадающий с пропорциями ультраширокого монитора.

Влияет ли ar на композицию и стиль?

Вопрос далеко не праздный. Многие считают, что параметр соотношения сторон — это чисто техническая «обрезка» холста, не затрагивающая содержание. Но на самом деле всё гораздо интереснее. Нейросеть адаптирует композицию под заданные пропорции, и порой результат отличается разительно. Один и тот же промт в квадрате может выдать крупный портрет, а в формате 16:9 — развернуть целую сцену с персонажем, фоном и атмосферой. Дело в том, что горизонтальный формат «подталкивает» алгоритм к пейзажному мышлению: линия горизонта, глубина, перспектива. Вертикальный же, наоборот, провоцирует генерацию ростовых фигур, башен, водопадов — всего, что тянется вверх.

И вот тут кроется настоящая изюминка параметра. Грамотно подобранное соотношение сторон способно усилить настроение промта в разы. Представим тёмный готический замок. В квадрате он выглядит статично, как открытка. В формате 9:16 шпили устремляются ввысь, давление на зрителя усиливается, антураж становится мрачнее. А в 21:9 замок оказывается частью ландшафта, появляется ощущение одиночества на фоне бескрайнего неба. Тот же объект — три совершенно разных эмоции. Безусловно, не стоит перебарщивать с экспериментами в ущерб конкретной задаче, но попробовать один промт в нескольких пропорциях — всегда полезная практика.

Совместимость с другими параметрами

Довольно часто новички задаются вопросом: а можно ли использовать —ar одновременно с другими командами? Ответ прост — разумеется, можно. Параметр соотношения сторон прекрасно уживается и с —stylize (стилизация), и с —chaos (разнообразие вариантов), и с —quality, и даже с —tile для создания бесшовных текстур. Все эти параметры просто прописываются друг за другом через пробел в конце промта. Порядок их следования роли не играет — нейросеть считывает каждый отдельно.

Но есть один неоднозначный момент. При использовании —zoom (функция расширения изображения, доступная после генерации) соотношение сторон может измениться. Это связано с тем, что зум добавляет «поля» вокруг уже готовой картинки, и пропорции итогового результата отличаются от исходных. Аналогичная история с кнопками «Pan» — панорамирование влево, вправо, вверх или вниз тоже вносит свои коррективы в финальные пропорции. Так что после подобных махинаций стоит перепроверять размеры, особенно если изображение готовится под строгий макет.

Стоит ли менять ar при апскейле?

Короткий ответ — нет. И вот почему. Апскейл (увеличение разрешения) в Midjourney работает с уже сгенерированным изображением, сохраняя его пропорции. Менять соотношение сторон нужно именно на этапе генерации, до того как нейросеть создаст первые четыре превью. Если результат устраивает по композиции, но не по размеру — тогда апскейл поможет «подтянуть» разрешение без потери качества. А вот если пропорции нужны другие, придётся переписать промт с новым значением —ar и запустить генерацию заново. Да и самим пользователям так комфортнее — лучше сразу задать правильный формат, чем потом кадрировать готовую работу в Photoshop, теряя важные детали по краям.

Типичные ошибки при работе с соотношением сторон

Первая и самая распространённая — путаница в порядке цифр. Кто-то пишет —ar 9:16, ожидая горизонтальный формат, а получает вертикальный. Ведь первая цифра — всегда ширина, вторая — высота. Перепутал местами — и вместо широкоэкранного пейзажа получил узкую колонну. Вроде бы очевидно, однако на форумах и в Discord-каналах жалобы на это всплывают с завидной регулярностью.

Вторая ловушка — чрезмерно экстремальные пропорции. Соблазн задать что-нибудь вроде —ar 10:1 понятен: хочется панораму, ленту, «кинематографический размах». Но результат, как правило, удручающий. Нейросеть растягивает объекты, теряет связность элементов, начинает дублировать фрагменты. На практике соотношения шире 3:1 (или выше 1:3 по вертикали) редко дают добротный результат без дополнительных усилий. К слову, некоторые пользователи нашли обходной путь: сначала генерируют изображение в умеренных пропорциях (скажем, 2:1), а затем расширяют его с помощью функции Pan. Способ не идеальный, но рабочий.

Ну и, наконец, третья ошибка — игнорирование контекста. Не стоит забывать, для какой платформы или задачи создаётся изображение. Картинка в формате 16:9, загруженная в Instagram-ленту, будет жестоко обрезана до квадрата. А вертикальное изображение на сайте с горизонтальной вёрсткой заставит верстальщика схватиться за голову. Прежде чем прописывать —ar, стоит свериться с требованиями целевой площадки — это сэкономит и время, и нервы.

Хитрости и лайфхаки от практиков

Скрупулёзные пользователи Midjourney давно выработали свои маленькие ритуалы при работе с пропорциями. Один из самых действенных приёмов — генерация «пробных» вариантов в нескольких соотношениях перед финальным рендером. Допустим, задача — создать иллюстрацию для статьи в блоге. Вместо того чтобы сразу задавать —ar 16:9, опытный пользователь сначала прогонит промт в квадрате (без параметра ar), оценит общую стилистику и только потом переключится на нужные пропорции. Это помогает понять, как нейросеть «видит» запрос, и при необходимости скорректировать текст промта до смены формата.

Ещё один добротный совет — использование параметра —ar совместно с —seed. Seed фиксирует «зерно» генерации, и если один и тот же промт запустить с одинаковым seed, но разными пропорциями, можно наглядно увидеть, как именно соотношение сторон влияет на композицию. Это настоящий кладезь информации для тех, кто хочет по-настоящему разобраться в механике работы алгоритма. А если добавить к этому —stylize с разными значениями, получится целая матрица вариантов. Кропотливо? Да. Но результат того стоит.

Что насчёт нестандартных соотношений?

Midjourney не ограничивает пользователей только «каноническими» форматами вроде 16:9 или 4:3. Можно задавать любые целочисленные пропорции: —ar 5:7, —ar 7:4, —ar 13:9 — нейросеть проглотит всё. Главное, чтобы числа были целыми и разделёнными двоеточием. Впрочем, на практике экзотические форматы нужны нечасто. Обычно хватает десятка проверенных комбинаций, а дальше уже начинается территория экспериментов ради экспериментов. И всё же знание того, что ограничений по сути нет, развязывает руки. Особенно когда заказчик приходит с макетом нестандартного баннера, где пропорции — что-то вроде 851 на 315 пикселей (именно такие требования, к примеру, у обложки Facebook). Делим оба числа на общий делитель, получаем приблизительно —ar 851:315 — или упрощаем до —ar 2.7:1… Стоп. Дроби система не принимает. Тогда округляем до —ar 17:6 — и вот это уже рабочий вариант.

Все топовые нейросети в одном месте

Версии Midjourney и эволюция параметра

Буквально пару лет назад, на заре третьей версии, с пропорциями всё обстояло значительно скромнее. Максимум — 2:1, и то с оговорками. Нейросеть часто «теряла» качество на краях широких изображений, а вертикальные форматы иногда генерировались с артефактами. С выходом пятой модели ситуация изменилась радикально. Алгоритм научился грамотно распределять внимание по всей площади холста, вне зависимости от пропорций. А в шестой версии (и в последующих обновлениях) поддержка широких соотношений стала ещё стабильнее. Сейчас даже формат —ar 4:1 генерируется без критичных огрехов — конечно, при условии, что промт написан грамотно и не перегружен деталями.

Нельзя не упомянуть и Niji — отдельный режим Midjourney, оптимизированный под аниме-стилистику. В нём параметр —ar работает по тем же правилам, но результат нередко отличается по композиционному поведению. Аниме-модель активнее заполняет вертикальные форматы персонажами в полный рост, а в горизонтальных стремится к «кадру из аниме» — с акцентированным передним планом и размытым фоном. Да и сами пропорции 9:16 и 2:3 в Niji выглядят органичнее, потому что манга и аниме исторически тяготеют к вертикальным форматам.

Когда лучше обойтись без ar?

Бывают ситуации, когда квадрат — самый разумный выбор. Во-первых, если изображение создаётся «для портфолио» или для оценки общей стилистики, квадратный формат не отвлекает внимание на пропорции и позволяет сфокусироваться на деталях. Во-вторых, если финальный формат ещё не определён (заказчик не прислал макет, размеры площадки неизвестны), лучше сгенерировать квадрат, а потом уже решить, как его кадрировать. И в-третьих, для бесшовных текстур (параметр —tile) квадрат подходит идеально — стыковать прямоугольные тайлы всё-таки сложнее. Так что отсутствие параметра —ar в промте — это тоже осознанное решение, а вовсе не забывчивость.

Совет: Перед генерацией стоит записать конечные размеры в пикселях, посчитать пропорцию и уже потом переводить её в формат —ar X:Y. Это избавит от неприятных сюрпризов на стадии вёрстки или монтажа.

Параметр —ar — одна из тех мелочей, которые кардинально меняют качество работы с нейросетью. Стоит потратить пятнадцать минут на эксперименты, попробовать один и тот же промт в пяти разных пропорциях, и понимание придёт само. А вместе с ним — и контроль над результатом, и удовольствие от процесса. Ведь когда картинка идеально ложится в макет без единого пикселя лишней обрезки — это маленькая, но настоящая радость. Удачи в генерации!