Пропорции в Midjourney: как использовать параметр —ar для изменения формата картинки

Любой, кто хоть раз генерировал изображение в нейросети, наверняка сталкивался с одной и той же досадной историей: промт написан идеально, стиль угадан, композиция радует глаз — но картинка упрямо выходит квадратной. А нужен-то был вытянутый баннер для сайта или вертикальная обложка для телефона. Ведь формат изображения порой важнее самого содержания, особенно когда речь идёт о коммерческих задачах или публикациях в соцсетях. Многие обыватели, только осваивающие Midjourney, даже не подозревают, что за управление пропорциями отвечает всего один короткий параметр — —ar (сокращение от aspect ratio). Но чтобы пользоваться им грамотно, стоит разобраться в нюансах, которые с первого взгляда совсем не очевидны.

Все топовые нейросети в одном месте

Что такое параметр —ar и зачем он нужен?

Суть проста. Параметр —ar задаёт соотношение сторон генерируемой картинки — ширины к высоте. По умолчанию Midjourney выдаёт изображение в формате 1:1, то есть идеальный квадрат со стороной в 1024 пикселя. Это удобно для аватарок или иконок, но львиная доля реальных задач требует совершенно иных пропорций. Горизонтальный пейзаж, вертикальный портрет, кинематографическая панорама — всё это без —ar получить попросту невозможно. Дело в том, что нейросеть не угадывает нужный формат по описанию сцены. Даже если в промте написано «широкий пейзаж с океаном», результат без указания пропорций всё равно окажется квадратным. И это раздражает.

Синтаксис донельзя лаконичен: после основного промта через пробел добавляется —ar X:Y, где X — ширина, а Y — высота. Например, запись —ar 16:9 превращает картинку в привычный широкоформатный кадр, знакомый каждому по экрану телевизора или монитора. А —ar 9:16 — та же пропорция, но перевёрнутая на бок, идеальная для сторис в Instagram или вертикальных видео. К слову, порядок цифр имеет решающее значение: перепутал местами — получил совершенно другой результат.

Какие пропорции используют чаще всего?

Золотая классика. Самое популярное соотношение среди пользователей Midjourney — 16:9. Это стандарт для мониторов, YouTube-превью, презентаций и обложек статей. Выглядит кинематографично, вмещает широкие сцены и панорамы, да и в целом воспринимается зрителем привычно. Следующий по частоте использования формат — 3:2, тяготеющий к классической фотографии. Именно в таком соотношении снимают большинство зеркальных камер, поэтому сгенерированное изображение с —ar 3:2 довольно часто выглядит как настоящий фотоснимок. Это, кстати, один из подводных камней: если нужна «рисованная» стилистика, а пропорция кричит «фотография», нейросеть может невольно потянуться к фотореализму.

Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸

Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.

Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL

Отдельно стоит упомянуть вертикальные форматы. Соотношение 2:3 прекрасно подходит для портретов, книжных обложек и постеров. А вот 9:16 — это уже территория мобильных экранов и сторис. Формат 4:5 солирует в ленте Instagram, потому что именно так платформа отображает вертикальные публикации. Ну и, конечно же, нельзя не упомянуть 1:1 — тот самый квадрат, который Midjourney подставляет по умолчанию. Для аватарок и иконок он всё ещё незаменим. Но для всего остального — тесноват.

Можно ли задать произвольное соотношение?

Да, и в этом — настоящая изюминка. Midjourney не ограничивает пользователя стандартными пропорциями из мира фотографии и видео. Записать можно хоть —ar 7:3, хоть —ar 5:12. Нейросеть примет практически любое разумное соотношение, хотя с экстремальными значениями (вроде 1:10) всё-таки могут возникнуть проблемы — композиция «поплывёт», объекты исказятся, а итоговая картинка будет напоминать неудачно обрезанную открытку. На практике довольно редко требуется что-то экзотичнее 21:9 по горизонтали или 9:21 по вертикали.

Нужно отметить, что Midjourney автоматически упрощает дроби. Записать —ar 1920:1080 вместо —ar 16:9 можно, но смысла в этом нет: движок всё равно приведёт значение к простейшей форме. А вот дробные числа (например, 1.5:1) система не поймёт — принимаются только целые. Впрочем, на практике это редко создаёт неудобства, ведь почти любую нужную пропорцию удаётся выразить парой небольших целых чисел.

Как пропорции влияют на композицию?

Многие считают, что параметр —ar — это просто «обрезка», что-то вроде кадрирования в фоторедакторе. Но на самом деле всё сложнее. Нейросеть генерирует изображение сразу в заданных пропорциях, а не обрезает квадрат потом. Это принципиальный момент. Дело в том, что при широкоформатном соотношении Midjourney старается заполнить пространство, добавляя окружение, расширяя фон, раздвигая горизонт. Портретный объект в формате 16:9 может оказаться «потерянным» посреди огромной сцены, если в промте не уточнить крупность плана.

С вертикальными форматами ситуация обратная. Соотношение 2:3 или 9:16 заставляет нейросеть «вытягивать» сцену вверх — появляется небо, высокие здания, деревья с кронами. И если промт описывает что-то приземлённое (вроде натюрморта на столе), результат может выглядеть неестественно растянутым. Поэтому стоит подбирать пропорции не только под техническое задание (размер баннера или экрана), но и под саму сцену. Ландшафт просит горизонтали. Небоскрёб или маяк — вертикали. Это простое правило, но его часто забывают.

Версии Midjourney: что изменилось в пропорциях?

Буквально пару лет назад, в эпоху третьей версии, с пропорциями дело обстояло довольно скромно. Максимальное допустимое соотношение ограничивалось примерно 2:1 по любой стороне, а попытка задать что-то шире приводила к артефактам. Четвёртая версия раздвинула рамки, но настоящий прорыв случился с выходом пятой и шестой моделей. Сейчас Midjourney v6 спокойно справляется с соотношениями вплоть до 21:9 (а кто-то экспериментирует и с более экстремальными значениями), сохраняя при этом добротное качество деталей по всему полю изображения.

К тому же с обновлениями изменилось и разрешение. Если раньше итоговая картинка при нестандартном —ar теряла в пикселях, то современный движок подстраивает размеры так, чтобы общее количество пикселей оставалось стабильным — примерно на уровне мегапикселя. Проще говоря, широкоформатное изображение не становится «размытым» по сравнению с квадратным. Оно просто перераспределяет те же пиксели по другой площади. Хотя, конечно, при совсем уж длинных пропорциях разрешение по одной из сторон может показаться недостаточным — тем более если планируется печать.

Стоит ли использовать —ar вместе с другими параметрами?

Безусловно. В этом вся прелесть системы: параметры Midjourney великолепно дружат между собой. Записать в одном промте —ar 16:9 —v 6 —style raw —s 250 — абсолютно нормальная практика. Каждый параметр отвечает за свою грань результата, и конфликтов между —ar и остальными настройками не возникает. Впрочем, один нюанс всё-таки есть. Параметр —tile (генерация бесшовных текстур) лучше всего работает с квадратными или близкими к квадрату пропорциями. Вытянутый тайл при мозаичной укладке может дать странные швы, так что с экспериментами тут стоит быть аккуратнее.

Отдельно стоит сказать про —zoom и —pan — функции расширения изображения, появившиеся в последних версиях. Когда вы делаете zoom out (отдаление), Midjourney дорисовывает окружение вокруг исходной картинки. И если при этом соотношение сторон менялось (например, из квадрата через pan вы «вытянули» изображение вправо), итоговые пропорции фактически отличаются от начальных. Это мощный инструмент постобработки внутри самой нейросети. Ведь иногда проще сгенерировать квадрат, а потом расширить его в нужную сторону, чем пытаться угадать идеальный —ar с первого раза.

Типичные ошибки при работе с пропорциями

Ошибка номер один — путаница в порядке цифр. Записал —ar 9:16 вместо —ar 16:9 — и вместо горизонтального баннера получил вертикальную «колонну». Казалось бы, мелочь, но на генерацию уходят кредиты, а в быстром режиме (fast mode) каждый запрос на счету. Вторая распространённая промашка — использование слишком экстремальных соотношений без адаптации промта. Если в описании фигурирует один персонаж по центру, а формат стоит 21:9, нейросеть будет мучительно заполнять пустоту по бокам, часто засоряя её дублями или бессмысленными деталями.

Третья ошибка — игнорирование пропорций при апскейле. Многие генерируют изображение в нужном —ar, а потом загоняют его во внешний апскейлер (вроде Topaz или Real-ESRGAN), не задумываясь о целевом разрешении. Скажем, если финальный макет требует точных 1920×1080 пикселей, стоит заранее убедиться, что сгенерированная картинка с —ar 16:9 масштабируется до этих размеров без потери качества. Ну, а самая обидная ошибка — забыть про параметр вовсе. Тогда весь труд над промтом обнуляется квадратным кадром, который потом приходится кадрировать вручную. Зрелище, мягко говоря, удручающее.

Практические сценарии: какие пропорции под какую задачу?

Для обложки статьи в блоге или на новостном сайте в большинстве случаев идеально подходит —ar 16:9 или —ar 3:2. Эти форматы привычны глазу, вписываются в стандартные шаблоны CMS (WordPress, Tilda, Ghost) и не требуют дополнительной обрезки. Если же задача — сделать пин для Pinterest, стоит задуматься о вертикали: —ar 2:3 здесь работает отлично, а некоторые авторы уходят ещё дальше — в —ar 1:2, чтобы пин занимал максимум экранного пространства в ленте.

Для обложки подкаста или музыкального альбома — неизменный квадрат 1:1. Тут без вариантов: все платформы (Spotify, Apple Music, «Яндекс Музыка») жёстко диктуют формат. А вот с баннерами для YouTube история интересная. Шапка канала требует непривычного соотношения — примерно —ar 48:9, и тут Midjourney уже откровенно буксует. Грамотнее будет сгенерировать панорамный кадр в —ar 21:9 или чуть шире, а потом довести до нужных размеров в Photoshop или Figma, дорисовав края. Это не идеальный путь, но пока — самый надёжный.

Нестандартные приёмы с —ar

Кладезь возможностей скрывается в комбинации —ar с грамотным промтом. Например, если задать —ar 21:9 и в описании указать cinematic still, wide lens, anamorphic, нейросеть создаст изображение, пугающе похожее на кадр из голливудского фильма — с характерными горизонтальными засветами и малой глубиной резкости по краям. А вот формат —ar 1:2 в сочетании с промтом про книжную иллюстрацию или таро-карту выдаёт совершенно волшебные результаты с изысканной вертикальной композицией.

Ещё один хитрый приём — использование —ar как инструмента сторителлинга. Широкоформатный внушительный кадр с множеством деталей рассказывает историю иначе, чем тесный вертикальный портрет. Опытные пользователи Midjourney сначала решают, какую эмоцию должна нести картинка, и только потом выбирают пропорции. Одиночество персонажа лучше передаёт широкий горизонтальный кадр с пустотой вокруг. Мощь и величие — вертикаль, устремлённая вверх. Это уже не техника, а настоящее визуальное мышление. И именно здесь простой параметр из четырёх символов превращается в полноценный творческий инструмент.

Альтернатива: кадрирование после генерации

Справедливости ради, не всегда обязательно задавать пропорции на этапе генерации. Иногда проще получить квадратное изображение в максимальном качестве, а потом обрезать его под нужный формат вручную. Такой подход выручает, когда одна и та же картинка нужна сразу в нескольких форматах — и квадратом для поста, и горизонтально для обложки, и вертикально для сторис. Но тут есть ложка дёгтя: обрезка неизбежно съедает часть композиции. Голову персонажа может «отрезать» сверху, а красивый элемент фона — уехать за рамку.

Именно поэтому для серьёзных задач стоит сразу генерировать в правильном —ar. Это экономит время, сохраняет задумку целой и в итоге не так сильно бьёт по бюджету кредитов, как многократные перегенерации с последующей ручной обрезкой. Да и сама нейросеть «думает» иначе, когда с самого начала знает про формат кадра. Она размещает объекты осмысленнее, выстраивает воздух вокруг них, учитывает направление взгляда и линии горизонта.

Частые вопросы и подводные камни

Влияет ли —ar на скорость генерации? Практически нет. Разница в несколько секунд может появиться при очень широких пропорциях, но для большинства стандартных соотношений время остаётся одинаковым. А вот на расход кредитов формат не влияет вообще — один запрос списывает одну единицу вне зависимости от того, квадрат это или панорама.

Можно ли менять пропорции уже после генерации без потери содержания? Частично. Функции pan и zoom out позволяют расширить кадр, фактически изменив соотношение сторон. Но «сжать» уже готовое широкое изображение обратно в квадрат средствами самой Midjourney нельзя — придётся кадрировать вручную или генерировать заново. Это довольно важный нюанс, который всплывает обычно в самый неподходящий момент.

Все топовые нейросети в одном месте

Работает ли —ar в режиме /describe? Нет. Команда /describe анализирует загруженное изображение и выдаёт текстовое описание, пропорции картинки она не наследует. Если потом генерировать по этому описанию, соотношение сторон придётся задать самостоятельно. Тем более что нейросеть при реверс-промте часто «забывает» упомянуть формат исходника.

Шпаргалка по популярным значениям —ar

Самое универсальное соотношение для горизонтали — 16:9: оно закрывает потребности от YouTube-превью до десктопных обоев. Для чуть менее «кинематографичного», но более сбалансированного результата подойдёт 3:2 — формат классической фотографии, в котором объекты не теряются в пустоте. Компактное решение для социальных сетей — 4:3, знакомое ещё по старым мониторам и iPad. По вертикали всё зеркально: 9:16 для сторис, 2:3 для портретов и постеров, 4:5 для ленты Instagram. Ну, а для совсем широкого кинематографического эффекта (так называемый cinemascope) — 21:9, тот самый формат, в котором снимают грандиозные голливудские эпики с Dolby Atmos на титрах.

Особый интерес вызывает соотношение 5:4 — оно чуть «теснее» квадрата и хорошо работает для портретов с минимальным фоном. А формат 7:4, хоть и редко упоминается в гайдах, творит чудеса с архитектурными сценами: достаточно широк, чтобы вместить здание целиком, но не настолько, чтобы появились пустоты по краям. Стоит поэкспериментировать — иногда нестандартная пропорция из двух случайных чисел приковывает внимание зрителя сильнее, чем привычные 16:9.

Освоение параметра —ar — дело буквально пяти минут, а вот эффект от грамотного использования пропорций сложно переоценить. Каждая картинка начинает «дышать» иначе, вписывается в макеты без костылей и выглядит так, будто её создавал скрупулёзный дизайнер, а не случайный генератор. Удачи в экспериментах — пусть каждый сгенерированный кадр попадает точно в нужную рамку.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *