Как настроить правильное соотношение сторон в Midjourney

Львиная доля пользователей, впервые открывших для себя Midjourney, грезит о безупречных картинках — ярких, детализированных, с нужной композицией. Промт написан грамотно, стиль подобран со вкусом, а на выходе вместо киношного кадра получается нечто обрезанное или неуклюже растянутое. Зрелище, мягко говоря, удручающее. Дело в том, что за финальный вид изображения отвечает не только текстовый запрос, но и параметр, о котором новички вспоминают в последнюю очередь, — соотношение сторон. Именно эта настройка определяет, будет ли картинка квадратной, вытянутой по горизонтали или портретной. А чтобы не тратить генерации впустую, стоит разобраться в нюансах ещё до первого запроса.

Все топовые нейросети в одном месте

Что такое aspect ratio и зачем о нём думать?

Aspect ratio — соотношение ширины к высоте готового изображения. По умолчанию Midjourney генерирует квадрат 1:1, и многих обывателей такой формат вполне устраивает. Но стоит задуматься: часто ли в реальной жизни мы сталкиваемся с квадратными кадрами? Фотографии в журналах, кинокадры, баннеры для сайтов, обложки книг — у каждого формата собственная пропорция. И если нужна горизонтальная панорама заката или вертикальный постер для печати, квадрат попросту не подойдёт. Вся суть в том, что нейросеть при разных пропорциях по-разному распределяет элементы композиции. Вытянутый горизонтальный кадр «подталкивает» алгоритм к широким пейзажам и многоплановым сценам, тогда как узкий вертикальный формат тяготеет к портретам и одиночным объектам. Понимание этой механики — уже половина успеха.

Как прописать параметр в промте?

Синтаксис довольно простой. В конце текстового запроса через пробел добавляется конструкция —ar X:Y, где X — ширина, а Y — высота. К примеру, промт «a medieval castle on a cliff —ar 16:9» выдаст широкоформатное изображение, знакомое каждому по экранам современных мониторов. А вот «fashion portrait of a woman —ar 9:16» сгенерирует вертикальный кадр, идеально подходящий для сторис в соцсетях. Нужно отметить, что Midjourney принимает только целые числа — дробные значения вроде 1.5:1 вызовут ошибку. Да и слишком экстремальные пропорции (скажем, 1:10) алгоритм обработает, но результат вряд ли порадует: композиция «расползётся», а детали потеряют чёткость.

Популярные пропорции и где они пригодятся

Начать стоит с классики. Соотношение 1:1 — тот самый квадрат, который идёт по умолчанию. Для аватарок, иконок и постов в Instagram он всё ещё актуален, хотя и кажется довольно скучным решением для сложных сцен. Следующий важный формат — 16:9. Это стандарт широкоэкранного видео и презентаций. Пейзажи, концепт-арт для игр, обои для рабочего стола — всё это тяготеет именно к такой горизонтали. Ну и, конечно же, 9:16 — зеркальное отражение предыдущего, вертикальный кадр для мобильных экранов, Reels и TikTok-обложек.

Все топовые нейросети в одной подписке! 🚀

Устали оплачивать десятки сервисов отдельно и постоянно включать VPN? Появилась платформа, которая объединяет более 90 передовых ИИ в одном окне. Пишите тексты с новейшими версиями GPT и Claude, создавайте шедевры в Midjourney и генерируйте видео в Sora и Kling. Тексты, изображения, видео и музыка — всё работает на любых устройствах без «танцев с бубном».

Попробуйте бесплатно прямо сейчас! Переходите по ссылке и получите бонусные токены для старта 👉 https://clck.ru/3RNCRL

Отдельно стоит упомянуть пропорцию 4:3, знакомую по старым телевизорам и фотографиям. В Midjourney она творит чудеса с портретами в полный рост и натюрмортами — картинка получается чуть более «дышащей», чем квадрат, но без агрессивного растяжения. Кстати, обратный вариант 3:4 отлично подходит для обложек книг и вертикальных плакатов. А вот формат 21:9 — настоящий кладезь для любителей кинематографичных панорам. Такие ультрашироки напоминают кадры из фильмов Нолана, снятых на IMAX, и приковывают внимание мгновенно.

Стоит ли использовать нестандартные значения?

Короткий ответ — да, но с оговорками. Midjourney позволяет задавать практически любые целочисленные соотношения: 5:7, 3:2, 7:4 и даже 13:19. Многие считают, что разницы между 16:9 и 7:4 почти нет, но на самом деле алгоритм воспринимает каждую пропорцию индивидуально. Даже незначительный сдвиг — с 3:2 на 4:3 — может изменить расположение горизонта, крупность лица или количество «воздуха» вокруг главного объекта. Впрочем, не стоит превращать подбор пропорций в бесконечные махинации с цифрами. Если задача конкретная (баннер для сайта шириной 1920 и высотой 600 пикселей), проще разделить оба числа на общий множитель и получить 16:5. Работает. Проверено.

Как выбор пропорций влияет на композицию?

Вот здесь всплывают самые интересные подводные камни. Квадратный формат по своей природе центрирует объект — алгоритму просто некуда его «деть», кроме как поставить в середину. Это удобно для предметной съёмки, логотипов и минималистичных иллюстраций. Но стоит перейти к горизонтали 16:9, и нейросеть начинает заполнять пространство дополнительными деталями: появляются фоновые элементы, усложняется перспектива, кадр обретает глубину. С вертикальными пропорциями дело обстоит иначе. Формат 2:3 или 9:16 вынуждает алгоритм «мыслить» в рамках узкой полосы, и львиная доля площади отдаётся одному-двум крупным объектам.

Особый интерес вызывает поведение нейросети при экстремальных пропорциях. Попробовав сгенерировать пейзаж в формате 3:1, натыкаешься на любопытный эффект: картинка начинает напоминать панорамное фото, склеенное из нескольких кадров. Иногда результат выглядит впечатляюще — бескрайняя пустыня или горная цепь, уходящая за горизонт. А иногда получается нечто невнятное, с дублирующимися элементами и «склейками» посередине. Тем более что Midjourney не увеличивает разрешение пропорционально: растягивая кадр по горизонтали, вы фактически «забираете» пиксели у высоты. Качество при этом может ощутимо просесть.

Разница между версиями Midjourney

Нельзя не упомянуть, что поведение параметра —ar менялось от версии к версии. Буквально пару лет назад, во времена третьей версии, допустимый диапазон пропорций был довольно скромным — алгоритм «ломался» на значениях выше 2:1. Сейчас, в пятой и шестой версиях, ограничения стали мягче, и даже соотношение 4:1 выдаёт вполне добротный результат. К тому же последние модели гораздо лучше справляются с заполнением широких кадров осмысленным содержимым. Раньше при 21:9 в углах часто появлялись артефакты — размытые пятна, клонированные деревья или лишние конечности у персонажей. В актуальных версиях такие огрехи встречаются реже, хотя и не исчезли полностью.

Практические советы по подбору формата

С чего начинается выбор? С определения конечной площадки. Если картинка нужна для поста в Pinterest, вертикальный формат 2:3 — спасательный круг, ведь именно такие «пины» алгоритм платформы продвигает активнее всего. Для обложки YouTube-видео стоит использовать 16:9, а для превью подкаста — 1:1. Ну, а если речь идёт о печати на холсте, тут уж нужно отталкиваться от конкретного размера рамки. Не стоит забывать и про «запас» по краям: типографии часто обрезают три-пять миллиметров с каждой стороны, и если важный элемент композиции расположен впритык к границе кадра, после обрезки он просто исчезнет.

Ещё один нюанс — скорость генерации. Изображения с экстремальными пропорциями обрабатываются чуть дольше, чем стандартные квадраты. Разница невелика (секунды, не минуты), но на больших объёмах она накапливается. Тем более если тариф ограничен по времени работы GPU. И вот тут бросается в глаза экономический момент: каждая лишняя генерация — это расход из месячной квоты. Не стоит гнаться за идеальным aspect ratio методом бесконечного перебора. Лучше заранее определить нужную пропорцию, проверить её на одной-двух тестовых генерациях и только потом запускать финальный промт с детальным описанием.

Сочетание —ar с другими параметрами

Задача не из лёгких. Дело в том, что aspect ratio взаимодействует с остальными настройками, и результат бывает неоднозначным. Параметр —stylize (или —s), отвечающий за степень «художественности», в широких форматах работает агрессивнее — нейросеть добавляет больше декоративных деталей, чтобы заполнить пространство. Если переборщить со значением stylize при формате 21:9, картинка рискует превратиться в хаотичное нагромождение элементов. Безусловно, это не приговор — достаточно снизить stylize до 200–400, и композиция станет чище.

Кроме того, на итоговый результат влияет параметр —chaos. При высоких значениях хаоса Midjourney предлагает более разнообразные варианты в сетке, и сочетание —chaos 80 —ar 16:9 нередко выдаёт совершенно неожиданные ракурсы, о которых ты даже не задумывался при написании промта. Однако вместе с разнообразием приходит непредсказуемость, и половина результатов может оказаться откровенно слабой. Впрочем, для стадии поиска идей такой подход вполне оправдан. А вот для финального рендера нужна стабильность, так что хаос лучше снизить до 10–20.

Частые ошибки при работе с пропорциями

Одна из самых распространённых проблем — путаница между шириной и высотой. Казалось бы, мелочь, но —ar 9:16 и —ar 16:9 дают диаметрально противоположные кадры. И когда человек ждёт горизонтальную панораму, а получает вертикальную «башню», раздражение вполне понятно. Ещё одна ложка дёгтя — попытка «поймать» точное разрешение через aspect ratio. Midjourney не позволяет задать пиксельные размеры напрямую (в отличие от того же Stable Diffusion), и соотношение 1920:1080 нейросеть упростит до 16:9. Это не плохо само по себе, но стоит понимать: итоговое разрешение изображения определяет алгоритм, а не пользователь. Для увеличения до нужного размера придётся воспользоваться апскейлером — встроенным или сторонним.

К слову, ещё одна щепетильная тема — использование —ar совместно с функцией Vary (Region). При частичной перегенерации отдельного участка изображения пропорции наследуются от исходного кадра, и менять их «на лету» не получится. Если результат нужен в другом формате, придётся делать новую генерацию с нуля или обрезать вручную в графическом редакторе. Не самый удобный сценарий, но пока альтернативы нет.

Как подобрать идеальный формат под конкретный стиль?

Фотореализм тяготеет к «фотографическим» пропорциям — 3:2 и 4:3. Это связано с тем, что нейросеть обучалась в том числе на снимках, сделанных реальными камерами, и при таких значениях результат выглядит наиболее правдоподобно. Для аниме и манги отлично работает вертикальный 2:3, имитирующий страницу комикса. А вот абстрактное искусство и паттерны зачастую выигрышнее смотрятся в квадрате, где симметрия и ритм элементов раскрываются в полной мере.

Отдельная история — концепт-арт для игровых проектов. Горизонтальный формат 21:9 или даже 32:9 (двойной ультравайд) позволяет создать добротные панорамы уровней, которые гейм-дизайнер может использовать как mood board. Но есть нюанс: при таких экстремальных пропорциях средняя часть изображения иногда «провисает» — алгоритм не всегда понимает, чем заполнить центр композиции. Спасательным кругом в такой ситуации становится конкретика в промте. Вместо расплывчатого «fantasy landscape» стоит написать что-то вроде «fantasy landscape with a river in the center, mountains on the left, ancient ruins on the right». Чем точнее текст описывает расположение объектов, тем лучше нейросеть справляется с заполнением широкого кадра.

Все топовые нейросети в одном месте

Нужно ли менять пропорции при апскейле?

Вовсе нет. При использовании встроенного апскейла (кнопки U1–U4 или Upscale в новых версиях) соотношение сторон сохраняется автоматически. Разрешение увеличивается, но пропорции остаются прежними. Однако если для финальной обработки применяется сторонний инструмент (Topaz Gigapixel, Real-ESRGAN или аналоги), стоит убедиться, что в настройках апскейлера не стоит галочка «crop to square» или подобная опция. Иначе все старания по подбору aspect ratio пойдут насмарку. Да и качество самого апскейла во многом зависит от исходной «чистоты» картинки — если на этапе генерации формат был выбран неудачно и композиция «поехала», никакой апскейлер ситуацию не спасёт.

Работа с Midjourney через веб-интерфейс

Буквально год назад единственным способом взаимодействия с нейросетью оставался бот в Discord. Сейчас же появился полноценный сайт с собственным редактором, и в нём задавать пропорции стало ещё проще. В веб-интерфейсе есть выпадающее меню с предустановленными форматами — «Square», «Portrait», «Landscape» и «Widescreen». Каждый из них соответствует конкретному числовому значению, которое можно поменять вручную, кликнув на иконку настроек. К тому же в веб-версии наглядно отображается превью формата ещё до генерации, что позволяет заранее оценить, как будет выглядеть итоговый кадр. В Discord такой роскоши нет — приходится держать пропорции в голове или подглядывать в шпаргалку.

Разумеется, функциональность обоих интерфейсов практически идентична, и параметр —ar работает одинаково что в дискорд-боте, что на сайте. Но удобство веб-версии всё-таки подкупает. Ведь именно визуальная обратная связь помогает быстрее понять, какой формат нужен для конкретной задачи, и не тратить генерации вхолостую. Тем более что интерфейс сайта позволяет сохранять любимые пресеты пропорций — удобно, если вы регулярно создаёте контент в одном и том же формате.

Освоив тонкости aspect ratio, можно заметно поднять качество генераций и сократить время на доработку в Photoshop или Figma. Главное — помнить, что пропорции не существуют в вакууме: они работают вместе с промтом, стилем и остальными параметрами. Не стоит перебарщивать с экстремальными значениями без веской причины, но и бояться экспериментов тоже нет смысла. Пара тестовых генераций с разным aspect ratio способна открыть совершенно новый взгляд на привычный промт. Удачи в поиске идеальных пропорций — пусть каждый кадр получается именно таким, каким вы его задумали.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *