Соотношение сторон 3:2 в Midjourney: как правильно настроить формат изображения

Среди тысяч параметров, с которыми ежедневно экспериментируют пользователи Midjourney, один стоит особняком — и при этом довольно часто остаётся без должного внимания. Речь о соотношении сторон. Казалось бы, мелочь: подумаешь, чуть шире картинка или чуть выше. Но именно от пропорций холста зависит, как нейросеть выстроит композицию, куда «посадит» главный объект и сколько воздуха оставит вокруг него. Формат 3:2 в этом смысле — настоящий кладезь возможностей, потому что тяготеет к классической фотографической эстетике, знакомой глазу ещё со времён плёночных зеркалок. Но чтобы извлечь из него максимум, нужно разобраться в нескольких довольно важных нюансах.

Все топовые нейросети в одном месте

Почему именно 3:2?

Формат дело тонкое. Стоит отметить, что Midjourney по умолчанию генерирует квадратные изображения 1:1 — и львиная доля новичков так и оставляет этот параметр нетронутым. А зря. Квадрат хорош для аватарок и иконок, но для полноценной иллюстрации, портрета или пейзажа он довольно часто оказывается тесноватым. Дело в том, что человеческий глаз привык воспринимать мир в горизонтальной плоскости — периферическое зрение шире, чем высота обзора. Именно поэтому кинематограф, фотография и живопись веками тяготели к прямоугольным форматам. И 3:2 среди них занимает особое место.

Это соотношение пришло из мира 35-миллиметровой плёнки. Каждый кадр на классической плёнке Kodak или Fuji имел размер 36 на 24 миллиметра — вот и получалось ровно 3:2. Потом этот формат перекочевал в цифровые зеркальные камеры, а оттуда — в сознание миллионов фотографов по всему свету. Когда Midjourney получает команду с таким соотношением, нейросеть словно «вспоминает» всю ту гигантскую базу фотографий, на которых обучалась. И результат нередко выглядит впечатляюще — естественнее, гармоничнее, живее, чем при стандартном квадрате.

Синтаксис команды: где прописать формат

Никаких махинаций со сложными настройками тут нет. Всё вписывается прямо в промт через параметр —ar (сокращение от aspect ratio). После основного текстового описания через пробел добавляется —ar 3:2 — и готово. Выглядит это примерно так: a sunlit meadow with wildflowers, golden hour photography —ar 3:2. Нейросеть считывает параметр и формирует изображение в горизонтальной ориентации, где ширина в полтора раза больше высоты. Просто? Безусловно. Но подводные камни всё-таки имеются.

Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸

Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.

Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL

Во-первых, между двоеточием и цифрами не должно быть пробелов. Во-вторых, параметр —ar всегда ставится в самом конце промта, после всех описаний и прочих флагов. Ну и, наконец, стоит помнить, что дробные значения Midjourney не принимает — только целые числа. То есть записать 4.5:3 не получится, а вот 9:6 (что математически то же самое, что 3:2) — вполне. Впрочем, нет смысла усложнять: 3:2 нейросеть понимает прекрасно.

Горизонталь или вертикаль?

Тут всплывает нюанс, о котором многие забывают. Запись —ar 3:2 даёт горизонтальное изображение — ландшафтную ориентацию, если пользоваться фотографическим жаргоном. А что, если нужен вертикальный кадр? Портрет, например, или обложка для сторис в соцсетях? Достаточно просто поменять цифры местами: —ar 2:3. Это зеркальная пропорция, и нейросеть моментально перестраивает холст, делая высоту доминирующей осью.

Разница между 3:2 и 2:3 на практике колоссальная. Горизонтальный формат приковывает внимание к широким сценам — панорамам, групповым снимкам, архитектурным видам. Вертикальный же солирует там, где важна глубина: ростовые портреты, башни, водопады, узкие улочки европейских городков. К слову, сама Midjourney иногда «сопротивляется» вертикальному формату — композиция может получиться менее сбалансированной. Это связано с тем, что в обучающей выборке горизонтальных фотографий было значительно больше. Но при грамотном промте результат всё равно радует.

Чем 3:2 отличается от других популярных форматов

Выбор пропорций — задача не из лёгких. Ведь у каждого формата своя «суперсила». Стоит задуматься: а чем, собственно, 3:2 лучше или хуже соседних вариантов? Один из самых распространённых конкурентов — 16:9. Этот широкоэкранный кинематографический формат отлично подходит для эпических пейзажей и обоев на рабочий стол, но для портретов он слишком растянут, и лицо в нём теряется среди пустого пространства. Следующий важный конкурент — 4:3. Он ближе к квадрату, чем 3:2, и производит впечатление более «тесного» кадра. Хорош для продуктовых фотографий и предметной съёмки, но пейзажи в нём задыхаются без простора.

А вот 3:2 — золотая середина. Не слишком широкий, не слишком квадратный. В нём достаточно места для фона и контекста, но главный объект при этом не тонет в окружении. Тем более что большинство стоковых площадок и фотобанков принимают изображения именно в таком соотношении. Да и при печати на стандартную фотобумагу 15×10 сантиметров картинка ложится идеально, без обрезки. Мелочь? Возможно. Но из таких мелочей и складывается добротный рабочий процесс.

Как формат влияет на композицию в нейросети

Многие считают, что соотношение сторон — чисто техническая штука, вроде разрешения экрана. На самом деле всё куда глубже. Когда Midjourney «разворачивает» холст в пропорции 3:2, она перестраивает всю внутреннюю логику размещения элементов. Горизонтальная ось получает приоритет, и нейросеть начинает распределять объекты вдоль неё, создавая ту самую «воздушную» перспективу, которой так грезят фотографы. Объект сдвигается ближе к одной из третей кадра (привет, правило третей!), а фон получает достаточно пространства, чтобы «дышать».

Кстати, именно в формате 3:2 особенно хорошо работают промты с указанием глубины резкости. Словосочетания вроде shallow depth of field или bokeh background раскрываются здесь по-настоящему. Нейросеть выстраивает мягкий размытый задний план, а передний объект получается резким, выпуклым, почти осязаемым. В квадрате такой эффект тоже возможен, однако глазу не хватает горизонтального простора, и снимок выглядит более «сжатым». Нельзя не упомянуть и архитектурные сцены: в 3:2 здания встают в кадр целиком, с окружением и контекстом, а не обрезанные по краям.

Подбор формата под конкретную задачу

Вот здесь начинается самое интересное. С чего начинается выбор формата? С ответа на простой вопрос: где будет использоваться картинка. И от этого ответа зависит всё. Для публикации в блоге или на новостном сайте 3:2 — практически идеальный вариант, потому что большинство шаблонов WordPress и других CMS рассчитаны на горизонтальные превью именно с такими пропорциями. Для Instagram-ленты, где царствует квадрат, придётся либо обрезать края, либо сразу генерировать в 1:1. А для Pinterest и вертикальных форматов соцсетей логичнее использовать перевёрнутое соотношение 2:3.

Отдельно стоит упомянуть печатную продукцию. Если изображение предназначено для обложки журнала или книги, вертикальная ориентация 2:3 попадёт почти точно в нужные пропорции. Для баннеров и рекламных макетов в горизонтальной развёртке 3:2 подойдёт как нельзя лучше, хотя для билбордов может понадобиться что-то более вытянутое, вроде 2:1. Тем более что Midjourney поддерживает довольно широкий диапазон соотношений — вплоть до 3:1 в последних версиях. Но 3:2 остаётся своеобразным спасательным кругом: он универсален и почти всегда смотрится гармонично.

Нюансы работы в разных версиях Midjourney

Поведение нейросети менялось от версии к версии довольно заметно. В ранних итерациях (v3 и v4) нестандартные соотношения сторон иногда приводили к артефактам: странным растяжениям, обрезанным конечностям персонажей, кривым линиям горизонта. С приходом пятой версии ситуация улучшилась кардинально. А в v6 и v6.1 формат 3:2 стал обрабатываться настолько чисто, что отличить результат от реальной фотографии бывает щепетильно сложно.

Но есть и ложка дёгтя. При использовании параметра —ar 3:2 вместе с некоторыми стилевыми флагами (например, —style raw или —stylize с низкими значениями) композиция может получиться менее выразительной. Это связано с тем, что при минимальной стилизации нейросеть ведёт себя «скромнее» и меньше манипулирует расположением объектов. Совет: если хочется получить максимально эффектный кадр в формате 3:2, не стоит занижать параметр —s ниже 100. Оптимальный диапазон — от 150 до 350 (при стандартном максимуме в 1000). Именно в этом коридоре нейросеть творит чудеса с композицией, не скатываясь при этом в чрезмерную «открыточность».

Стоит ли комбинировать —ar с другими параметрами?

Разумеется. И даже нужно. Формат кадра — лишь один из инструментов, а настоящий колоритный результат рождается на стыке нескольких параметров. Хорошо работает связка —ar 3:2 с —v 6.1 (или актуальной на момент чтения версией) и средним уровнем стилизации. К тому же, если в промте указать конкретный тип камеры или объектива — скажем, shot on Canon EOS R5, 85mm f/1.4 — нейросеть подхватит эту «подсказку» и выстроит изображение с учётом реальной оптической геометрии. Итог — кадр, который выглядит не как цифровая генерация, а как снимок из портфолио профессионального фотографа.

Нужно отметить, что параметр —chaos тоже вносит свою лепту. При значении 0 нейросеть выдаёт предсказуемый, «безопасный» результат. При 20–30 начинают появляться неожиданные ракурсы и нестандартные цветовые решения. А вот при 50 и выше хаос иногда ломает композицию, особенно в вытянутых форматах. Для 3:2 золотой серединой можно считать значение от 10 до 25 — достаточно, чтобы добавить изюминку, но не настолько, чтобы потерять контроль над кадром.

Типичные ошибки при работе с форматом 3:2

Первая и самая частая — забывают про двоеточие. Звучит нелепо, но записи вроде —ar 3/2 или —ar 3-2 Midjourney просто игнорирует и генерирует стандартный квадрат. Человек потом недоумевает: «Я же указал формат!» А нейросеть молча сделала по-своему. Следующая распространённая ошибка — указание параметра —ar в середине промта, а не в конце. Midjourney может интерпретировать такую запись непредсказуемо, иногда вообще проглатывая часть текстового описания.

Ну, а третья проблема — неоднозначная. Касается она не синтаксиса, а содержания. Многие пользователи берут промт, идеально работавший в квадрате, просто дописывают —ar 3:2 и ждут того же результата, только шире. А получают совсем другую картинку. Дело в том, что при смене пропорций нейросеть заново пересчитывает всю композицию. Объекты могут сместиться, фон — измениться, общее настроение кадра — «поплыть». Не стоит этого пугаться: достаточно немного скорректировать промт, добавив уточнения о расположении элементов. Фразы вроде centered composition или subject on the left third здесь становятся настоящим спасательным кругом.

Практические сценарии использования

Блогерам и контент-мейкерам формат 3:2 пригодится для обложек статей и постов. Картинка в таких пропорциях смотрится профессионально, не требует дополнительной обрезки и одинаково хорошо отображается на десктопах и мобильных экранах. К тому же социальные сети при расшаривании ссылок часто подтягивают превью именно в горизонтальном формате — и 3:2 ложится туда как влитой.

Дизайнерам интерфейсов и веб-разработчикам такое соотношение пригодится для hero-секций сайтов, карточек товаров и фоновых изображений. Особый интерес вызывает применение 3:2 в создании мокапов: сгенерированная в Midjourney «фотография» продукта в правильном формате моментально встраивается в макет без мучительного кадрирования. А фотографам — тем, кто использует нейросеть для поиска идей и визуальных референсов, — 3:2 помогает сразу видеть будущий кадр в привычных пропорциях. Это экономит время и нервы.

Как добиться максимального качества

Генерация в формате 3:2 — полдела. Вторая половина — апскейл. После того как Midjourney выдаст сетку из четырёх вариантов, стоит выбрать наиболее удачный и увеличить его. В версии v6 и новее встроенный апскейлер работает довольно прилично, выдавая изображения с разрешением порядка 2048×1365 пикселей (при соотношении 3:2). Для веба этого более чем достаточно. Однако для печати в крупном формате придётся прибегнуть к внешним инструментам — например, Topaz Gigapixel AI или встроенному увеличителю в Photoshop на базе нейросетей.

Все топовые нейросети в одном месте

К слову, существует ещё один неочевидный приём. Если сгенерировать изображение в удвоенном соотношении — скажем, —ar 6:4 (математически это тот же 3:2), — Midjourney иногда выделяет чуть больше вычислительных ресурсов на детализацию. Эффект не гарантирован и зависит от версии модели, но попробовать точно стоит. Да и сам процесс экспериментов с пропорциями — штука затягивающая. Одна и та же сцена, описанная одними и теми же словами, в 1:1, 3:2 и 16:9 выглядит совершенно по-разному. Три разных настроения. Три разных истории.

Быстрая шпаргалка для промтов

Структура добротного промта с форматом 3:2 выглядит примерно так: сначала идёт описание сцены или объекта, затем — стилистические указания (тип камеры, освещение, настроение), а в самом конце — технические параметры, включая —ar 3:2. Между основным текстом и параметрами ставится пробел, перед каждым флагом — двойной дефис. Нет смысла перегружать промт десятками прилагательных: Midjourney лучше реагирует на конкретные, ёмкие описания. Вместо «очень красивый потрясающий невероятный закат» куда эффективнее написать golden sunset with long shadows, warm tones, cinematic lighting.

И ещё один нюанс, о котором не стоит забывать. Если изображение будет использоваться в коммерческих целях, нужно убедиться, что подписка на Midjourney включает соответствующие права. Базовый тарифный план покрывает личное использование, а для коммерции потребуется Pro или выше. Это не бьёт по бюджету критически (от 30 долларов в месяц на момент написания), но знать об этом определённо стоит. Ведь юридические вопросы имеют свойство всплывать в самый неподходящий момент.

Формат 3:2 — один из тех инструментов, которые кажутся простыми, пока не начнёшь ими пользоваться осознанно. Стоит лишь раз прочувствовать разницу между безликим квадратом и гармоничным прямоугольником с классическими фотографическими пропорциями — и возвращаться к 1:1 уже не захочется. Экспериментов с другими соотношениями это, конечно, не отменяет. Но как отправная точка, как надёжный базовый формат для большинства задач — 3:2 ещё долго будет оставаться фаворитом. Удачи в генерациях и пусть каждый кадр попадает точно в цель.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *