Нейросети за последние пару лет перевернули привычное представление о графическом дизайне, и львиная доля пользователей, впервые столкнувшихся с Midjourney, довольно быстро понимает одну неприятную вещь — сгенерированная картинка далеко не всегда соответствует нужному формату. Квадратный холст 1024×1024 выглядит отлично в превью, но стоит попробовать поставить его на обложку сайта или использовать в печатном макете, как пропорции начинают капризничать. Кто-то пытается дотянуть результат в Photoshop, кто-то просто обрезает лишнее, теряя при этом важные детали. А ведь Midjourney располагает собственным набором инструментов для управления размерами ещё на этапе генерации. Но чтобы не тратить время на бесконечные пересоздания, стоит разобраться в этих командах заранее.
Зачем вообще менять пропорции?
Вопрос кажется наивным. Однако новички часто игнорируют его и работают с тем, что нейросеть выдала «из коробки». Дело в том, что стандартное разрешение в Midjourney привязано к квадрату — соотношение сторон 1:1. Для аватарок в социальных сетях такой формат ещё сгодится, но вот для баннера на YouTube (где нужны 16:9) или вертикальной сторис в Instagram (9:16) квадрат совершенно не подходит. Да и дизайнеры, готовящие макеты для печати, обычно тяготеют к нестандартным пропорциям — скажем, 3:2 или 4:5. Именно поэтому понимание того, как задать нужное соотношение сторон, экономит не только нервы, но и оплаченные минуты генерации.
Параметр —ar и его нюансы
Главный инструмент. Команда —ar (сокращение от aspect ratio) добавляется в конец промта и задаёт пропорции будущего изображения. Синтаксис предельно прост: после текстового описания через пробел пишется —ar X:Y, где X — ширина, а Y — высота. Например, промт a cozy mountain cabin at sunset —ar 16:9 создаст широкоформатную панораму вместо привычного квадрата. Казалось бы, всё элементарно. Но подводные камни тут всё-таки есть.
Во-первых, Midjourney не принимает дробные значения — только целые числа. Во-вторых, в версии V5 и выше максимальное соотношение сторон ограничено примерно значением 2:1 (или 1:2 для вертикальных форматов), хотя на практике можно выжать и 7:4 без потери качества. А вот экстремальные пропорции вроде 5:1 нейросеть обработает, но результат будет, мягко говоря, неоднозначный — изображение растянется, композиция «поплывёт», а детали в углах окажутся смазанными. Не стоит гнаться за запредельными значениями, если нет чёткого понимания, зачем это нужно.
Нереальный визуал и кинематографичное видео в пару кликов 🎬
Нужен крутой концепт-арт, реалистичная анимация или профессиональный апскейл? Теперь у вас есть единый доступ к лучшим визуальным нейросетям планеты: Midjourney, Runway, Kling и Sora. Улучшайте качество готовых роликов до максимума с помощью встроенных ИИ-инструментов. Никаких сложных настроек, мощного ПК или зарубежных карт. Всё работает прямо в браузере или в Telegram-боте!
Откройте новые горизонты для творчества. Жмите на ссылку, регистрируйтесь и создавайте шедевры 👉 https://clck.ru/3RNCRL
Какие пропорции выбрать под конкретную задачу?
С чего начинается выбор? С определения конечной площадки, где картинка будет «жить». Для обложки статьи на сайте или баннера чаще всего используют —ar 16:9 — это классический широкоформатный кадр, знакомый каждому по телевизионным экранам. Для публикации в ленте Instagram лучше работает —ar 4:5 — слегка вытянутый вертикальный формат, который занимает максимум экранного пространства на мобильном устройстве. Ну, а для Pinterest или сторис идеально подойдёт —ar 9:16. Кстати, дизайнеры полиграфии довольно часто используют —ar 3:2, потому что он совпадает с пропорциями стандартного фотоотпечатка 10×15 см. К слову, для презентаций в формате 4:3 существует одноимённый параметр — —ar 4:3.
Команда —s и влияние стилизации на восприятие размера
Интересный нюанс. Многие думают, что параметр —s (stylize) к размерам отношения не имеет. Формально — да, он управляет степенью «художественности» генерации. Но на практике высокий уровень стилизации (скажем, —s 750 и выше) при нестандартных пропорциях может серьёзно повлиять на компоновку элементов в кадре. Нейросеть начинает «додумывать» пустые области, заполняя их декоративными деталями, и финальная картинка выглядит перегруженной. Поэтому при экстремальных пропорциях стоит задуматься о снижении стилизации до 250–400. Это связано с тем, что алгоритм распределяет «вес» художественных элементов равномерно по всей площади, и чем эта площадь вытянутее, тем заметнее искажения.
Что насчёт разрешения и апскейла?
Размер — это ведь не только пропорции, но и количество пикселей. Базовая сетка в Midjourney V5 выдаёт четыре варианта изображения, каждый примерно 1024×1024 (при квадратном формате). После выбора понравившегося варианта кнопками U1–U4 запускается апскейл — увеличение до более высокого разрешения. В пятой версии стандартный апскейл поднимает картинку примерно до 1024×1024, а вот в версии V5.2 и Niji 5 появился режим Upscale (2x) и Upscale (4x), который доводит разрешение до внушительных 2048×2048 или даже 4096×4096 пикселей соответственно. Впрочем, нужно отметить, что кратное увеличение не всегда творит чудеса — мелкие текстуры вроде шерсти или кружева иногда «замыливаются», и без постобработки в стороннем редакторе тут не обойтись.
Отдельно стоит упомянуть параметр —quality (или его сокращённую форму —q). Он влияет не на пиксельный размер, а на количество вычислительных ресурсов, затрачиваемых на генерацию. При —q 0.25 результат получается грубоватым, зато экономится время и подписочные минуты. А —q 1 — стандарт, оптимальный баланс между детализацией и скоростью. Тем более что разница между —q 1 и —q 2 заметна далеко не на каждом промте.
Параметр —zoom и кадрирование
Довольно свежая функция. Появившись в обновлениях 2023 года, команда Zoom Out позволяет «отдалить камеру» от уже сгенерированного изображения, фактически расширяя его границы. Это не совсем изменение размера в классическом понимании, но результат схожий — площадь холста увеличивается, а нейросеть дорисовывает окружение. Доступны два варианта: Zoom Out 2x (удваивает «видимую область») и Zoom Out 1.5x (умеренное расширение). А ещё есть кнопка Custom Zoom, где можно вручную задать промт для расширенного пространства и даже подправить соотношение сторон.
Как это выглядит на практике? Допустим, сгенерирован портрет персонажа в квадратном формате. Но для обложки книги нужен вертикальный кадр с «воздухом» над головой и пространством внизу для текста. Через Custom Zoom указывается —ar 2:3 —zoom 2, и нейросеть достраивает недостающие области, сохраняя центральный объект. Выглядит впечатляюще, хотя иногда достроенные края выдают характерную «замыленность». Ведь алгоритм фактически фантазирует — он не знает, что именно находилось за пределами оригинального кадра.
Pan — расширение в одну сторону
Ещё один инструмент кадрирования, о котором не стоит забывать. Кнопки Pan (стрелки влево, вправо, вверх, вниз) дорисовывают изображение только в указанном направлении, не трогая противоположный край. Это безупречный способ «вытянуть» горизонтальный пейзаж ещё шире или добавить неба над архитектурным объектом. Нужно отметить, что Pan работает только после апскейла выбранного варианта, так что сначала придётся нажать U1–U4, а уже потом расширять холст. И тут есть ложка дёгтя: каждое нажатие Pan расходует ресурсы подписки так же, как отдельная генерация. Да и результат не всегда предсказуем — при панорамировании влево нейросеть может «придумать» элемент, совершенно чуждый оригинальной композиции.
Как задать точный размер в пикселях?
Прямого способа нет. И это, пожалуй, главный источник разочарования для тех, кто привык работать с чёткими техническими заданиями. Midjourney оперирует пропорциями, а не абсолютными пиксельными значениями. Нельзя написать что-то вроде —size 1920×1080 — такой команды просто не существует. Вся суть в том, что нейросеть генерирует изображение в определённом внутреннем разрешении, а затем масштабирует до финального размера при апскейле. Поэтому для получения картинки ровно 1920×1080 пикселей стоит указать —ar 16:9, получить максимально близкий результат, а затем довести до нужного размера в любом графическом редакторе — хоть в бесплатном GIMP, хоть в Photoshop.
Впрочем, существуют сторонние добротные сервисы апскейла вроде Topaz Gigapixel AI или Real-ESRGAN, которые увеличивают разрешение Midjourney-картинок без заметной потери качества. Многие дизайнеры именно так и поступают: генерируют в Midjourney с нужными пропорциями, а финальную «подгонку» под точные пиксельные размеры выполняют уже на постобработке. Это довольно распространённый рабочий процесс, который позволяет не зависеть от ограничений нейросети.
Параметр —tile и бесшовные текстуры
Неочевидная, но крайне полезная штука для дизайнеров. Команда —tile заставляет Midjourney генерировать бесшовный паттерн — изображение, которое при повторении стыкуется без видимых границ. Само по себе это не про «размер», но к теме имеет прямое отношение. Дело в том, что бесшовная текстура может быть сгенерирована в квадратном формате, а затем «размножена» на любую площадь — хоть на баннер 5000×2000 пикселей. Используется это для фонов сайтов, оберточной бумаги, текстильных принтов. К тому же, —tile прекрасно сочетается с —ar 1:1, потому что именно квадратные паттерны легче всего «укладывать» плиткой.
Стоит ли менять версию модели ради пропорций?
Довольно щепетильный момент. В разных версиях Midjourney ограничения по соотношению сторон отличаются. Версии до V4 работали с пропорциями заметно хуже — максимум 2:1, и то с артефактами. Начиная с V5, границы раздвинулись, и теперь даже 7:3 или 3:7 обрабатываются вполне достойно. А вот модель Niji (ориентированная на аниме-стилистику) ведёт себя несколько иначе: она лучше справляется с вертикальными форматами (что логично — ведь манга и аниме-арт традиционно тяготеют к портретной ориентации), но при широкоформатных пропорциях иногда «теряет» лица персонажей на краях композиции. Указать версию модели можно параметром —v 5.2 или —niji 5 в конце промта.
Комбинирование параметров в одном промте
Настоящее мастерство. Все перечисленные команды прекрасно работают вместе, но порядок их записи не имеет значения — Midjourney распознаёт параметры в любой последовательности. Промт может выглядеть примерно так: a vast desert landscape with ancient ruins, golden hour lighting —ar 21:9 —v 5.2 —s 500 —q 1. Тут задан ультраширокий формат 21:9 (как на кинематографическом экране), версия модели 5.2, умеренная стилизация и стандартное качество. И всё это в одной строке. Безусловно, чем больше параметров, тем менее предсказуем результат, но экспериментировать с комбинациями — занятие на редкость увлекательное.
Нельзя не упомянуть ещё одну тонкость: параметр —chaos (от 0 до 100) влияет на разнообразие вариантов в сетке. При высоком значении хаоса четыре картинки в сетке будут сильно отличаться друг от друга, и среди них может оказаться вариант с неожиданно удачной компоновкой под выбранные пропорции. При низком — все четыре варианта окажутся похожими, что удобно, когда нужна предсказуемость. Ну и, конечно же, —seed (числовое значение) позволяет воспроизвести конкретную генерацию — незаменимо, если хочется повторить удачный кадр, но с другими пропорциями.
Частые ошибки при работе с размерами
Первая и самая распространённая — путаница между соотношением сторон и разрешением. Пропорции 16:9 не означают 1600×900 пикселей. Это лишь отношение ширины к высоте, а финальный размер определяется внутренними алгоритмами и выбранным уровнем апскейла. Следующий камень преткновения — попытка использовать десятичные дроби вместо целых чисел. Запись —ar 1.5:1 не сработает, нейросеть её просто проигнорирует. Правильный эквивалент — —ar 3:2. Ещё одна ошибка всплывает, когда пользователи пытаются применить параметр —ar к уже существующей генерации через кнопку «Vary». Так не получится — пропорции задаются только в момент создания нового промта или через Custom Zoom.
Отдельно бросается в глаза привычка новичков ставить гигантские значения — —ar 10:1 или —ar 1:10. Технически нейросеть это обработает, но результат окажется, мягко скажем, удручающий: горизонтальная «лента» с размытым центром или вертикальная «полоска», на которой толком ничего не разглядеть. Не стоит перебарщивать с экстремальными форматами без реальной необходимости.
Лайфхак с —repeat для подбора идеальных пропорций
Мало кто знает, но в Midjourney существует параметр —repeat (или сокращённо —r), доступный на подписках Standard и Pro. Он запускает один и тот же промт несколько раз подряд — от 2 до 40 повторов. Зачем это нужно в контексте размеров? Всё просто: при нестандартных пропорциях композиция каждый раз получается разной, и из десяти генераций одна-две окажутся значительно удачнее остальных. Это не бьёт по бюджету так сильно, как может показаться — каждая повторная генерация расходует ровно столько же ресурсов, сколько обычная. Зато экономит время на ручном перезапуске.
Освоив всего несколько параметров — —ar для пропорций, —zoom и Pan для расширения холста, —tile для бесшовных текстур — можно закрыть девяносто процентов задач, связанных с размерами в Midjourney. А финальную доводку до точных пиксельных значений всегда доделает графический редактор или сторонний апскейлер. Удачи в экспериментах — нейросеть щедра на сюрпризы, и порой самые интересные результаты рождаются именно из нестандартных пропорций.

