Любой, кто хоть раз генерировал изображения в Midjourney, знаком с этим чувством: промт подобран идеально, композиция радует глаз, цветовая палитра — именно та, что рисовало воображение. А потом открываешь картинку на полный экран и замечаешь размытые контуры, «кашу» вместо мелких деталей и общее ощущение, будто снимок сделан камерой из середины нулевых. Дело в том, что первичная генерация в Midjourney выдаёт сетку из четырёх превью относительно скромного разрешения — примерно 512×512 или 1024×1024 пикселей в зависимости от версии модели. Для поста в соцсетях этого ещё хватит, а вот для печати на холсте или использования в коммерческом проекте — уже нет. Именно здесь на сцену выходит функция upscale, и разобраться в её нюансах стоит до того, как разочарование от «мыльных» артов накопится.
Что такое upscale и зачем он нужен?
По сути, upscale — это процесс увеличения разрешения уже готового изображения с одновременным улучшением детализации. Не стоит путать его с банальным «растягиванием» картинки в Photoshop, когда пиксели просто дублируются и результат выглядит ещё хуже оригинала. В Midjourney за этим словом скрывается работа нейросети: алгоритм анализирует содержимое миниатюры и «дорисовывает» недостающие детали — текстуру ткани, отдельные волоски, блики на воде, трещинки в кирпичной кладке. Результат может впечатлить даже скептика. Впрочем, идеальным назвать его получается не всегда, и к этому мы ещё вернёмся.
Как менялся upscale от версии к версии
Ранние итерации Midjourney (модели v1–v3) работали довольно грубо. Апскейл добавлял разрешение, но вместе с ним приносил артефакты: странные наросты на лицах, «пластиковую» кожу, размноженные пальцы. Многие пользователи тогда предпочитали внешние инструменты вроде Topaz Gigapixel или Real-ESRGAN — и небезосновательно. С приходом четвёртой версии ситуация заметно выправилась: нейросеть стала аккуратнее обращаться с мелкими деталями, а итоговое разрешение выросло до 1024×1024 пикселей на каждый фрагмент сетки. Но настоящий прорыв случился в v5, когда базовое разрешение каждого изображения в гриде поднялось до 1024×1024, а после апскейла пользователь получал картинку размером около 2048×2048 или даже 4096×4096 в зависимости от выбранного режима. Ну и, конечно же, модель v6 продвинулась ещё дальше — здесь upscale научился сохранять стиль оригинала почти без потерь.
Кнопки U1–U4: с чего начинается увеличение
Механика проста. После генерации Midjourney выдаёт сетку из четырёх вариантов. Под ней — кнопки с литерой «U» и порядковым номером от одного до четырёх. Нажатие на любую из них запускает процесс апскейла выбранного фрагмента. U1 — верхний левый, U2 — верхний правый, U3 — нижний левый, U4 — нижний правый. Это базовый, «стандартный» апскейл. Он удваивает разрешение и слегка дорабатывает детали, причём тратит минимум минут вычислительного времени из подписки. Для большинства задач — от иллюстраций к статьям до мудбордов и концепт-артов — этого хватает с лихвой.
Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈
Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.
Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL
Но что, если нужно больше? Тогда после первого апскейла появляются дополнительные опции. И вот тут начинается самое интересное.
Upscale subtle и upscale creative: в чём разница?
Два режима. Два совершенно разных подхода к детализации. Upscale Subtle — вариант для тех, кто хочет сохранить картинку максимально близкой к оригиналу. Нейросеть увеличивает разрешение, добавляет мелкие текстурные нюансы, но старается не менять композицию и цвет. Это «безопасный» путь, и для коммерческих проектов он зачастую предпочтительнее. Ведь заказчику не объяснишь, почему у модели на финальном рендере вдруг изменился цвет глаз.
Upscale Creative — совсем другая история. Здесь алгоритм берёт на себя больше свободы: дорисовывает текстуры агрессивнее, может слегка изменить освещение, добавить деталей, которых в оригинале не было. Иногда результат выглядит грандиозно — как будто исходник пропустили через профессиональную ретушь. А иногда нейросеть «перестаравшись» добавляет лишнее: посторонние объекты на фоне, изменённые черты лица, необъяснимые узоры на одежде. Многие считают Creative-режим более продвинутым, но на самом деле он просто менее предсказуемый. Контроль тут минимальный, и ладно, если речь идёт о пейзаже — там «отсебятина» нейросети чаще идёт на пользу. Но для портретов или архитектурных визуализаций подводных камней хватает.
Стоит ли использовать параметр —upscale?
Отдельно стоит упомянуть флаг —upscale, который можно добавлять прямо в промт. Этот параметр (доступный не во всех версиях) заставляет Midjourney сразу выдать апскейленную версию вместо стандартной сетки. Удобно? Безусловно. Но есть ложка дёгтя: лишённый возможности выбрать лучший вариант из четырёх, пользователь рискует получить не самый удачный результат в высоком разрешении. Да и пересоздание обойдётся дороже в плане GPU-минут. Поэтому опытные «миджорнисты» прибегают к такому приёму нечасто — обычно когда промт уже отточен до мелочей и результат предсказуем.
Внешние инструменты: когда встроенного upscale недостаточно
Даже самый добротный встроенный апскейл Midjourney иногда не дотягивает. Особенно если картинку нужно увеличить до размера, пригодного для широкоформатной печати — скажем, 8000×8000 пикселей и выше. В таких случаях на помощь приходят внешние нейросетевые апскейлеры. Один из самых популярных — Topaz Gigapixel AI, платный настольный инструмент, способный увеличивать изображение в шесть раз без заметных потерь качества. К тому же он позволяет вручную регулировать степень шумоподавления и резкость, что для скрупулёзной работы над деталями — настоящий спасательный круг.
Бюджетный вариант — Real-ESRGAN, бесплатная нейросеть с открытым исходным кодом. Интерфейса у неё почти нет (по крайней мере, «из коробки»), зато результат довольно приличный, а запустить её можно даже на слабом компьютере через веб-версии. Кроме того, существует Magnific AI — облачный сервис, который не просто увеличивает, но и «фантазирует» детали примерно в том же духе, что и Upscale Creative в Midjourney. Стоит он, правда, недёшево: подписка бьёт по бюджету ощутимо, начинаясь от 39 долларов в месяц. Но для профессионалов, зарабатывающих на AI-арте, это вполне оправданное вложение.
Как добиться максимального качества ещё до апскейла
Хитрость в том, что львиная доля финального качества закладывается не на этапе upscale, а гораздо раньше — в самом промте. Если исходная генерация вышла «сырой», никакой апскейлер чуда не сотворит. Поэтому начать нужно с грамотной формулировки запроса. Во-первых, стоит добавлять к промту такие уточнения, как highly detailed, sharp focus, 8K resolution — они направляют модель в сторону более детализированной генерации. Во-вторых, параметр —quality (или —q) напрямую влияет на то, сколько вычислительных ресурсов Midjourney потратит на картинку. Значение по умолчанию — один, но его можно поднять до двух (хотя это удвоит расход GPU-минут). Ну, а в-третьих, не стоит забывать про параметр —style raw, который снижает «приукрашивание» со стороны нейросети и выдаёт менее стилизованный, но зато более чёткий результат.
Ещё один нюанс — соотношение сторон. Изображения с нестандартным аспектом (например, —ar 16:9 или —ar 9:16) при апскейле иногда получают чуть менее равномерную детализацию по краям. Это связано с тем, что модель обучалась преимущественно на квадратных форматах, и при сильном отклонении от квадрата границы кадра «страдают» первыми. Не критично, но знать об этом всё-таки полезно.
Разрешение и вес файла: чего ожидать на выходе
После стандартного апскейла в v6 пользователь получает изображение размером приблизительно 2048×2048 пикселей (при квадратном формате). Файл в формате PNG «весит» обычно от трёх до восьми мегабайт — зависит от сложности сцены. Если же применить внешний апскейлер и довести разрешение до 4096×4096 или выше, вес легко перевалит за двадцать-тридцать мегабайт. Для веба такие «тяжеловесы» избыточны, а вот для печати на холсте размером метр на метр — в самый раз. Стоит заранее продумать, где именно картинка будет использоваться, чтобы не тратить вычислительные ресурсы впустую.
Типичные ошибки при работе с upscale
Самая распространённая проблема — попытка «вытянуть» неудачную генерацию за счёт апскейла. Это примерно как пытаться отреставрировать размытую фотографию, увеличив её в десять раз: детали не появятся из ниоткуда, а артефакты станут только заметнее. Если в исходной картинке у персонажа шесть пальцев, после upscale он получит шесть очень детальных пальцев. Вторая ошибка — многократный последовательный апскейл. Некоторые новички скачивают результат, загружают обратно через /imagine с флагом и снова апскейлят, надеясь на кумулятивный эффект. На практике каждая следующая итерация добавляет «цифровой шум», и после двух-трёх таких циклов картинка начинает выглядит неестественно «замыленной».
Третья ловушка — игнорирование формата. Midjourney отдаёт результат в PNG, и конвертировать его в JPEG до финальной обработки не стоит. При сжатии теряются мельчайшие детали — как раз те, ради которых весь апскейл и затевался. Лучше работать с PNG на всех этапах и сжимать только перед загрузкой на сайт, если того требует оптимизация.
Платная подписка и лимиты: сколько стоит качество
Вопрос не праздный. Каждый апскейл расходует GPU-минуты, и на базовом тарифе Basic Plan (десять долларов в месяц) их выделяется около двухсот в месяц. Стандартный апскейл «съедает» примерно одну минуту, а вот Creative или Subtle — уже две-три. Если генерировать и апскейлить активно, лимит закончится за пару недель. На тарифе Standard Plan (тридцать долларов) предоставляется пятнадцать часов быстрой генерации, плюс безлимитный «медленный» режим — и вот тут уже можно экспериментировать свободнее. Тем более что в медленном режиме очередь хоть и длиннее, но само качество апскейла ничуть не хуже. Кошелёк станет легче, зато и результат порадует.
Когда upscale действительно необходим
Не каждая задача требует высокого разрешения. Для мудборда, стикерпака в Telegram или аватарки в социальных сетях вполне хватит стандартной генерации без какого-либо апскейла. А вот для обложки книги, баннера на сайте шириной 1920 пикселей и выше, принта на футболке или плаката — без увеличения не обойтись. Отдельно стоит упомянуть сферу стоковых изображений: большинство фотостоков принимают файлы с минимальным разрешением в четыре мегапикселя, и стандартная миниатюра Midjourney в эти рамки не вписывается. Апскейл тут — не прихоть, а производственная необходимость.
Пошаговый подход к идеальному апскейлу
Весь процесс укладывается в довольно простую цепочку действий. Сначала формулируется промт с акцентом на детализацию — сюда же добавляются нужные параметры качества и стиля. Затем из четырёх вариантов в сетке выбирается лучший, и запускается стандартный апскейл через кнопку U. После этого оценивается результат: если всё устраивает, можно переходить к Subtle или Creative в зависимости от задачи. И наконец, при необходимости файл пропускается через внешний апскейлер для финального увеличения. Весь путь от промта до готовой картинки в высочайшем разрешении занимает от двух до десяти минут — и это, пожалуй, один из самых быстрых рабочих процессов в цифровом арте.
Особый интерес вызывает комбинация Midjourney с последующей доработкой в Photoshop. Апскейленную картинку можно «дотянуть» вручную: убрать мелкие артефакты штампом, поправить цветокоррекцию, наложить финальную резкость через фильтр Unsharp Mask. Такой гибридный подход — нейросеть плюс ручная ретушь — даёт результат, который отличить от полностью рукотворной иллюстрации крайне сложно.
Что ждёт функцию upscale в будущем
Буквально год назад апскейл в два раза считался потолком для встроенных инструментов, а сейчас модель v6 спокойно выдаёт четырёхкратное увеличение с минимумом артефактов. Тенденция очевидна: с каждым обновлением Midjourney качество upscale растёт, а необходимость во внешних инструментах постепенно снижается. Не исключено, что в следующей мажорной версии встроенный апскейлер научится генерировать изображения в разрешении восемь тысяч пикселей по длинной стороне — и тогда для львиной доли задач дополнительные программы попросту не понадобятся. Да и скорость обработки наверняка вырастет: серверные мощности команды Midjourney расширяются каждый квартал.
Ну, а пока этот светлый день не настал, стоит освоить все доступные инструменты и научиться комбинировать их друг с другом. Грамотный промт, правильный выбор режима апскейла и, при необходимости, финальная доводка во внешнем редакторе — эта связка творит чудеса даже сегодня. Удачи в экспериментах, и пусть каждая сгенерированная картинка радует не только идеей, но и безупречной детализацией.

