Любой, кто хоть раз генерировал изображения через нейросеть, рано или поздно натыкается на одну и ту же досадную стену — картинка выглядит потрясающе на экране, но стоит попробовать напечатать её на холсте или вставить в макет журнального разворота, как вся магия рассыпается пикселями. Ведь стандартное разрешение Midjourney далеко не всегда дотягивает до требований полиграфии или крупноформатной печати. Многие грезят о том, чтобы получить из нейросети изображение, пригодное для баннера шириной в пару метров, но не понимают, с какой стороны подступиться к задаче. А начать стоит с понимания того, какие инструменты вообще существуют — как внутри самого Midjourney, так и за его пределами.
Что на самом деле генерирует Midjourney?
Прежде чем гнаться за увеличением, нужно разобраться, с чем именно мы имеем дело. Стандартная сетка из четырёх превью-изображений в пятой версии Midjourney выдаёт картинки размером 1024×1024 пикселей каждая. После апскейла через кнопку U (upscale) разрешение возрастает, но ненамного — до тех же 1024×1024 в базовом режиме, а в некоторых случаях до 2048×2048. Много ли это? Для публикации в соцсетях или на сайте — вполне достаточно. Но попробуйте отправить такой файл в типографию, и менеджер вежливо попросит «что-нибудь покрупнее». Дело в том, что для качественной печати нужно минимум 300 точек на дюйм (DPI), и при таком требовании картинка 1024×1024 уместится разве что на визитке. И это — одна из главных ловушек, в которую попадают новички.
Встроенные апскейлеры: кнопки U и их нюансы
Самый очевидный путь. Сгенерировал сетку, нажал U1, U2, U3 или U4 — и получил увеличенную версию одного из вариантов. Однако не стоит путать это действие с реальным повышением детализации. В ранних версиях Midjourney (v3 и v4) апскейл действительно дорисовывал детали, добавлял текстуры и мелкие элементы, которых не было на превью. С приходом пятой версии механика изменилась: кнопка U по сути просто вырезает выбранное изображение из сетки и отдаёт его в полном разрешении. Никакой магии удвоения здесь уже нет.
Впрочем, кое-что полезное всё же появилось. После первого апскейла под картинкой всплывают дополнительные кнопки — Upscale (2x) и Upscale (4x). Вот они-то и творят чудеса. Двукратное увеличение превращает изображение 1024×1024 в солидные 2048×2048 пикселей, а четырёхкратное — во внушительные 4096×4096. Казалось бы, задача решена? Не совсем. Встроенный апскейлер Midjourney довольно прилично справляется с простыми композициями и крупными объектами, но мелкие детали — текст на вывесках, тонкие узоры на ткани, ресницы на портретах — иногда размываются или обретают неестественную «пластилиновую» фактуру. Тем более что каждый апскейл в 4x расходует GPU-минуты вашей подписки, и кошелёк от частого использования станет заметно легче.
Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈
Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.
Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL
Параметр —quality и его влияние на детализацию
Распространённое заблуждение: многие полагают, что параметр —quality (или сокращённо —q) напрямую влияет на разрешение выходного файла. На самом деле это не так. Этот параметр управляет количеством вычислительных шагов, которые нейросеть тратит на одну генерацию. По умолчанию стоит значение 1. Можно выставить 0.25, 0.5 или 2. Чем выше число, тем больше деталей нейросеть прорабатывает на этапе генерации — но размер картинки в пикселях остаётся прежним. Это важный нюанс, который стоит зарубить на носу. Высокое значение —q 2 сделает текстуры богаче, тени — глубже, а переходы — плавнее, но файл всё равно выйдет 1024×1024. А вот времени на генерацию уйдёт вдвое больше. И GPU-минуты, разумеется, тоже сожжёт в двойном объёме.
Стоит ли менять соотношение сторон?
Ещё один довольно хитрый приём, о котором забывают. Параметр —ar (aspect ratio) позволяет задать пропорции изображения. К примеру, —ar 16:9 выдаст широкоформатную картинку, а —ar 9:16 — вертикальную. Изюминка в том, что при нестандартных пропорциях Midjourney иногда генерирует изображения с чуть большим общим количеством пикселей, чем при стандартном квадрате. Не стоит ждать чуда — разница невелика, но в связке с последующим апскейлом даже небольшой прирост играет роль. Кроме того, правильно подобранное соотношение сторон ещё на этапе генерации избавляет от необходимости кадрировать финальное изображение, теряя драгоценные пиксели.
Внешние апскейлеры: когда встроенных средств не хватает
Настоящий прорыв. Именно сторонние инструменты позволяют довести картинку из Midjourney до разрешения, пригодного для печати на билборде. Один из самых популярных — Topaz Gigapixel AI. Эта программа, установленная локально на компьютер, использует собственные нейросетевые модели для «умного» увеличения. Она анализирует текстуры, распознаёт типы объектов (лица, листву, ткани, архитектуру) и дорисовывает детали, которых не было в оригинале. Результат — изображение, увеличенное в шесть раз без заметной потери качества. Звучит фантастически, но подводные камни здесь тоже есть: программа платная (порядка 100 долларов за лицензию), а обработка одного файла на слабом компьютере может занять несколько минут.
Альтернатива попроще — онлайн-сервисы. К первой группе относятся добротные бесплатные решения вроде Upscayl (open-source приложение для десктопа) и Real-ESRGAN, который можно запустить даже через Google Colab без установки чего-либо. Следующий важный игрок — Magnific AI, сервис, который не просто увеличивает, а переосмысливает картинку, добавляя детали на основе текстового описания. Стоит он недёшево (около 39 долларов в месяц за базовый тариф), но для коммерческих проектов это серьёзное вложение, которое окупается качеством. Ну и, наконец, Adobe Photoshop со встроенной функцией Super Resolution в Camera Raw — вариант для тех, у кого уже есть подписка на Creative Cloud. Увеличение всего в два раза, зато без артефактов и с идеальной интеграцией в рабочий процесс дизайнера.
Как правильно подготовить картинку перед увеличением?
Львиная доля неудач при апскейле связана не с самим инструментом, а с тем, что ему «скормили» неподходящий исходник. Начать нужно с выбора лучшего варианта из сетки. Не стоит лениться — иногда имеет смысл сгенерировать десяток сеток, прежде чем один из вариантов по-настоящему зацепит. Далее — сделать первичный апскейл кнопкой U внутри Midjourney, а потом ещё раз через Upscale (2x) или Upscale (4x). И только после этого скачивать файл и отправлять его во внешний апскейлер. Такая двухэтапная схема даёт куда более чистый результат, чем попытка сразу увеличить маленькое превью в шесть раз через Topaz или Real-ESRGAN.
Отдельно стоит упомянуть формат файла. Midjourney по умолчанию отдаёт картинки в PNG, и это хорошо — формат без потерь. Но если вы случайно сохранили файл в JPEG с высокой степенью сжатия, артефакты компрессии при апскейле расползутся по всему изображению. Зрелище удручающее. Поэтому стоит всегда работать с PNG или, на худой конец, с JPEG при минимальном сжатии (качество 95–100%). К слову, Midjourney v5 и v6 поддерживают и WebP, но для последующей обработки лучше всё-таки конвертировать в PNG.
Промт как фундамент качества
Вот что забавно: многие бросаются искать внешние апскейлеры, даже не попытавшись выжать максимум из самого промта. А ведь грамотно составленный запрос способен радикально повысить детализацию ещё на этапе генерации. Во-первых, стоит добавлять к промту слова, связанные с высоким качеством визуала — highly detailed, 8K, ultra-realistic, intricate details. Во-вторых, нелишне указать стилистику, подразумевающую мелкую проработку: macro photography, hyperrealism, fine art print. Ну, а если генерируется портрет, то фраза skin pores visible буквально заставит нейросеть прорисовать каждую пору. Безусловно, это не замена апскейлу, но на выходе получится изображение, которое и до увеличения выглядит впечатляюще, а после — тем более.
Нужно отметить, что параметр —style raw тоже вносит свою лепту. Он отключает «художественную» обработку Midjourney и выдаёт более «чистый» результат, с меньшим количеством стилизации и большей фотографической точностью. Для последующего апскейла такие изображения подходят лучше, ведь внешним нейросетям проще работать с реалистичными текстурами, чем с абстрактными мазками в духе импрессионизма.
Версия Midjourney: v5 против v6
Вопрос неоднозначный. Шестая версия Midjourney, появившаяся в конце 2023 года, действительно подняла планку качества генерации. Текстуры стали глубже, лица — реалистичнее, а мелкие элементы вроде надписей и орнаментов прорабатываются куда аккуратнее. Но есть ложка дёгтя: v6 гораздо щепетильнее относится к формулировкам промта, и привычные запросы из пятой версии могут выдать совершенно неожиданный результат. С точки зрения последующего апскейла v6 выигрывает — исходники получаются более «чистыми», с меньшим количеством шума и артефактов. А вот v5.2 до сих пор нравится многим за более «художественный» почерк, который при увеличении иногда смотрится даже выигрышнее, чем холодная точность шестой версии.
Пошаговая схема для максимального разрешения
Итак, весь процесс от промта до финального файла складывается в довольно простую цепочку. Сначала — скрупулёзно составленный промт с указанием детализации и стилистики. Затем — генерация нескольких сеток и выбор наиболее удачного варианта. После — первичный апскейл кнопкой U, а следом — повторный через Upscale (4x). На этом этапе изображение уже достигает 4096×4096 пикселей. Далее скачиваем файл в PNG и открываем его в Topaz Gigapixel AI (или любом другом внешнем апскейлере). Выставляем увеличение в 2x — и получаем финальные 8192×8192 пикселей. Это уже около 67 мегапикселей. Для сравнения: большинство профессиональных зеркальных камер снимают в диапазоне 24–50 мегапикселей. То есть наша сгенерированная картинка по разрешению превосходит фотографию с дорогущей камеры.
Подводные камни при увеличении
Не всё так гладко. Главная проблема при многократном апскейле — накопление «галлюцинаций». Каждый этап увеличения добавляет детали, которых в оригинале не было, и иногда нейросеть дорисовывает откровенную ерунду: лишние пальцы на руках (классическая болезнь Midjourney), буквы-абракадабры на вывесках, странные текстуры на коже. Тем более что каждый последующий апскейлер принимает эти артефакты за реальные детали и усиливает их. Получается эффект испорченного телефона. Поэтому после каждого этапа стоит внимательно осматривать изображение при 100% увеличении и, если нужно, подчищать огрехи вручную в Photoshop.
Ещё один нюанс — вес файлов. Картинка 8192×8192 в формате PNG может весить 80–120 мегабайт. А если речь о ещё большем разрешении, то счёт пойдёт на сотни мегабайт. Для веб-публикации такой файл, конечно, не годится, да и далеко не каждый компьютер его быстро откроет. Стоит заранее определиться с целью: если картинка нужна для интернета — хватит 2x апскейла внутри Midjourney, если для печати формата А3 — достаточно внешнего увеличения до 4000–6000 пикселей по длинной стороне, ну, а для баннеров и выставочных стендов придётся идти на максимум.
Бесплатные способы: реально ли обойтись без вложений?
Вопрос, который волнует многих. Да, реально. Upscayl — полностью бесплатное приложение с открытым исходным кодом, работающее на Windows, Mac и Linux. Внутри него несколько моделей на выбор: стандартная Real-ESRGAN для фотореалистичных изображений, UltraSharp для максимальной чёткости и Digital Art для иллюстраций. Результат — довольно приличный, особенно на изображениях без мелкого текста. Ещё один бесплатный вариант — запуск Real-ESRGAN через блокнот в Google Colab. Процесс не самый интуитивный (нужно скопировать код, загрузить файл, нажать пару кнопок), но для человека, который хоть раз открывал консоль, ничего сложного. И GPU Google при этом работает бесплатно, то есть по кошельку не бьёт совсем.
Когда не стоит увеличивать?
Бывают ситуации, когда апскейл — пустая трата времени. Если на исходном изображении есть грубые ошибки в анатомии, странные артефакты или «каша» из объектов на фоне, никакой апскейлер это не исправит. Он лишь увеличит проблему. В буквальном смысле. Да и абстрактные работы, стилизованные под акварель или гуашь, при увеличении часто теряют свою изюминку — мягкие размытые края становятся резкими, и вся атмосфера улетучивается. В таких случаях лучше перегенерировать изображение с другими параметрами или подобрать другой промт, чем пытаться спасти неудачный результат механическим увеличением.
Качественное увеличение изображений из Midjourney — процесс не сложный, но кропотливый, требующий внимания к деталям на каждом этапе. Освоив связку «грамотный промт + встроенный апскейл + внешний инструмент», вы получите картинки, пригодные для любых задач — от обложки книги до огромного выставочного плаката. Ну, а если всё сделано правильно, то отличить нейросетевое изображение от профессиональной фотографии на печати не сможет даже самый скрупулёзный критик. Удачи в экспериментах — результаты наверняка порадуют.

