Ещё пару лет назад для работы с нейросетью Midjourney приходилось осваивать Discord — мессенджер, который изначально создавался для геймеров и к миру дизайна имел весьма отдалённое отношение. Новичков это сбивало с толку: вместо привычного интерфейса «загрузил запрос — получил картинку» человек натыкался на каналы, боты, слэш-команды и бесконечную ленту чужих генераций. Многие, не разобравшись, просто закрывали вкладку. И вот в 2024 году команда Midjourney наконец запустила полноценный веб-интерфейс на своём официальном сайте — midjourney.com. Перемена довольно серьёзная, ведь теперь весь процесс от промта до готового изображения умещается в одном окне браузера. Но чтобы не потеряться в новых возможностях, стоит разобраться, как всё устроено изнутри.
Что изменилось после ухода из Discord?
Долгое время Midjourney и Discord существовали в своеобразном симбиозе. Нейросеть росла внутри мессенджера, набирая аудиторию за счёт его инфраструктуры. Однако у такой модели хватало подводных камней. Во-первых, генерации пользователей перемешивались в общих каналах, и найти свою картинку среди сотен чужих было задачей со звёздочкой. Во-вторых, интерфейс Discord не позволял нормально организовать галерею — все результаты приходилось вытаскивать вручную. Ну и, наконец, сам факт привязки к стороннему сервису отпугивал львиную долю потенциальных пользователей, далёких от мира IT. С переходом на собственный сайт эти раздражители исчезли практически полностью.
Сейчас midjourney.com — это добротная веб-платформа, где генерация происходит в знакомой браузерной среде. Не нужно ничего скачивать. Не нужно разбираться в ботах. Достаточно открыть сайт, войти в аккаунт и начать работу. Это удобно. Ведь порог входа снизился до минимума, а функционал, наоборот, стал шире.
Регистрация и первый вход
Процесс регистрации не вызовет затруднений даже у человека, который впервые столкнулся с генеративными нейросетями. На главной странице midjourney.com бросается в глаза кнопка «Sign In», и вот тут кроется один нюанс — авторизация до сих пор идёт через учётную запись Discord. Да, аккаунт в мессенджере всё-таки понадобится, но лишь для входа. Создать его можно за пару минут, указав почту и придумав пароль. После авторизации пользователь попадает в личный кабинет, где уже ждёт чистая рабочая область. К слову, разработчики потихоньку тестируют вход через Google, так что привязка к Discord, скорее всего, скоро станет необязательной.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Стоит отметить важную деталь: бесплатного тарифа у Midjourney на момент написания статьи нет. Раньше новичкам давали около 25 пробных генераций, но эту щедрость быстро свернули из-за наплыва ботов и массовых злоупотреблений. Поэтому перед началом работы придётся оформить подписку. Базовый тариф стартует примерно с десяти долларов в месяц (точная цифра может меняться), а старшие планы отличаются количеством «быстрых» генераций и доступом к дополнительным режимам. Кошелёк станет легче, но вложение себя оправдывает — особенно если генерации нужны для рабочих проектов.
Как выглядит веб-интерфейс?
Первое, что приковывает внимание после входа, — лаконичность. Никакой наляпистости, минимум отвлекающих элементов. В верхней части экрана расположено текстовое поле для ввода промта — это и есть «сердце» всего процесса. Чуть ниже разворачивается лента с результатами генераций: и текущих, и предыдущих. Левая боковая панель содержит навигацию — переход между разделами «Explore», «Create» и «Archive». Раздел «Explore» — настоящий кладезь вдохновения, потому что там собраны лучшие работы других пользователей вместе с их промтами. А раздел «Archive» хранит всю историю ваших собственных генераций, что невероятно удобно для тех, кто работает над несколькими проектами одновременно.
Отдельно стоит упомянуть панель параметров. Справа от поля ввода прячутся настройки, которые раньше приходилось вбивать вручную через двойное тире в Discord. Теперь соотношение сторон картинки выбирается ползунком или пресетом. Версию модели (от v5 до последней v6.1) тоже можно переключить одним кликом. Появилась даже возможность задать степень «стилизации» и «хаоса» — два параметра, которые в Discord были уделом продвинутых пользователей, знавших все флаги наизусть.
Промт — фундамент генерации
Написание промта. Вот с чего всё начинается. И вот где довольно часто всплывают ошибки новичков. Многие считают, что достаточно написать «красивый пейзаж» — и нейросеть выдаст шедевр. На самом деле Midjourney тяготеет к конкретике. Чем точнее описание, тем ближе результат к задуманному. Хороший промт строится по принципу «объект + стиль + освещение + настроение + технические детали». Не стоит перебарщивать с длиной — оптимально укладываться в 40–60 слов на английском языке (да, нейросеть пока лучше понимает именно английский). Но и слишком коротким промт делать нет смысла: модель начнёт додумывать за вас, а результат окажется непредсказуемым.
Пример удачного промта: «A solitary lighthouse on a rocky cliff, golden hour, cinematic lighting, mist rolling in from the ocean, photorealistic, shot on Hasselblad, 8k detail»
К тому же в веб-интерфейсе появилась возможность использовать так называемый «describe» — загрузить любое изображение, и нейросеть сама составит текстовое описание того, что на нём видит. Это своеобразный спасательный круг для тех, кому сложно формулировать промты с нуля. Загрузил референс, получил описание, подкорректировал под свои нужды — и готово. Впрочем, слепо доверять автоматическому описанию тоже не стоит: машина может упустить важный нюанс или акцентировать внимание на второстепенных деталях.
Стоит ли разбираться в параметрах?
Безусловно. Дело в том, что параметры — это рычаги, которые превращают случайную генерацию в управляемый творческий процесс. Один из самых востребованных — «—ar» (aspect ratio), отвечающий за соотношение сторон. В веб-версии он задаётся визуально: можно выбрать квадрат 1:1, горизонтальный 16:9, вертикальный 9:16 или любую произвольную пропорцию. Далее следует параметр «—stylize» (сокращённо «—s»), который регулирует степень художественной интерпретации. При низких значениях (около 50–100) модель точнее следует промту, а при высоких (750–1000) начинает «творить» — добавлять декоративные детали, усиливать контрасты, играть со светом.
Следующий важный критерий — «—chaos». Этот параметр контролирует разнообразие результатов в рамках одной генерации. При значении 0 все четыре картинки в сетке будут довольно похожи друг на друга, а при 100 — радикально отличаться. Нужно отметить, что для коммерческих задач (логотипы, баннеры, иллюстрации к статьям) хаос лучше держать ниже 30, иначе контроль над результатом теряется. А вот для поиска идей и мозгового штурма высокий хаос — то, что нужно. Ну и, конечно же, нельзя не упомянуть «—no» — так называемый «негативный промт», позволяющий исключить нежелательные элементы. Например, «—no text» убирает надписи, которые нейросеть иногда любит добавлять совершенно непрошенно.
Работа с результатами генерации
После того как промт отправлен, нейросеть выдаёт сетку из четырёх вариантов. Время ожидания зависит от тарифа и загруженности серверов — в среднем от 30 секунд до пары минут. Под каждой сеткой расположены кнопки действий. Буквой «U» обозначается апскейл — увеличение выбранного варианта до максимального разрешения. Буквой «V» — создание вариаций на основе понравившегося изображения. Есть ещё кнопка с закруглёнными стрелками, которая запускает повторную генерацию с тем же промтом, но другим «зерном» случайности.
В веб-интерфейсе к этим базовым действиям добавились новые инструменты. Особый интерес вызывает «Vary (Region)» — функция локального редактирования. Суть в том, что пользователь выделяет кистью конкретную область на картинке, дописывает новый промт именно для этого фрагмента, и нейросеть перерисовывает только выбранную зону, оставляя всё остальное нетронутым. Это творит настоящие чудеса, когда на генерации всё хорошо, кроме, например, рук персонажа (вечная боль нейросетей) или фона, который хочется заменить. Буквально десятилетие назад подобная «магия» была доступна только профессионалам в Photoshop, а сейчас любой обыватель справится за пару кликов.
Как скачать готовое изображение?
Казалось бы, мелочь. Но и здесь есть свои тонкости. После апскейла картинка открывается на отдельной странице в полном разрешении. Скачать её можно правым кликом мыши — через стандартное «Сохранить изображение как…». Формат — PNG, что удобно для дальнейшей работы в графических редакторах. Разрешение зависит от версии модели и выбранного апскейлера: стандартный вариант выдаёт примерно 1024×1024 пикселей, а «upscale subtle» или «upscale creative» доводят до 2048×2048 и выше. Для печати на большом формате этого может не хватить, но для веб-дизайна, социальных сетей и презентаций — более чем достаточно.
Кстати, все генерации автоматически сохраняются в разделе «Archive». Не стоит забывать про эту функцию, потому что удалённую картинку восстановить уже не получится. В архиве же доступны фильтрация по дате, поиск по промту и даже группировка в папки — функция, которую сообщество просило буквально с первого дня существования сервиса. Да и для портфолио такой упорядоченный архив может стать настоящей находкой.
Подводные камни веб-версии
Было бы нечестно рассказывать только о плюсах. Ложка дёгтя тоже присутствует. Самый очевидный минус — зависимость от стабильного интернет-соединения. Если связь обрывается в момент генерации, результат может потеряться, а «быстрая» генерация при этом всё равно спишется с баланса. Неприятная ситуация, особенно на базовом тарифе, где каждая минута на счету. К тому же веб-интерфейс пока не поддерживает все функции, доступные через Discord-бота. Например, режим «—tile» для создания бесшовных паттернов работает, а вот некоторые экспериментальные флаги добираются до сайта с задержкой в несколько недель.
Ещё один щепетильный момент — авторские права. Многие грезят о том, чтобы использовать генерации Midjourney в коммерческих проектах, но не все знают правила. На платных тарифах пользователь получает право на коммерческое использование своих изображений. Однако если годовой доход компании превышает миллион долларов, требуется оформить план «Pro» или выше. Вся суть в том, что лицензионная политика Midjourney довольно гибкая, но её стоит изучить до того, как генерации попадут на обложку журнала или в рекламный макет. Иначе проблемы могут всплыть в самый неподходящий момент.
Чем веб-версия лучше Discord?
Сравнение напрашивается само собой. С одной стороны, Discord по-прежнему работает и никуда не делся — опытные пользователи продолжают генерировать через бота, потому что привыкли. С другой — веб-интерфейс выигрывает практически по всем фронтам. Здесь и наглядная галерея вместо хаотичной ленты сообщений, и удобное управление параметрами вместо ручного ввода команд, и локальное редактирование областей, которого в Discord попросту не было. Тем более что скорость генерации в обоих случаях одинаковая — серверы-то одни и те же.
Впрочем, у Discord остаётся одно преимущество — сообщество. В тематических каналах до сих пор можно подсмотреть промты других людей в режиме реального времени, задать вопрос и получить ответ от опытных «промт-инженеров». На сайте же раздел «Explore» выполняет похожую функцию, но без живого общения. Так что для обучения и вдохновения Discord всё ещё полезен, а вот для ежедневной продуктивной работы веб-версия — однозначно удобнее.
Несколько хитростей для качественных генераций
Опыт приходит с практикой, но кое-какие вещи можно перенять сразу. Одна из самых эффективных техник — использование стилевых референсов через «—sref». В поле промта добавляется ссылка на изображение, и нейросеть берёт из него цветовую палитру, настроение и общую стилистику, перенося всё это на новый объект. Результат бывает впечатляющий, особенно когда нужно выдержать серию иллюстраций в едином визуальном ключе. Отдельно стоит упомянуть «мультипромтинг» — технику разделения запроса двойным двоеточием. Например, промт «fire::2 ice::1» заставит модель отдать огню вдвое больше «внимания», чем льду, что позволяет тонко расставлять акценты внутри композиции.
Не стоит гнаться за сверхдлинными описаниями. Парадокс, но слишком подробный промт иногда работает хуже короткого. Это связано с тем, что модель пытается уместить все указания и в итоге теряет фокус. Главное — угадать с балансом между конкретикой и свободой интерпретации. А ещё стоит задуматься над порядком слов в промте: то, что стоит в начале, нейросеть воспринимает как более важное. Поэтому «object first, style second» — негласный постулат промт-инженерии.
Перспективы и планы команды Midjourney
Сервис не стоит на месте. В начале 2025 года разработчики анонсировали несколько грандиозных обновлений: встроенный видеоредактор, 3D-генерацию и продвинутый инпейнтинг прямо на сайте. Версия модели v7, по словам основателя Дэвида Хольца, должна радикально улучшить передачу текста на изображениях — одно из слабых мест всех предыдущих версий. К тому же идут разговоры о мобильном приложении, которое позволит генерировать картинки со смартфона без танцев с бубном. Если хотя бы половина обещанного сбудется, конкуренты в лице DALL·E и Stable Diffusion окажутся в довольно непростом положении.
Midjourney.com из неуклюжей витрины с кнопкой «перейти в Discord» превратился в самобытный изысканный инструмент, работать с которым — одно удовольствие. И пусть подводные камни никуда не делись, а подписка бьёт по бюджету, результат оправдывает каждый потраченный доллар. Удачи в освоении нейросетевой графики — пусть каждая генерация приближает вас к той самой картинке, которую вы задумали.

