Генерация изображений при помощи нейросетей ещё пару лет назад казалась уделом программистов и технических энтузиастов, а сегодня этим занимаются дизайнеры, маркетологи, блогеры и просто любопытные обыватели, которым хочется получить красивую картинку за считанные минуты. Среди всех доступных инструментов Midjourney стабильно держится в числе лидеров — и по качеству результата, и по тому особому «живописному» стилю, который бросается в глаза даже неподготовленному зрителю. Но вот ложка дёгтя: весь процесс работы с этой нейросетью завязан на мессенджере Discord, и для человека, который ни разу туда не заходил, первое знакомство может показаться довольно запутанным. А начать стоит с самого фундамента — регистрации и настройки рабочего пространства.
Что такое Midjourney и при чём тут Discord?
Midjourney — нейросетевой генератор изображений, созданный небольшой независимой лабораторией из Сан-Франциско. Команду в своё время основал Дэвид Хольц, ранее работавший в Leap Motion, и с 2022 года проект прошёл путь от закрытой бета-версии до полноценного коммерческого инструмента, которым пользуются миллионы людей по всему миру. Вся суть в том, что у Midjourney нет привычного сайта с кнопкой «загрузить фото» или отдельного приложения для телефона (хотя веб-интерфейс в 2024 году всё же появился, но с ограничениями). Львиная доля взаимодействия до сих пор происходит внутри Discord — мессенджера, изначально созданного для геймеров. Именно там, в специальных каналах, пользователь вводит текстовый запрос, а бот Midjourney возвращает готовые изображения. Непривычно? Безусловно. Но после первого часа практики антураж Discord перестаёт смущать.
Регистрация в Discord
Первый шаг — аккаунт в Discord. Без него до Midjourney попросту не добраться. Стоит зайти на официальный сайт discord.com и нажать кнопку регистрации. Потребуется указать электронную почту, придумать логин и пароль. Ничего сверхъестественного. Возраст — не младше тринадцати лет, хотя проверяют это довольно формально. После заполнения формы на указанный адрес прилетит письмо с подтверждением, и по ссылке из него аккаунт активируется. К слову, пользоваться Discord можно как через браузер, так и через десктопный клиент для Windows или macOS, а также через мобильное приложение для iOS и Android. Десктопная версия работает чуть стабильнее, да и уведомления в ней приходят надёжнее, поэтому для серьёзной работы с Midjourney она предпочтительнее.
Как попасть на сервер Midjourney?
Аккаунт готов. Что дальше? Нужно присоединиться к официальному серверу Midjourney в Discord. Сделать это проще всего через сайт midjourney.com — там на главной странице есть кнопка «Join the Beta», которая перенаправляет прямо на приглашение в Discord-сервер. После нажатия «Принять приглашение» в левой панели мессенджера появится иконка сервера — стилизованный белый парусник на тёмном фоне. Нужно отметить, что на этом сервере одновременно находятся миллионы пользователей, и в общих каналах сообщения мелькают с невероятной скоростью. Ведь каждый участник генерирует картинки, и результаты сыплются непрерывным потоком. Первое впечатление — лёгкий хаос. Но паниковать не стоит, потому что работать в этом потоке вовсе не обязательно.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Подписка и тарифные планы
Бесплатный доступ. Когда-то Midjourney щедро раздавала пробные генерации всем желающим, но те времена давно прошли. Сейчас без оплаченной подписки бот просто не станет обрабатывать запросы. Тарифов несколько, и различаются они количеством доступного «быстрого» времени генерации. Самый доступный базовый план обойдётся примерно в десять долларов в месяц и даст около двухсот генераций — для новичка этого вполне хватит на первый месяц экспериментов. Следующая ступень — стандартный тариф за тридцать долларов, где быстрого времени уже пятнадцать часов, плюс неограниченные генерации в «расслабленном» режиме (они чуть медленнее, но за них не списывается квота). Ну и, наконец, про-тариф за шестьдесят долларов и мега-тариф за сто двадцать — это уже для тех, кто генерирует изображения в промышленных масштабах. Оплата происходит прямо на сайте midjourney.com через личный кабинет, привязав банковскую карту. Кошелёк станет легче, но результат того стоит — качество генерации у Midjourney всё ещё впечатляет.
Первая команда /imagine
Сердце всего процесса — команда /imagine. Именно с неё начинается любая генерация. В строке сообщения Discord нужно набрать косую черту и слово imagine, после чего появится всплывающая подсказка бота. В поле prompt вписывается текстовое описание желаемого изображения — на английском языке, потому что нейросеть понимает его значительно лучше, чем русский. Даже простейший запрос вроде «a cat sitting on a windowsill, watercolor style» уже даст неплохой результат. Бот обработает команду и через минуту-полторы (зависит от загрузки серверов и выбранного тарифа) выдаст сетку из четырёх изображений. Каждое — вариация на тему запроса. Под картинкой появятся кнопки, и тут начинается самое интересное.
Что означают кнопки U и V?
Задача не из лёгких — разобраться с интерфейсом кнопок под генерацией, если видишь их впервые. Но на самом деле логика довольно простая. Кнопки U1, U2, U3, U4 отвечают за апскейл — увеличение выбранного изображения до полного разрешения. Цифра соответствует номеру картинки в сетке: верхняя левая — первая, верхняя правая — вторая, нижняя левая — третья, нижняя правая — четвёртая. Нажатие на U выделяет конкретное изображение и делает его крупнее, после чего открываются дополнительные опции. А вот кнопки V1, V2, V3, V4 создают четыре новые вариации на основе выбранного изображения — нейросеть берёт за основу композицию и настроение понравившейся картинки и предлагает ещё четыре похожих варианта. Кроме того, есть кнопка с иконкой перезагрузки — она полностью перегенерирует все четыре изображения по тому же промту. Это удобно, если ни один из результатов не зацепил.
Как составить грамотный промт?
Вот тут и начинается настоящее творчество. Промт — это не просто описание того, что хочется увидеть. Это, скорее, набор инструкций для нейросети, где каждое слово имеет вес. Начинать стоит с главного объекта: кто или что изображено на картинке. Затем добавляется окружение — где происходит действие, какой фон, какая атмосфера. Далее следует стиль: акварель, фотореализм, аниме, масляная живопись, киберпанк — вариантов кладезь. И последний штрих — настроение и освещение: «dramatic lighting», «soft morning light», «moody atmosphere». Многие считают, что чем длиннее промт, тем лучше результат, но на деле это не совсем так. Перегруженный запрос сбивает нейросеть с толку, и она начинает игнорировать часть слов. Оптимальная длина — от десяти до сорока слов. К слову, порядок слов тоже играет роль: Midjourney уделяет больше внимания тому, что стоит в начале промта.
Пример добротного промта: «A lonely lighthouse on a rocky cliff, stormy sea, dark clouds, cinematic lighting, oil painting style, muted colors» — всего четырнадцать слов, а результат получается на удивление атмосферным.
Параметры через двойное тире
Помимо текстового описания, в конец промта можно добавить технические параметры, которые тонко настраивают генерацию. Каждый параметр начинается с двойного тире. Один из самых востребованных — —ar (aspect ratio), отвечающий за соотношение сторон. По умолчанию Midjourney генерирует квадратные изображения, но для обложки статьи, например, куда лучше подходит формат 16:9, и тогда в конце промта нужно дописать —ar 16:9. Для портретов удобен формат 2:3 или 9:16. Следующий важный параметр — —stylize (сокращённо —s), который управляет степенью «художественности». Значения варьируются от нуля до тысячи: чем выше число, тем сильнее нейросеть отклоняется от буквального описания в пользу эстетики. Отдельно стоит упомянуть —chaos — он определяет, насколько разнообразными будут четыре варианта в сетке. При нуле все четыре картинки окажутся почти одинаковыми, при ста — радикально разными. Ну, а параметр —no позволяет исключить нежелательные элементы: например, —no text уберёт случайные надписи, которые нейросеть иногда добавляет.
Стоит ли работать в личных сообщениях с ботом?
Да, и это, пожалуй, самый комфортный способ. В общих каналах сервера Midjourney генерации всех пользователей перемешиваются в одну бурлящую ленту, и найти свой результат бывает довольно сложно. А вот в личных сообщениях с ботом Midjourney — тишина и порядок. Чтобы добавить бота в личку, достаточно найти его в списке участников сервера (имя — Midjourney Bot), кликнуть по нему правой кнопкой и выбрать «Написать сообщение». После этого все команды /imagine можно вводить прямо в личной переписке, и результаты никуда не потеряются. Ещё один удобный вариант — создать собственный Discord-сервер (это бесплатно и занимает тридцать секунд) и пригласить туда бота Midjourney. Тогда все генерации будут храниться в отдельном пространстве, а если работа ведётся в команде, коллеги смогут видеть промты и результаты друг друга.
Версии нейросети и модели
Midjourney постоянно развивается, и к середине 2025 года актуальной стала уже шестая версия модели (v6.1). Каждая новая итерация приносила заметные улучшения: v4 научилась рисовать сносные руки (до этого пальцы были настоящим проклятием нейросети), v5 добавила фотореалистичность, а v6 наконец-то стала адекватно работать с текстом на изображениях. Переключение между версиями происходит через параметр —v в конце промта — например, —v 6.1. Впрочем, по умолчанию бот и так использует последнюю версию. Кроме основной модели, существует Niji — специализированная нейросеть для генерации в аниме-стиле, разработанная совместно с японской командой Spellbrush. Для её активации в конце промта добавляется —niji 6. Результаты получаются на удивление колоритными, и для любителей японской анимации эта модель — настоящий подарок.
Как скачать готовое изображение?
Казалось бы, мелочь. Но новички часто натыкаются на этот вопрос. После апскейла (нажатия кнопки U) изображение появляется в чате Discord в полном разрешении. Нужно кликнуть по картинке, чтобы она открылась на весь экран, а затем нажать «Открыть оригинал» — откроется прямая ссылка на файл в максимальном качестве. Через правый клик мыши его можно сохранить на компьютер. Кроме того, все генерации автоматически сохраняются в личном кабинете на сайте midjourney.com — это своего рода галерея, где хранятся промты, настройки и готовые изображения. Там же картинку можно скачать в разных разрешениях или даже дополнительно увеличить.
Подводные камни для новичков
Без нюансов не обходится нигде, и Midjourney — не исключение. Во-первых, нейросеть не всегда точно следует промту, особенно если в запросе много абстрактных понятий. Конкретика творит чудеса: вместо расплывчатого «красивый пейзаж» лучше написать «alpine meadow with wildflowers, snow-capped mountains in the background, golden hour». Во-вторых, существуют запрещённые темы — Midjourney отказывается генерировать контент для взрослых, изображения насилия, а также портреты реальных публичных людей (хотя обходные пути народ находит, правила всё равно ужесточаются). Ещё одна частая проблема — «забаненные» слова: некоторые совершенно безобидные термины попадают в фильтр и блокируют генерацию. Тем более что список этих слов время от времени обновляется. И наконец, не стоит забывать о правах на изображения: согласно условиям использования, подписчики платных тарифов получают коммерческие права на свои генерации, но при бесплатном доступе (если он вдруг вернётся) права ограничены.
Продвинутые функции: blend, describe и прочие хитрости
Помимо базовой команды /imagine, у бота в арсенале есть ещё несколько любопытных инструментов. Команда /blend позволяет загрузить от двух до пяти изображений, и нейросеть сольёт их в единую композицию, смешав стили и элементы. Это удобно для создания коллажей или неожиданных комбинаций — например, смешать фотографию горного озера с текстурой мрамора. Результат бывает как грандиозный, так и откровенно странный, но экспериментировать интересно. Другая полезная команда — /describe: ей можно скормить любое изображение, и бот выдаст четыре варианта текстовых промтов, описывающих картинку. Это настоящий спасательный круг для тех, кто не может сформулировать запрос словами, но знает, на что хочет получить похожий результат. К тому же, изучая промты, которые предлагает /describe, можно здорово подтянуть собственное мастерство составления запросов.
Отдельно стоит упомянуть image prompting — возможность использовать изображение как часть промта. Для этого перед текстовым описанием вставляется прямая ссылка на картинку (её можно загрузить прямо в Discord, скопировать URL и вставить в команду /imagine). Нейросеть учтёт стиль, цветовую палитру и композицию загруженного изображения. Ещё один щепетильный момент — параметр —iw (image weight), регулирующий «вес» загруженного изображения относительно текста. При значении 2 нейросеть будет максимально ориентироваться на картинку, при 0.5 — больше на текст.
Настройки через /settings
Этот раздел многие обходят стороной. Зря. Команда /settings открывает панель с кнопками, через которые можно выбрать версию модели, режим генерации и степень стилизации — без необходимости каждый раз прописывать параметры вручную. Здесь же переключается режим скорости: Fast Mode расходует оплаченное быстрое время, Relax Mode — бесплатный, но генерация занимает от одной до десяти минут (доступен на стандартном тарифе и выше), а Turbo Mode ускоряет процесс вдвое, но и списывает квоту вдвое быстрее. Для повседневной работы разумнее всего держать Relax Mode включённым по умолчанию, а на Fast переключаться только тогда, когда результат нужен срочно. Тем более что качество в расслабленном режиме ничуть не хуже — разница исключительно во времени ожидания.
Несколько слов о веб-интерфейсе
В 2024 году команда Midjourney наконец-то запустила полноценный веб-интерфейс на сайте midjourney.com, и для многих это стало глотком свежего воздуха. Больше никакого Discord, никакого мельтешения чужих генераций — чистое рабочее пространство с полем ввода промта, галереей результатов и удобными инструментами редактирования прямо в браузере. Однако есть нюанс: на момент написания статьи доступ к веб-версии предоставляется только тем, кто уже сгенерировал определённое количество изображений через Discord. То есть совсем «с нуля» через сайт начать пока не получится — сначала придётся пройти тот самый путь через мессенджер. Впрочем, ситуация меняется довольно быстро, и, вероятно, в скором будущем порог входа снизят.
Как не потеряться в потоке генераций?
Когда первый азарт схлынет, а число сгенерированных картинок перевалит за сотню, возникнет закономерный вопрос: как во всём этом ориентироваться? Веб-галерея на midjourney.com частично решает проблему — там есть поиск по промтам, фильтрация по дате и возможность добавлять изображения в «избранное». Но по-настоящему выручает привычка сразу скачивать удачные работы и раскладывать их по папкам на своём компьютере. Да и промты стоит сохранять в отдельный текстовый файл — со временем накопится собственная библиотека «рабочих» формулировок, и необходимость каждый раз изобретать запрос с нуля попросту отпадёт. Это довольно простой, но скрупулёзный процесс, который в перспективе экономит часы работы.
Midjourney через Discord — инструмент с характером: непривычный интерфейс, англоязычные промты, подписка в долларах. И всё же результат, который выдаёт эта нейросеть, стоит потраченных усилий и средств. После десятка генераций руки начнут сами набирать /imagine, а глаз — безошибочно выхватывать удачную композицию из четырёх вариантов. Удачи в освоении, и пусть первая же картинка превзойдёт ожидания.
