Ещё пару лет назад генерация изображений по текстовому описанию казалась чем-то из области научной фантастики — инструментом, доступным лишь горстке энтузиастов с мощными видеокартами и навыками программирования. А сейчас любой обыватель, у которого есть аккаунт в Discord, может за считанные минуты получить картинку, от которой у профессионального иллюстратора дрогнет бровь. Midjourney — один из самых обсуждаемых генераторов изображений, и львиная доля его популярности связана именно с тем, что весь процесс происходит прямо в мессенджере, без установки отдельных программ. Звучит довольно просто, но на практике новичок натыкается на десятки нюансов: непривычный интерфейс, странные команды, загадочные параметры. Поэтому перед первым запросом стоит разобраться, как вся эта махинация работает изнутри.
Что такое Midjourney и почему именно Discord?
Midjourney – это нейросеть, которая превращает текстовое описание (промт) в изображение. Вся суть в том, что разработчики с самого начала отказались от создания отдельного приложения и встроили бота прямо в Discord. Решение неоднозначное. С одной стороны, порог входа снижается до минимума — не нужно ничего скачивать, настраивать серверы или разбираться в командной строке. С другой стороны, человек, который ни разу не пользовался Дискордом, поначалу чувствует себя как в чужом городе без карты. Но привыкание происходит быстро, буквально за один-два сеанса. К тому же в самом мессенджере сложилось огромное сообщество, где в режиме реального времени можно видеть чужие генерации, подсматривать удачные промты и учиться на чужих ошибках. Ведь именно эта открытость и сделала Midjourney настоящим кладезем вдохновения для дизайнеров, художников и просто любопытных людей.
Регистрация и первые шаги
Начать нужно с аккаунта в Discord. Если его ещё нет — процесс регистрации занимает от силы три минуты: электронная почта, логин, пароль, подтверждение. Ничего сверхъестественного. После этого стоит перейти на официальный сайт Midjourney и нажать кнопку «Join the Beta» — она перебросит прямо на сервер проекта в Дискорде. Бот автоматически добавится в список доступных, и вот тут начинается самое интересное.
На сервере Midjourney десятки каналов, и с непривычки глаза разбегаются. Основная работа новичков происходит в каналах с названием newbies — их несколько штук, пронумерованных по порядку. Именно туда вводятся первые команды. Но есть важный нюанс: с 2023 года бесплатный тариф Midjourney фактически недоступен, и для генерации изображений потребуется оформить подписку. Базовый план стартует примерно от 10 долларов в месяц, и это не сильно ударит по кошельку, если учесть, какой объём контента можно создать даже на минимальном тарифе. Впрочем, тарифы периодически меняются, так что актуальные цены лучше уточнять на официальном сайте.
Все топовые нейросети в одной подписке! 🚀
Устали оплачивать десятки сервисов отдельно и постоянно включать VPN? Появилась платформа, которая объединяет более 90 передовых ИИ в одном окне. Пишите тексты с новейшими версиями GPT и Claude, создавайте шедевры в Midjourney и генерируйте видео в Sora и Kling. Тексты, изображения, видео и музыка — всё работает на любых устройствах без «танцев с бубном».
Попробуйте бесплатно прямо сейчас! Переходите по ссылке и получите бонусные токены для старта 👉 https://clck.ru/3RNCRL
Как составить первый промт?
Промт. Это слово новички слышат чаще всего. По сути, промт — текстовое описание того, что нейросеть должна нарисовать. Вводится он через команду /imagine, которую достаточно набрать в строке сообщения любого канала на сервере Midjourney. После ввода команды появляется поле prompt, куда и вписывается описание будущей картинки. Нужно отметить, что Midjourney лучше всего понимает английский язык. Можно, конечно, попробовать и русский, но результат будет менее предсказуемым. Да и сам бот «думает» на английском, так что даже базового школьного уровня хватит, чтобы составить вполне рабочий запрос.
Хороший промт — это не просто «красивый закат». Дело в том, что нейросеть тяготеет к конкретике. Чем больше деталей — стиль, освещение, ракурс, настроение, цветовая палитра — тем ближе результат окажется к задумке. К примеру, вместо «a cat» стоит написать что-то вроде «a fluffy ginger cat sitting on a windowsill, golden hour lighting, oil painting style, warm tones». Разница в результате будет грандиозной. И всё же не стоит перебарщивать: промт длиной в три абзаца запутает нейросеть не меньше, чем слишком короткий. Золотая середина — от 10 до 60 слов, в зависимости от сложности задумки.
Что означают кнопки под результатом?
После отправки промта бот через 30–90 секунд выдаёт сетку из четырёх изображений. Под этой сеткой появляются две группы кнопок — U и V с цифрами от 1 до 4. Буква U (upscale) отвечает за увеличение конкретной картинки до полного разрешения. А буква V (variation) генерирует четыре новых варианта, похожих на выбранное изображение. Кнопка с иконкой обновления (🔄) полностью перегенерирует всю четвёрку с нуля, используя тот же самый промт.
Казалось бы, всё элементарно. Но подводные камни тут есть. Во-первых, нумерация картинок в сетке идёт не слева направо, как многие думают, а по схеме: левый верхний угол — 1, правый верхний — 2, левый нижний — 3, правый нижний — 4. Это важно. Ведь если перепутать номер, получишь увеличенную версию совсем не того изображения, которое понравилось. Во-вторых, после нажатия U появляется ещё один набор кнопок — «Vary (Strong)» и «Vary (Subtle)», позволяющих создать вариации уже увеличенной картинки с разной степенью отклонения от оригинала. Тонкая настройка, которая довольно часто спасает, когда результат почти идеален, но чего-то не хватает.
Параметры и модификаторы
Помимо текстового описания, в конце промта можно добавлять специальные параметры, которые серьёзно влияют на итоговый результат. Один из самых востребованных — —ar (aspect ratio), задающий соотношение сторон. По умолчанию нейросеть генерирует квадратные изображения 1:1, но если нужна горизонтальная картинка для обложки, стоит дописать —ar 16:9, а для вертикального портрета — —ar 2:3. Следующий важный модификатор — —stylize (или сокращённо —s), который определяет степень «художественности». Чем выше значение (от 0 до 1000), тем больше нейросеть отступает от буквального прочтения промта в пользу эстетики.
Отдельно стоит упомянуть параметр —chaos. Он управляет степенью разнообразия внутри одной генерации. При значении 0 все четыре картинки в сетке окажутся довольно похожими друг на друга. А вот при значении 80–100 результаты могут отличаться радикально — как будто промт прочитали четыре разных художника. Это удобно на этапе поиска идей, когда конкретного видения ещё нет. Ну и, конечно же, нельзя не упомянуть —no, который позволяет исключить нежелательные элементы. Если хочется пейзаж без людей, достаточно добавить —no people в конце запроса.
Стоит ли работать в личных сообщениях с ботом?
Новички поначалу генерируют картинки в общих каналах сервера. Зрелище, прямо скажем, хаотичное: десятки людей одновременно отправляют промты, результаты перемешиваются, и найти свою генерацию среди чужих — задача не из лёгких. Спасательный круг тут — работа через личные сообщения с ботом Midjourney. Для этого достаточно кликнуть на иконку бота на сервере и выбрать «Message». Команды и промты работают в личке точно так же, как в каналах, но никто не мешает и не отвлекает.
Есть и другой путь. Можно создать собственный сервер в Discord (буквально пара кликов) и пригласить туда бота Midjourney. Это делается через его профиль на официальном сервере — кнопка «Add to Server». После этого бот появится на личном сервере, и генерировать изображения получится в полном уединении. К слову, это ещё и удобнее с точки зрения организации: все результаты собраны в одном месте, ничего не теряется в бесконечном потоке чужих сообщений. Да и самим творческим экспериментам комфортнее протекать без посторонних глаз.
Продвинутые приёмы для тех, кто втянулся
После первых восторгов от генерации приходит закономерное желание — взять процесс под более скрупулёзный контроль. Один из самых мощных инструментов для этого — загрузка референсного изображения. Принцип довольно простой: перед текстом промта вставляется ссылка на картинку, и нейросеть использует её как визуальную отправную точку. Это творит чудеса, когда нужно выдержать определённую цветовую гамму, композицию или стилистику. Но стоит учитывать, что бот не копирует референс буквально — он вдохновляется им, иногда весьма вольно.
Ещё один добротный приём — команда /blend, которая смешивает от двух до пяти изображений в одно. Загрузил фотографию горного пейзажа и рисунок в стиле киберпанк — и получил футуристические горы с неоновой подсветкой. Результат каждый раз непредсказуемый, и в этом вся изюминка. К тому же Midjourney с каждой новой версией (на момент написания актуальна шестая) всё лучше понимает сложные запросы, работает с текстом внутри изображения и точнее передаёт мелкие детали вроде пальцев на руках — вечная боль ранних версий нейросетей.
Какие ошибки допускают новички чаще всего?
Самая распространённая ошибка — промт на русском языке без перевода. Midjourney, конечно, способна распознать кириллицу, но интерпретирует её крайне непредсказуемо. Иногда получается что-то забавное, но чаще — далёкое от задуманного. Не менее частый промах — игнорирование параметра соотношения сторон. Человек хочет обложку для YouTube-канала, но забывает указать —ar 16:9, и на выходе получает квадрат, который потом приходится обрезать с потерей композиции.
Третий подводный камень — слишком абстрактные описания. «Something beautiful and cool» даст результат, но непредсказуемый и, скорее всего, разочаровывающий. Нейросеть — не телепат. Она работает с конкретными словами, и чем точнее формулировка, тем ближе результат к ожиданиям. А вот четвёртая ошибка — обратная крайность, когда промт превращается в сочинение на три строки с противоречивыми указаниями. Нейросеть, пытаясь угодить всем требованиям разом, выдаёт визуальную кашу. Тем более что в длинных промтах слова в начале имеют больший вес, чем в конце, и это тоже стоит учитывать.
Нюансы подписки и лимиты
Тарифная сетка Midjourney за время существования проекта менялась не раз. На сегодняшний день базовый план (Basic) даёт около 200 генераций в месяц — для любительских экспериментов вполне достаточно. Стандартный план (Standard) снимает это ограничение в так называемом «расслабленном» режиме (relaxed mode), когда генерация занимает чуть больше времени, зато количество запросов не лимитировано. Профессиональный план (Pro) добавляет режим скрытности — промты и результаты не видны другим пользователям. Это серьёзное вложение для коммерческих задач, но для обывателя, который генерирует картинки ради удовольствия, базового тарифа хватит с лихвой.
Кстати, нужно отметить важный момент с авторскими правами. По условиям сервиса, подписчики платных тарифов могут использовать сгенерированные изображения в коммерческих целях. Однако само понятие авторства нейросетевого контента остаётся довольно туманным с юридической точки зрения — законодательство в разных странах ещё только формируется. Не стоит забывать об этом, если планируется печать на товарах или использование в рекламных кампаниях.
Как сохранить и скачать готовое изображение?
После того как нужная картинка увеличена через кнопку U, её можно открыть в полном размере, кликнув прямо по изображению в Discord. В браузерной версии откроется новая вкладка с картинкой в максимальном разрешении — оттуда скачать проще простого через правый клик мыши. В десктопном приложении Discord процесс аналогичный. А ещё все генерации автоматически сохраняются в личном кабинете на сайте Midjourney — достаточно зайти на midjourney.com и открыть раздел с архивом. Там же доступна функция поиска по промтам, что невероятно удобно, когда за пару месяцев накапливается несколько сотен изображений и вспомнить конкретный запрос уже невозможно.
Интерфейс на сайте Midjourney
С недавнего времени разработчики начали переносить функциональность из Discord на собственный веб-сайт. Веб-интерфейс выглядит куда привычнее для тех, кого пугает мессенджер с его каналами и серверами. Здесь промт вводится в обычное текстовое поле, результаты отображаются в красивой галерее, а параметры настраиваются ползунками и переключателями вместо текстовых команд. Впрочем, на момент написания статьи Discord остаётся основным рабочим инструментом, и большая часть сообщества по-прежнему сидит именно там. Но тенденция очевидна — постепенный переезд на собственную платформу идёт полным ходом.
Многие опытные пользователи всё-таки предпочитают Дискорд. Это связано с тем, что в мессенджере доступны все команды без исключения, а веб-версия пока реализована не на сто процентов. К тому же в Discord проще управлять несколькими генерациями одновременно — просто отправил пять промтов подряд и ждёшь результатов. На сайте этот процесс чуть медленнее и менее гибкий. Но для первого знакомства веб-интерфейс — отличный вариант, особенно если с Discord ранее дела не было.
Несколько хитростей напоследок
В сообществе Midjourney за годы сложился целый арсенал негласных приёмов, которые здорово улучшают результат. Один из самых колоритных — добавление имени конкретного фотографа или художника в промт. Написав «in the style of Annie Leibovitz» или «by Studio Ghibli», можно направить нейросеть в нужное стилистическое русло. Другой приём — использование так называемых «весов» через двойное двоеточие. Запись «cat::2 forest::1» говорит нейросети, что кот в два раза важнее леса, и он будет солировать в композиции. Тонкая настройка, которая приковывает внимание к нужным элементам.
Не менее полезный трюк — отрицательные веса. Конструкция «flowers::1 roses::-0.5» снизит вероятность появления роз среди цветов. Это работает точнее, чем параметр —no, хотя и требует некоторой практики. А ещё стоит задуматься о систематизации промтов: заведите отдельный текстовый файл или заметку, куда будете записывать удачные формулировки. Через пару недель активной работы с Midjourney там накопится внушительная библиотека, которая здорово ускорит будущие генерации.
Мир нейросетевой графики меняется с головокружительной скоростью — то, что вчера казалось вершиной возможностей, завтра станет базовым уровнем. И Midjourney в этой гонке занимает одну из лидирующих позиций. Само знакомство с инструментом — процесс не сложный, но увлекательный, и с каждым новым промтом понимание нейросети становится глубже, а результаты — всё более впечатляющими. Удачи в творческих экспериментах — пусть каждая генерация приносит не только красивую картинку, но и искреннее удовольствие от процесса.

