Нейросети, генерирующие картинки по текстовому описанию, буквально пару лет назад казались чем-то из разряда научной фантастики, а сегодня ими пользуются даже школьники для оформления презентаций. Львиная доля новичков, едва услышав про Midjourney, тут же натыкается на одну и ту же загвоздку — сервис работает не через привычный сайт с кнопкой «Скачать», а через мессенджер Discord. Для тех, кто с Дискордом на «ты», проблемы нет, но вот обыватель, далёкий от геймерских сообществ, нередко впадает в ступор уже на этапе регистрации. А ведь разобраться во всём этом совсем не так сложно, как кажется на первый взгляд — нужно лишь пройти несколько конкретных шагов, и через каких-то десять минут первая сгенерированная картинка уже будет готова.
Что такое Midjourney и при чём тут Discord?
Midjourney — это нейросеть, которая превращает текстовое описание (так называемый промт) в изображение. Причём результаты зачастую поражают даже опытных дизайнеров: детализация, цветовая палитра и общая атмосфера порой выглядят так, словно над картинкой часами трудился живой иллюстратор. Но есть один нюанс, который многих сбивает с толку. Дело в том, что у Midjourney нет собственного полноценного приложения для рабочего стола или смартфона. Вся работа происходит внутри Discord — бесплатного мессенджера, изначально созданного для геймеров, но давно вышедшего за рамки игровой тусовки. Бот Midjourney «живёт» на сервере в Дискорде, и именно ему пользователь отправляет текстовые команды, получая взамен готовые изображения. К слову, в 2024 году появился и веб-интерфейс Midjourney, однако для подавляющего большинства задач Discord по-прежнему остаётся основным рабочим инструментом.
Регистрация в Discord
Первый шаг на пути к генерации картинок. Если аккаунта в Дискорде ещё нет, нужно перейти на официальный сайт discord.com и нажать кнопку регистрации. Потребуется указать электронную почту, придумать имя пользователя и пароль. Процедура занимает от силы пару минут. После этого на почту придёт письмо с подтверждением — без него аккаунт просто не активируется. Стоит отметить, что Discord доступен и как десктопное приложение, и как мобильное, и как веб-версия прямо в браузере. Какой вариант удобнее — каждый решает сам, хотя для работы с Midjourney десктопная версия всё-таки комфортнее: экран больше, и разглядывать сгенерированные картинки на нём — одно удовольствие.
Как попасть на сервер Midjourney?
Аккаунт создан. Что дальше? А дальше нужно присоединиться к официальному серверу Midjourney. Сделать это проще простого — достаточно перейти по ссылке midjourney.com, где на главной странице есть кнопка «Join the Beta». Она автоматически перебрасывает в Discord и предлагает принять приглашение на сервер. После подтверждения в левой панели мессенджера появится иконка с логотипом Midjourney. Впрочем, можно пойти и другим путём — вбить в поисковую строку Discord название «Midjourney» и найти сервер вручную. Но первый способ надёжнее, ведь подделок и фейковых серверов в сети хватает.
Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈
Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.
Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL
Оказавшись на сервере, новичок нередко теряется. Десятки каналов, тысячи сообщений, мелькающие картинки — антураж довольно хаотичный. Не стоит пугаться. Внимание стоит обратить на каналы, в названии которых фигурирует слово newbies (например, #newbies-1, #newbies-42 и так далее). Именно в них новички отправляют свои первые команды боту. Каналов таких обычно много, и все они работают одинаково — разницы между ними нет никакой.
Оформление подписки
Бесплатных генераций Midjourney больше не предоставляет. Раньше каждый новый пользователь получал около двадцати пяти пробных картинок, но эту щедрость быстро свернули из-за колоссального наплыва желающих. Сейчас для начала работы необходима платная подписка. Оформить её можно командой /subscribe, которую нужно ввести в любом канале сервера Midjourney. Бот в ответ пришлёт ссылку на страницу оплаты. Самый бюджетный тариф — Basic Plan — стоит порядка десяти долларов в месяц и даёт примерно двести генераций (около 3,3 часа работы GPU). Для новичка, который только осваивается, этого вполне достаточно. Тем более, что всегда можно перейти на более дорогой план позже, когда потребности вырастут. А вот экономить на подписке, пытаясь найти «бесплатные аналоги бота» в сторонних каналах, не стоит — велик риск нарваться на мошенников.
Первая генерация: команда /imagine
Момент истины. Вся магия Midjourney начинается с одной-единственной команды — /imagine. Набрать её нужно в строке сообщения внутри канала newbies (или на собственном сервере, о чём чуть позже). После ввода команды появится поле prompt, куда и вписывается текстовое описание будущей картинки. Например: a cozy mountain cabin at sunset, warm light, cinematic atmosphere. Нажатие Enter отправляет запрос боту, и спустя примерно минуту (иногда чуть дольше, зависит от загруженности) Midjourney выдаёт сетку из четырёх вариантов изображения.
Под каждой сеткой располагаются кнопки. Первая группа — U1, U2, U3, U4 — отвечает за апскейл, то есть увеличение выбранного варианта до полного разрешения. Цифра соответствует позиции картинки в сетке: верхний левый угол — первый, верхний правый — второй, и так далее. Вторая группа — V1, V2, V3, V4 — создаёт вариации на основе выбранного изображения, сохраняя общую композицию, но меняя детали. Ну и, наконец, кнопка с иконкой обновления (🔄) просто перегенерирует все четыре варианта заново, сохраняя тот же промт.
Как правильно составить промт?
Тут-то и начинаются настоящие подводные камни. Многие новички пишут что-то вроде «красивый пейзаж» и ждут шедевра. Результат, мягко говоря, разочаровывает. Дело в том, что Midjourney тяготеет к конкретике: чем детальнее описание, тем точнее результат. Хороший промт обычно состоит из нескольких смысловых блоков. Первый блок — это сам объект или сцена (что именно нужно изобразить). Второй — стилистика и настроение (акварель, фотореализм, тёмная атмосфера, яркие цвета). Третий — технические указания вроде освещения, ракурса или соотношения сторон. Все эти элементы вписываются в одну строку через запятую. Кстати, промты стоит писать на английском языке — нейросеть понимает и русский, но на английском результаты получаются заметно точнее и богаче.
Отдельно стоит упомянуть так называемые параметры, которые добавляются в конец промта после двойного дефиса. Параметр —ar задаёт соотношение сторон (например, —ar 16:9 для широкоформатного изображения или —ar 9:16 для вертикального). Параметр —v позволяет выбрать версию модели, хотя по умолчанию Midjourney и так использует самую свежую. А параметр —stylize (или сокращённо —s) регулирует степень «художественности»: чем выше значение, тем более творческую вольность нейросеть себе позволяет. Для первых экспериментов вполне достаточно освоить —ar и —v, а остальное придёт с опытом.
Стоит ли создавать собственный сервер?
Безусловно, да. И вот почему. В каналах newbies на официальном сервере Midjourney одновременно генерируют картинки сотни людей. Сообщения летят с бешеной скоростью, и собственный результат легко теряется в потоке чужих генераций. Это довольно неудобно, особенно когда хочется спокойно сравнить варианты или вернуться к старому промту. Решение простое — создать личный сервер в Discord и пригласить туда бота Midjourney.
Процесс выглядит так: сначала в левой панели Дискорда нужно нажать на «+» и создать новый сервер (подойдёт вариант «Для себя и друзей»). Затем вернуться на официальный сервер Midjourney, найти бота в списке участников, кликнуть на его профиль и выбрать «Добавить на сервер». Discord попросит указать, на какой именно сервер пригласить бота — выбрать свой свежесозданный. После этого бот появится на личном сервере, и все генерации будут проходить в тихой, уютной обстановке. Ни одна чужая картинка не помешает. Это удобно. Ведь так вся история запросов остаётся перед глазами.
Работа с готовыми изображениями
Картинка сгенерирована, апскейл сделан — что дальше? Для сохранения изображения на компьютер достаточно кликнуть по нему в чате Discord, дождаться открытия в полном размере и нажать «Открыть в браузере» (или просто правой кнопкой мыши — «Сохранить изображение как…»). Разрешение финального файла зависит от версии модели и выбранного апскейла, но обычно составляет от 1024×1024 до 2048×2048 пикселей. Для веб-дизайна и социальных сетей этого хватает с головой, а вот для крупноформатной печати может понадобиться дополнительная обработка через сторонние сервисы вроде Topaz Gigapixel.
Нужно отметить, что все сгенерированные изображения сохраняются и на сайте midjourney.com в личном кабинете. Там же их можно просматривать, сортировать и скачивать. К тому же на сайте доступна галерея работ других пользователей — настоящий кладезь вдохновения, особенно если на ум не приходят идеи для нового промта. Да и просто полистать чужие работы бывает приятно: иногда натыкаешься на что-то настолько впечатляющее, что руки сами тянутся к клавиатуре.
Частые ошибки новичков
Первая и самая распространённая — слишком размытые промты. «Красивая девушка на фоне природы» — это не промт, а приговор для нейросети. Результат будет усреднённый и безликий. Вторая ошибка — игнорирование параметров. Без указания соотношения сторон Midjourney по умолчанию генерирует квадратные изображения, и новичок потом удивляется, почему картинка не подходит для обложки канала на YouTube. Третья — попытка описать слишком сложную сцену с множеством персонажей и действий в одном промте. Нейросеть справляется с этим неважно: руки превращаются в макароны, лица искажаются, а логика композиции рассыпается на куски.
Ещё одна ложка дёгтя — нетерпение. Многие бросают эксперименты после двух-трёх неудачных генераций, решив, что «нейросеть не работает». На самом деле Midjourney — инструмент щепетильный, требующий итеративного подхода. Один и тот же промт, переписанный чуть иначе, способен выдать совершенно другой результат. Иногда достаточно добавить пару слов про освещение или убрать лишнее прилагательное — и картинка преображается до неузнаваемости. Не стоит гнаться за идеалом с первой попытки; терпение здесь творит чудеса.
Полезные команды, о которых стоит знать
Помимо /imagine, у бота Midjourney есть и другие команды, заслуживающие внимания. Команда /settings открывает панель настроек, где можно переключать версию модели, менять режим стилизации и активировать так называемый Remix Mode (он позволяет редактировать промт при создании вариаций). Команда /blend — довольно интересная штука — смешивает два или несколько загруженных изображений в одно. Это удобно, когда хочется объединить стиль одной картинки с композицией другой. Ну, а команда /describe работает в обратную сторону: загружаешь ей картинку, и бот генерирует текстовые описания, которые могли бы породить нечто подобное. Настоящий спасательный круг для тех, кто никак не может подобрать нужные слова для промта.
Впрочем, злоупотреблять экзотическими командами на старте не стоит. Для первых нескольких десятков генераций /imagine и параметра —ar более чем достаточно. Остальное осваивается постепенно, по мере того как приходит понимание логики нейросети. А понимание это, к слову, формируется довольно быстро — обычно хватает нескольких вечеров активных экспериментов.
Вопрос авторских прав
Тема неоднозначная, и обойти её стороной было бы неправильно. Согласно текущей политике Midjourney, пользователи платных подписок получают коммерческие права на сгенерированные изображения. Это значит, что картинки можно использовать для блогов, соцсетей, рекламных материалов и даже продавать. Однако есть тонкость: если годовой доход компании превышает миллион долларов, потребуется корпоративная подписка. Да и в целом правовое поле вокруг ИИ-генераций продолжает формироваться — в разных странах к этому вопросу подходят по-разному. Тем более, что вопрос «можно ли считать ИИ-картинку произведением искусства» юристы всего мира до сих пор обсуждают. Так что для серьёзных коммерческих проектов не помешает проконсультироваться со специалистом в области интеллектуальной собственности.
Несколько хитростей напоследок
Промт-инженерия — целая наука, но несколько приёмов способны существенно улучшить результат даже у абсолютного новичка. Во-первых, добавление в описание имён известных фотографов или художников (например, in the style of Annie Leibovitz или by Studio Ghibli) задаёт нейросети чёткий визуальный ориентир. Во-вторых, слова вроде 8k, hyperdetailed, cinematic lighting в конце промта заметно повышают общее качество изображения. Ну и, наконец, не стоит забывать про негативные промты через параметр —no: если в картинке категорически не нужен какой-то элемент (допустим, текст или люди), достаточно дописать —no text или —no people, и нейросеть постарается этого избежать.
Изюминка Midjourney — в непредсказуемости. Иногда самые абсурдные промты дают самые красивые результаты, а скрупулёзно выверенные описания порождают что-то невразумительное. В этом, собственно, и кроется главное удовольствие: каждая генерация — маленький сюрприз. Со временем интуиция подскажет, какие слова работают лучше, какие стили нейросеть «любит», а какие формулировки заводят её в тупик.
Удачи в освоении этого добротного творческого инструмента — пусть первые же результаты порадуют и вдохновят на эксперименты, которые запомнятся надолго!

