Как изменилась нейросеть Midjourney за 2023 год

Ещё в конце 2022 года львиная доля пользователей воспринимала Midjourney как забавную игрушку — генератор причудливых картинок, на которых у людей то шесть пальцев, то три руки, а фон напоминает кашу из масляных мазков. Да, результат приковывал внимание, но скорее курьёзностью, чем качеством. Многие дизайнеры и иллюстраторы посмеивались, а кто-то и вовсе отмахивался: мол, до серьёзного инструмента этой нейросети как до Луны. И вот прошёл всего один календарный год — 2023-й, — а от тех снисходительных улыбок не осталось и следа. Но чтобы по-настоящему оценить масштаб перемен, стоит разложить их по полочкам и проследить, как именно Midjourney превратилась из «забавной штуки» в грозное профессиональное оружие.

Версия 5: первый грандиозный скачок

Март 2023 года. Команда Дэвида Хольца выкатывает пятую версию модели, и интернет буквально взрывается. Дело в том, что разница между четвёртой и пятой итерациями оказалась настолько колоссальной, что многие пользователи поначалу отказывались верить: неужели тот же самый сервис? Лица на портретах вдруг стали выглядеть как студийные фотографии — с правильной анатомией, естественным освещением и текстурой кожи, которую хотелось потрогать. Руки — давний бич всех генеративных моделей — наконец-то перестали превращаться в щупальца. Не идеально, конечно, но прогресс бросался в глаза даже обывателю. А ведь именно корявые пальцы до этого момента считались безошибочным маркером «это нарисовал ИИ».

Стоит отметить, что вместе с V5 появился и довольно важный нюанс — модель стала гораздо послушнее в отношении промтов. Раньше нейросеть частенько интерпретировала запросы по-своему, додумывая детали и игнорируя половину описания. Теперь же точность следования текстовому описанию выросла ощутимо. Написал «рыжий кот на подоконнике в лучах закатного солнца» — получил именно это, а не абстрактное нечто с оранжевыми пятнами. Впрочем, капризничать модель всё равно продолжала, особенно со сложными многоэлементными сценами. Но направление задано верное.

Что изменилось в детализации и фотореализме?

Революция фотореализма. Именно так можно охарактеризовать тренд, который набирал обороты весь 2023 год. Ведь если ранние версии Midjourney тяготели к стилизации — этакой цифровой живописи с размытыми фонами и нарочито «художественной» подачей, — то начиная с пятой итерации акцент сместился в сторону гиперреалистичной детализации. Текстура дерева, блики на металле, рассеянный свет в тумане — всё это модель научилась воспроизводить на уровне, от которого у фотографов начинали нервно подёргиваться веки. К слову, именно в этот период соцсети заполонили «фейковые» фотографии — от якобы задержания Дональда Трампа до Папы Римского в дизайнерском пуховике. И самое удручающее (или впечатляющее — это с какой стороны посмотреть) заключалось в том, что отличить подделку от настоящего снимка становилось всё сложнее.

Все лучшие нейросети мира теперь в твоём кармане! ⚡

Тексты, топовое видео, картинки и аудио. Самые мощные версии GPT, Claude, Midjourney, Sora, Kling и еще 90+ ИИ-моделей собраны в одном месте. Работает невероятно быстро: через удобный сайт или прямо в Telegram. Больше никаких блокировок, VPN, иностранных карт и переплат.

Жми на ссылку ниже и забирай свои бесплатные генерации для тест-драйва платформы 👉 https://clck.ru/3RNCRL

Особый интерес вызывает работа модели с материалами и поверхностями. В V4 бархат выглядел как пластик, а стекло — как мутная жижа. К середине 2023 года всё изменилось. Бархат стал бархатом — с характерным ворсом, переливами, глубиной цвета. Стекло начало по-настоящему преломлять свет. Кожа на портретах обрела поры и мелкие морщинки. Ну и, конечно же, волосы — отдельная боль генеративных сетей — наконец-то перестали напоминать парик из ниток. Каждая прядь, каждый выбившийся локон теперь прорисовывался с дотошной скрупулёзностью.

Версия 5.1 и 5.2: шлифовка мастерства

Между мартом и июнем команда не сидела сложа руки. Промежуточные обновления — V5.1 в мае и V5.2 в июне — вносили на первый взгляд косметические, но на практике весьма ощутимые коррективы. Первое, что бросалось в глаза, — улучшенная «эстетика по умолчанию». Проще говоря, даже простенький промт без детальных указаний стиля стал выдавать результат куда более привлекательный, чем раньше. Модель словно научилась «чувствовать» композицию — грамотнее расставлять объекты, выбирать более гармоничную цветовую палитру, выстраивать глубину кадра.

Но вот что действительно приковывало внимание профессионалов — появление режима high variation mode и zoom out. Последний позволял «отъехать» камерой от уже сгенерированного изображения, дорисовывая окружение за пределами исходного кадра. Казалось бы, мелочь. Однако для дизайнеров и концепт-художников это стало настоящим спасательным кругом: больше не нужно перегенерировать картинку целиком, если не хватает пространства по краям. А функция pan (панорамирование) дополнила «зум-аут», позволяя расширять изображение в любом направлении. И всё это — без потери стилистической целостности. Довольно впечатляющий результат для нескольких месяцев разработки.

Стоит ли называть V5.2 прорывом?

Здесь мнения расходятся. Часть сообщества восприняла обновление восторженно, а другая — с лёгким разочарованием. Дело в том, что V5.2, по ощущениям многих пользователей, стала чуть «своевольнее». Модель начала сильнее «приукрашивать» промты, добавляя эстетические элементы, о которых никто не просил. Хочешь минималистичный натюрморт — получаешь пышную композицию с драматичным освещением. Этакий внутренний «бомонд» нейросети, её стремление к красивости. Многие считали это минусом, ведь контроль над результатом — штука щепетильная, и отдавать его на откуп алгоритму не всегда хочется. Но на самом деле для большинства задач это пошло на пользу: средний уровень генераций заметно вырос.

Как менялась работа с текстом внутри изображений?

Подводные камни. Вот что приходит на ум, когда речь заходит о тексте в картинках Midjourney. Буквально до середины 2023 года любая попытка добавить надпись на сгенерированное изображение оборачивалась кашей из полуслов, несуществующих символов и букв-мутантов. Нейросеть просто не понимала, что такое шрифт и как складывать буквы в осмысленные слова. И вот ближе к осени ситуация начала потихоньку меняться. Конечно, до идеального рендеринга текста было ещё далеко — ту же задачу DALL·E 3 от OpenAI решал несколько лучше. Но прогресс всё-таки наметился: короткие слова из четырёх-пяти букв модель стала воспроизводить довольно корректно, особенно если шрифт крупный и стиль «плакатный». Тем более что для многих задач (обложки, мокапы, концепты вывесок) даже такой уровень — уже неплохо.

Niji Mode и стилизация под аниме

Отдельная ветвь развития — режим Niji, заточенный под генерацию иллюстраций в стиле аниме и манги. В 2023 году он получил собственное крупное обновление — Niji V5, — и результаты, мягко говоря, впечатлили. Персонажи с чистыми линиями, выразительной мимикой, детализированными костюмами — всё это стало доступно буквально по одному текстовому запросу. Японское арт-сообщество встретило обновление неоднозначно: одни художники увидели в нём удобный инструмент для быстрого прототипирования, другие — прямую угрозу заработку. Впрочем, этот спор выходит за рамки технического обзора. Важнее другое: Niji V5 продемонстрировал, что тонкая стилистическая настройка — уже не фантазия, а вполне рабочий механизм. Ведь именно умение мимикрировать под конкретное направление искусства отличает добротный генеративный инструмент от простой «рисовалки».

Что насчёт скорости и удобства?

Тут перемены оказались не менее существенными, хотя и не такими «фотогеничными». На протяжении всего 2023 года Midjourney постепенно снижала время генерации. Если в начале года на создание четырёх вариантов изображения уходило порядка 50–60 секунд, то к осени этот показатель сократился примерно до 30–40 секунд на стандартных настройках. Режим turbo, появившийся в середине года, вообще умудрялся выдавать результат за 10–15 секунд — правда, за дополнительную плату в виде удвоенного расхода «быстрых минут». Бьёт ли это по бюджету? Зависит от интенсивности использования. Для профессионала, генерирующего сотни картинок в день, расход ощутимый. А вот для обычного пользователя с базовой подпиской — не сильно ударит по кошельку.

Кроме того, изменился и сам интерфейс взаимодействия. Весь 2023 год команда работала над веб-версией — полноценным сайтом, который должен избавить пользователей от необходимости генерировать картинки через Discord. Бета-версия сайта появилась ближе к концу года, и первые впечатления оказались довольно тёплыми. Наконец-то — нормальная галерея, удобная навигация, возможность организовать собственные коллекции. Discord, конечно, никуда не делся и по-прежнему оставался основной платформой, но вектор развития обозначился чётко: будущее за собственным веб-приложением.

Версия 6: финальный аккорд года

Декабрь 2023-го. Команда выпускает альфа-версию V6, и сообщество замирает. Вот он — тот самый финальный грандиозный рывок, который многие ждали. Первое, что бросалось в глаза, — кардинально улучшенное понимание промтов. Модель стала разбирать сложные многоуровневые описания с пространственными отношениями между объектами. «Красная кружка стоит на книге, а рядом лежит ложка» — и все три объекта оказывались именно там, где указано. Раньше о таком приходилось только грезить.

Но главная изюминка V6 — работа с текстом. Те самые надписи, которые ещё полгода назад превращались в нечитаемую абракадабру, теперь рендерились куда аккуратнее. Не идеально — длинные фразы по-прежнему вызывали затруднения. Однако короткие слова и заголовки модель воспроизводила с впечатляющей точностью, особенно если заключить нужный текст в кавычки прямо в промте. К тому же улучшилась и общая когерентность изображений: меньше артефактов, логичнее композиция, естественнее переходы между элементами сцены. Одним словом — шаг вперёд, причём внушительный.

Обе стороны медали: что не получилось?

Не стоит идеализировать прогресс Midjourney за 2023 год. Ложка дёгтя нашлась, и не одна. Во-первых, проблема с авторскими правами так и осталась нерешённой. Модель по-прежнему обучена на миллиардах изображений из интернета, и вопрос «а законно ли это?» висел в воздухе весь год. Несколько крупных судебных исков — в том числе от группы художников во главе с Карлой Ортис — продолжали медленно продвигаться по американской судебной системе. Никакого окончательного вердикта до конца 2023-го вынесено не было, и неопределённость нервировала как создателей контента, так и самих разработчиков.

Во-вторых, политика модерации контента вызывала немало вопросов. На протяжении года Midjourney ужесточала фильтры, блокируя генерацию изображений реальных публичных персон и откровенного контента. С одной стороны, понятно — скандал с «арестом Трампа» и «Папой в пуховике» показал, какой разрушительной силой может обладать реалистичная подделка. С другой — фильтры порой срабатывали слишком агрессивно, блокируя безобидные запросы. Да и сама система банов за нарушения оставалась довольно непрозрачной: пользователей порой отключали без внятного объяснения причин.

Как нейросеть повлияла на рынок?

Задача не из лёгких — оценить влияние одного инструмента на целую индустрию. Но определённые контуры обозначились уже к середине года. Стоковые фотобанки, например Shutterstock и Adobe Stock, начали интегрировать генеративные модели прямо в свои платформы, а некоторые — создавать отдельные разделы для ИИ-контента. Фриланс-рынок иллюстрации ощутил давление: простые задачи вроде создания обложек для блогов или баннеров для соцсетей всё чаще решались промтом за 30 секунд, а не заказом у художника за 30 долларов. Это связано с тем, что порог входа резко снизился: для работы с Midjourney не нужны ни графический планшет, ни годы обучения рисованию — достаточно подписки за 10 долларов в месяц и умения формулировать мысли на английском.

Впрочем, опытные художники быстро нашли свою нишу. Те, кто воспринял нейросеть не как конкурента, а как инструмент, начали использовать Midjourney для ускорения рабочего процесса — генерировать черновые концепты, экспериментировать с цветовыми решениями, создавать мудборды за считанные минуты. И вот тут нюанс: Midjourney не заменяла творческое мышление, она лишь ускоряла его визуализацию. Для рутинных задач — спасательный круг. Для сложных авторских проектов — всего лишь отправная точка.

Сообщество и культура промтинга

Нельзя не упомянуть и культурный феномен, который оформился вокруг Midjourney к 2023 году. Промт-инженерия — так стали называть искусство составления текстовых запросов — превратилась в самостоятельную дисциплину. Появились курсы, гайды, целые Telegram-каналы с разбором удачных промтов. Люди обменивались «рецептами» так же, как кулинары — рецептами пирогов. «Добавь cinematic lighting и shallow depth of field — и получишь кинематографичный кадр», — советовали бывалые пользователи новичкам. К слову, именно с выходом V5 промтинг усложнился: модель стала понимать более тонкие указания, а значит, и манипулировать ею можно было точнее. Это одновременно расширило возможности и подняло планку навыков.

А ещё 2023-й запомнился первыми крупными конкурсами и выставками ИИ-арта, где работы, созданные в Midjourney, солировали наравне с традиционным цифровым искусством. Дискуссия о том, можно ли считать такие работы «искусством» в полном смысле слова, не утихала ни на день. Но факт остаётся фактом: генеративные изображения начали продавать на аукционах, использовать в рекламных кампаниях крупных брендов и даже печатать на обложках журналов. Мир привыкал к новой реальности — пусть и с опаской.

Чего ждать дальше?

К концу 2023 года Дэвид Хольц в нескольких интервью намекнул на планы по развитию видеогенерации и 3D-моделирования. Тем более что конкуренты — Runway, Pika Labs, Stability AI — уже активно осваивали эти территории. Midjourney же пока сконцентрировалась на совершенствовании статичных изображений, доводя их качество до такого уровня, что отличить сгенерированную фотографию от настоящей без специальных инструментов становилось практически невозможно. И это, пожалуй, главный итог года: нейросеть перешла из категории «игрушка для энтузиастов» в категорию «серьёзный профессиональный инструмент».

2023-й год для Midjourney — это путь от любопытной новинки к инструменту, с которым приходится считаться всей креативной индустрии. Пять крупных обновлений модели, кардинальное улучшение фотореализма, появление веб-интерфейса и всё более тонкое понимание пользовательских запросов — всё это произошло за каких-то двенадцать месяцев. Да, подводных камней хватает: вопросы авторского права, этические дилеммы, несовершенство фильтров. Но темп развития внушает уважение. Тем, кто ещё не попробовал Midjourney в деле, стоит это сделать — хотя бы ради того, чтобы своими глазами увидеть, на что способен современный генеративный добротный инструмент. А тем, кто пользуется ей давно, — удачи в освоении шестой версии. Она того стоит.

Как изменилась нейросеть Midjourney за 2023 год

Версия 5: первый грандиозный скачок

Что изменилось в детализации и фотореализме?

Все лучшие нейросети мира теперь в твоём кармане! ⚡

Версия 5.1 и 5.2: шлифовка мастерства

Стоит ли называть V5.2 прорывом?

Как менялась работа с текстом внутри изображений?

Niji Mode и стилизация под аниме

Что насчёт скорости и удобства?

Версия 6: финальный аккорд года

Обе стороны медали: что не получилось?

Как нейросеть повлияла на рынок?

Сообщество и культура промтинга

Чего ждать дальше?

Читайте по теме

Добавить комментарий Отменить ответ

Версия 5: первый грандиозный скачок

Что изменилось в детализации и фотореализме?

Все лучшие нейросети мира теперь в твоём кармане! ⚡

Версия 5.1 и 5.2: шлифовка мастерства

Стоит ли называть V5.2 прорывом?

Как менялась работа с текстом внутри изображений?

Niji Mode и стилизация под аниме

Что насчёт скорости и удобства?

Версия 6: финальный аккорд года

Обе стороны медали: что не получилось?

Как нейросеть повлияла на рынок?

Сообщество и культура промтинга

Чего ждать дальше?

Читайте по теме

Добавить комментарий Отменить ответ

Статьи по теме

Можно ли пользоваться Midjourney бесплатно в этом году

Как правильно сгенерировать изображение в Midjourney с первого раза

Чего ждать от интеграции грядущего ChatGPT 5 и Midjourney в ближайшем будущем

Веб-интерфейс Midjourney: как генерировать картинки в браузере