Ещё пару лет назад само словосочетание «нейросеть-художник» вызывало у обывателя снисходительную улыбку — мол, машина способна разве что на цветные кляксы, а до настоящего искусства ей как до Луны. Но технологии генерации изображений рванули вперёд с такой скоростью, что сегодня дизайнеры, маркетологи и даже фотографы всерьёз обсуждают, какой инструмент выбрать для рабочих задач. Львиная доля споров крутится вокруг двух имён — Kandinsky 2.2 от «Сбера» и Midjourney от одноимённой американской лаборатории. И чтобы не блуждать среди восторженных отзывов и категоричных разочарований, стоит разобраться в нюансах самостоятельно.
Откуда взялись эти нейросети
Midjourney появилась раньше — первая бета-версия стала доступна летом 2022 года, и буквально за несколько месяцев вокруг неё сформировалось внушительное сообщество энтузиастов. Основал проект Дэвид Хольц, бывший сотрудник NASA и сооснователь компании Leap Motion. Его команда, насчитывавшая тогда едва ли дюжину человек, умудрилась создать продукт, который приковывал внимание даже далёких от технологий людей. Кстати, всё общение с нейросетью изначально шло исключительно через Discord — решение, довольно непривычное для широкой аудитории, но зато формировавшее плотную комьюнити-культуру.
Kandinsky 2.2 — детище исследовательской группы «Сбера» совместно с командой AI-разработчиков. Первая версия модели увидела свет в 2023 году, а вторая крупная итерация подтянулась ближе к осени того же года. Название — дань Василию Кандинскому, русскому художнику-абстракционисту, и это неслучайно: разработчики изначально тяготели к идее, что нейросеть должна понимать именно русскоязычные промпты без посредников в виде машинного перевода. Для русскоговорящего пользователя это весомый аргумент. Ведь попробуй-ка объясни англоязычной модели, что такое «берёзовая роща в стиле Шишкина» — нюансы неизбежно теряются.
Что насчёт доступности и цены?
Вопрос бюджета. Midjourney с весны 2023 года окончательно стала платной. Минимальный тарифный план обходится примерно в 10 долларов ежемесячно (около 30 генераций в час при ограниченном GPU-времени), а для серьёзной работы нужен план за 30 долларов и выше. Для фрилансера или небольшой студии это не то чтобы бьёт по бюджету катастрофически, но и бесплатным удовольствием не назовёшь. А ещё нужен VPN и аккаунт в Discord, что для многих российских пользователей добавляет лишних хлопот.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Kandinsky 2.2 доступен через платформу FusionBrain и мобильные приложения «Сбера». И вот тут — приятный сюрприз: базовый функционал бесплатный. Не стоит забывать, что бесплатность часто идёт рука об руку с ограничениями по скорости или количеству запросов, но для экспериментов и повседневных задач этого хватает с лихвой. К тому же, русскоязычный интерфейс и отсутствие необходимости в обходных путях делают порог входа минимальным. Буквально — зашёл на сайт, вбил промпт на родном языке, получил картинку.
Качество генерации: где прячется дьявол
Самый щепетильный момент. Сравнивать качество изображений — всё равно что сравнивать двух художников разных школ: у каждого свой почерк, своя сильная сторона. Но определённые закономерности всё-таки прослеживаются. Midjourney (особенно версия 5.2 и выше) выдаёт результат, который довольно часто принимают за реальную фотографию или иллюстрацию профессионального художника. Детализация лиц, текстура кожи, освещение — всё это на уровне, вызывающем искреннее уважение. Фотореализм — её конёк, и здесь она пока солирует.
А вот Kandinsky 2.2 действует иначе. Фотореалистичные портреты ей даются сложнее — руки порой выходят с шестью пальцами, а глаза могут «плыть» при определённых ракурсах. Однако в абстрактных композициях, стилизациях и арт-направлениях модель чувствует себя увереннее. Особый интерес вызывает то, как она работает с культурными отсылками: если попросить «зимний русский пейзаж в манере передвижников», результат зачастую оказывается на удивление атмосферным. Midjourney в аналогичной ситуации может выдать нечто красивое, но стерильное — без той самой изюминки, которую ждёшь от подобной стилизации.
Понимание промптов на русском языке
Здесь обе стороны медали видны особенно чётко. Kandinsky 2.2 разрабатывалась с прицелом на русский язык, и это бросается в глаза уже при первых экспериментах. Промпт «старый деревянный причал на озере, туманное утро, акварель» модель обрабатывает корректно, без потерь в смыслах. С Midjourney же приходится писать на английском, а если вставить русский текст — нейросеть его либо проигнорирует, либо интерпретирует непредсказуемо. Да и сам навык составления промптов на английском — отдельное искусство. Нужно знать специфическую терминологию: «cinematic lighting», «8k resolution», «unreal engine style» и прочие магические слова, которые опытные пользователи передают друг другу, как алхимические рецепты.
Стоит отметить один неочевидный нюанс. Midjourney довольно чувствительна к порядку слов в промпте и расставленным весам (через двойные двоеточия). Скрупулёзная работа над формулировками даёт в итоге потрясающий результат, но кривая обучения крутая. Kandinsky же ведёт себя проще — промпты «из головы», написанные обычным человеческим языком, воспринимает адекватно. И всё-таки глубина управления результатом у неё скромнее: тонкая настройка стиля, композиции и деталей пока не дотягивает до возможностей конкурента.
Стоит ли сравнивать скорость?
Генерация одного изображения. В Midjourney на стандартном плане процесс занимает от 30 до 60 секунд, а в режиме «Relax» (доступен на старших тарифах) — до нескольких минут. Kandinsky 2.2 через FusionBrain отрабатывает запрос примерно за 15–40 секунд, хотя при высокой нагрузке на серверы время может расти. В целом разница не критична, и гнаться за секундами тут нет особого смысла. Ведь львиная доля времени уходит не на ожидание, а на перебор вариантов и доработку промптов.
Работа со стилями и художественными направлениями
Midjourney к версии 5.2 научилась мастерски имитировать десятки стилей — от ренессансной живописи до киберпанковой графики. Её «фирменная» эстетика тяготеет к кинематографичности: насыщенные цвета, драматичное освещение, ощущение кадра из голливудского блокбастера. Многие дизайнеры уже жалуются, что работы из Midjourney стали слишком узнаваемыми — антураж «идеально красивого, но немного пластикового мира» бросается в глаза опытному взгляду. Впрочем, при грамотной работе с промптами этого эффекта можно избежать.
Kandinsky 2.2 менее предсказуема в стилевом отношении. Это и плюс, и минус одновременно. С одной стороны, модель способна выдать совершенно неожиданную интерпретацию запроса — такую, до которой человек сам бы не додумался. Подобные «случайности» иногда становятся настоящим кладезем идей для иллюстраторов. С другой стороны, добиться стабильного повторяемого результата сложнее. Если Midjourney — это добротный профессиональный инструмент с настраиваемым конвейером, то Kandinsky скорее напоминает темпераментного соавтора, который то выдаёт шедевр, то разочаровывает.
Этические ограничения и цензура
Тема неоднозначная, но замалчивать её нет смысла. Обе нейросети имеют встроенные фильтры контента. Midjourney довольно строга: попытки сгенерировать изображения реальных политиков, откровенный контент или сцены насилия блокируются на уровне модерации. А за систематические нарушения аккаунт могут заблокировать без предупреждения.
Kandinsky 2.2 тоже фильтрует запросы, но логика фильтрации порой вызывает недоумение. Безобидный запрос может внезапно попасть под ограничение, а формулировка, которая кажется сомнительной, — пройти без проблем. Это связано с тем, что алгоритмы модерации ещё дорабатываются, и баланс между свободой творчества и безопасностью контента до конца не найден. Не стоит забывать, что российская нейросеть подчиняется местному законодательству, и это накладывает дополнительные рамки.
Какая нейросеть подойдёт для коммерческих задач?
Вопрос лицензий. И это подводные камни, о которые спотыкаются многие новички. Midjourney на платных тарифах позволяет использовать сгенерированные изображения в коммерческих целях — это прописано в условиях подписки. Но тонкость в том, что бесплатный период (когда он ещё существовал) такого права не давал. К слову, компании с годовым доходом выше миллиона долларов обязаны подключать корпоративный план.
У Kandinsky 2.2 условия проще. Разработчики «Сбера» разрешают коммерческое использование результатов генерации, хотя уточнения по конкретным сценариям стоит искать в актуальной версии пользовательского соглашения — оно обновляется. Для малого бизнеса, блогеров и стартапов это довольно привлекательная история: бесплатная генерация с правом использовать картинки в рекламе, на сайте или в соцсетях. Серьёзное вложение не требуется, а результат вполне рабочий.
Интеграции и экосистема
Midjourney живёт внутри Discord. Это одновременно и её сила, и её ложка дёгтя. Сообщество делится промптами, обсуждает результаты, проводит конкурсы — комьюнити-эффект колоссальный. Но для человека, которому нужен просто рабочий инструмент без социальной обвязки, формат может показаться избыточным. Веб-интерфейс появился относительно недавно и пока не покрывает все функции.
Kandinsky 2.2 интегрирована в экосистему «Сбера» — от GigaChat до мобильных приложений. Для тех, кто уже пользуется продуктами «Сбера», это удобно: всё в одном месте, единый аккаунт, знакомый интерфейс. К тому же, существует API, позволяющий встраивать генерацию изображений в собственные сервисы. Для разработчиков это весомый аргумент, тем более что документация доступна на русском языке без махинаций с переводами.
Реалистичные портреты — камень преткновения
Отдельно стоит упомянуть генерацию человеческих лиц. Именно здесь разрыв между двумя моделями заметен сильнее всего. Midjourney научилась создавать портреты, которые вводят в заблуждение даже профессиональных фотографов — настолько правдоподобны текстура кожи, блики в зрачках, мелкие несовершенства вроде пор и родинок. Результат бывает настолько убедительным, что возникает вопрос: а не опасно ли это? Но это тема для другого разговора.
Kandinsky 2.2 с портретами справляется скромнее. Лица выглядят стилизованно, иногда «мультяшно», а при попытке добиться фотореализма всплывают артефакты — искажённые пропорции, размытые черты, странные тени. Разработчики признают это узким местом и обещают улучшения в следующих версиях. Впрочем, если задача — не фотореалистичный портрет, а, скажем, иллюстрация персонажа для книги или аватар в стилизованной манере, Kandinsky вполне справляется. Ну и, конечно же, ожидать от бесплатного инструмента уровня платного конкурента — не совсем честно.
Что выбрать новичку?
Задача не из лёгких. Многие считают, что Midjourney однозначно лучше, но на самом деле выбор сильно зависит от контекста. Если нужен фотореализм, кинематографические сцены, детализированные концепт-арты — Midjourney пока впереди. Да и сообщество вокруг неё — настоящий кладезь готовых промптов, туториалов и стилевых решений. Но кошелёк станет легче, VPN понадобится, и английский — обязателен.
А вот если русский язык — приоритет, бюджет ограничен (или его попросту нет), а задачи крутятся вокруг иллюстраций, стилизаций и арт-экспериментов, Kandinsky 2.2 станет отличным спасательным кругом. К тому же для российского пользователя всё работает «из коробки», без обходных путей и дополнительных расходов. Тем более что модель активно развивается, и каждое обновление заметно сокращает отставание от западных аналогов.
Самый разумный подход — использовать оба инструмента для разных задач. Midjourney — там, где нужен безупречный визуал и контроль над каждой деталью. Kandinsky — для быстрых черновиков, мозговых штурмов и генерации идей на родном языке. Конкуренция между нейросетями — это ведь не война, а двигатель прогресса. И выигрывает от неё прежде всего пользователь, который получает всё более мощные колоритные инструменты. Удачи в творческих экспериментах — впереди ещё много версий и обновлений, и лучшие картинки, похоже, ещё не нарисованы.

