Тестируем генераторы видео и фото: Midjourney, Nano banana и Kling

Ещё каких-то три года назад за создание одной качественной иллюстрации дизайнер-фрилансер мог спокойно запросить пару тысяч рублей, а производство минутного промо-ролика обходилось заказчику в десятки тысяч. Нейросети перевернули эту игру целиком. Сегодня в сети десятки генераторов, каждый из которых обещает фотореалистичные картинки и кинематографичное видео буквально за пару секунд. Львиная доля из них — сырые поделки, но среди шума всё-таки встречаются по-настоящему добротные инструменты. А чтобы разобраться, кто из них чего стоит, нужно не читать маркетинговые лендинги, а сесть и проверить руками — что я, собственно, и сделал с тремя нашумевшими сервисами.

Все топовые нейросети в одном месте

Почему именно эти три сервиса?

Выбор пал не случайно. Midjourney к середине 2025 года успел обрасти культовым статусом среди иллюстраторов и контент-мейкеров, а его пятая и шестая версии модели породили настоящий бум «нейро-арта» в социальных сетях. Nano banana — относительно молодой проект, появившийся на радарах русскоязычного сообщества примерно год назад и стремительно набравший аудиторию за счёт агрессивной бесплатной модели и неплохой генерации видео. Ну, а Kling — разработка китайской компании Kuaishou, которая с конца 2024 года довольно серьёзно конкурирует с Runway и Pika Labs на поле видеогенерации. Все три работают по разным принципам, тяготеют к разным сценариям использования, да и по ценовой политике отличаются кардинально. Это и сделало сравнение интересным.

Midjourney: старожил с характером

Интерфейс через Discord. Звучит дико в 2025 году, но именно так изначально Midjourney и работал — промты вводились прямо в чат-бот. Сейчас появилась веб-версия с собственным редактором, однако многие пользователи по привычке остаются в Discord, и разработчики не спешат от него отказываться. Стоит отметить, что при всей неуклюжести такого подхода скорость генерации впечатляет: на шестой версии модели изображение в разрешении 1024×1024 появлялось за восемь-двенадцать секунд. Это быстро. И качество при этом не страдает.

Детализация лиц — вот где Midjourney действительно солирует. Кожа, текстура волос, блики на зрачках — всё это выглядит настолько реалистично, что отличить нейрокартинку от студийной фотографии с первого взгляда довольно сложно. Я скормил модели промт со сценой утреннего кафе: женщина за столиком, чашка латте, мягкий рассеянный свет из окна. Результат приковывал внимание. Даже пар над чашкой лёг правильно, с учётом направления освещения. Впрочем, руки по-прежнему остаются ахиллесовой пятой. В двух из четырёх сгенерированных вариантов у модели обнаружился лишний палец — классическая болезнь диффузионных моделей, от которой индустрия так до конца и не избавилась.

Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸

Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.

Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL

Ложка дёгтя — ценообразование. Базовый тариф стартует с десяти долларов в месяц и даёт около двухсот генераций. Для обывателя, который балуется нейро-артом пару раз в неделю, этого хватит. Но если речь идёт о коммерческом использовании — подготовке визуалов для соцсетей, макетов для презентаций — кошелёк станет заметно легче. Тариф Pro за шестьдесят долларов снимает ограничение на «быстрые» генерации, но и он не безлимитный. А ещё видео Midjourney пока не генерирует. Вообще. Только статичные изображения. Это серьёзный минус на фоне конкурентов, которые научились оживлять картинки.

Nano banana: бюджетный выскочка или что-то большее?

Название странное. Ведь первая ассоциация — какой-нибудь детский мобильный квест, а не серьёзный ИИ-генератор. Но за нелепой обёрткой скрывается довольно функциональный инструмент с поддержкой и фото, и видео. Регистрация занимает меньше минуты, интерфейс — браузерный, лаконичный, без лишней наляпистости. При первом входе сервис щедро отсыпает бесплатных кредитов, которых хватает примерно на тридцать-сорок генераций картинок или на пять-семь коротких видеороликов.

С фотогенерацией дело обстоит неоднозначно. Простые сцены — пейзажи, натюрморты, абстракции — Nano banana отрабатывает уверенно. Цветопередача сочная, композиция в большинстве случаев грамотная. Но стоит усложнить промт, добавить несколько персонажей или запросить конкретную позу, и ошибки всплывут мгновенно. Во время теста я попросил нарисовать двух людей, пожимающих друг другу руки на фоне делового центра. Результат? Руки сплелись в нечто, напоминающее скульптуру Гигера, а здание на заднем плане поехало перспективой. Не катастрофа, но до уровня Midjourney — пропасть.

Зато видео. Вот тут Nano banana реально удивляет. Генерация коротких роликов (до четырёх секунд) работает на собственной модели, и движение получается плавным, без характерного «желейного» эффекта, которым грешат многие конкуренты. Я задал сцену: морская волна набегает на песчаный берег, камера медленно поднимается вверх. Четыре секунды чистой визуальной поэзии. Пена на волне выглядела натурально, песок блестел от влаги. Да и само движение камеры получилось именно таким, каким я его задумал. К слову, генерация заняла около сорока пяти секунд — вполне терпимо.

Стоит ли экономить на нейросетях?

Вопрос не праздный. Ведь бесплатные кредиты Nano banana заканчиваются быстрее, чем кажется, а платные тарифы начинаются от семи долларов в месяц. Это не сильно ударит по кошельку, но нужно понимать, за что платишь. В отличие от Midjourney, где каждый доллар конвертируется в стабильно высокое качество, у Nano banana результат пляшет. Один и тот же промт может дать шедевр, а через минуту — нечто совершенно негодное. Стабильность — тот нюанс, который отделяет профессиональный инструмент от интересной игрушки. И об этом не стоит забывать тем, кто планирует использовать генератор для рабочих задач.

Kling: китайский ответ голливудским нейросетям

Тяжёлая артиллерия. Kling изначально создавался как генератор видео, и фото для него — скорее побочная функция. Модель версии 1.6, которую мне удалось потестировать, работает с роликами длительностью до десяти секунд в разрешении 1080p. Для 2025 года это внушительный показатель, тем более что большинство конкурентов ограничиваются четырьмя-пятью секундами при 720p.

Первое, что бросается в глаза, — физика движений. Я задал промт: мужчина в деловом костюме быстро идёт по дождливой улице, камера следует за ним. Kling справился блестяще. Капли дождя отскакивали от плеч пиджака, отражения в лужах двигались синхронно с персонажем, полы пиджака покачивались от шагов. Ни один другой генератор из тех, что я пробовал за последние полгода, не выдавал такую правдоподобную динамику тканей. Это впечатляет. По-настоящему.

Но есть и подводные камни. Во-первых, скорость генерации — примерно три-четыре минуты на десятисекундный ролик в максимальном качестве. Для сравнения: Nano banana тратит на четырёхсекундный клип меньше минуты. Во-вторых, Kling довольно щепетильно относится к текстовым промтам — писать нужно на английском, максимально детально описывая каждое действие, ракурс камеры и освещение. Короткие лаконичные промты, которые прекрасно работают в Midjourney, здесь дают размытый, невнятный результат. Ну и, наконец, бесплатный тариф настолько урезан, что всерьёз протестировать сервис без подписки практически невозможно (шестьдесят шесть кредитов в день — это буквально два-три ролика).

Фотогенерация в Kling: приятное дополнение

Многие считают, что Kling — исключительно видео-инструмент, но на самом деле у него появился и режим генерации статичных картинок. Результат — крепкий средний уровень. До Midjourney не дотягивает, но и откровенного мусора не выдаёт. Особый интерес вызывает режим «image-to-video»: загружаешь готовое фото (хоть из Midjourney, хоть собственное), описываешь желаемое движение, и Kling оживляет статичный кадр. Именно этот сценарий мне показался самым перспективным. Я взял сгенерированное в Midjourney фото девушки на балконе, попросил Kling добавить лёгкий ветер, шевелящий волосы и занавеску. Получилось атмосферно. Волосы двигались естественно, занавеска колыхалась с правильной амплитудой, а фоновый городской пейзаж оставался неподвижным — именно так, как в реальной видеосъёмке.

Что насчёт качества текста в картинках?

Классическая головная боль всех генеративных моделей — надписи. Стоит попросить нарисовать вывеску магазина или обложку книги с конкретным текстом, и начинается хаос. Midjourney в шестой версии научился сносно рисовать короткие слова на латинице — три-четыре буквы обычно выходят без ошибок. Но кириллица по-прежнему превращается в нечитаемую кашу. Nano banana с текстом справляется ещё хуже — буквы «плывут», дублируются, путают порядок. А вот Kling, как ни странно, показал лучший результат среди тройки. Английские надписи до шести-семи символов получались чёткими и читаемыми. Кириллица — всё ещё боль. Но прогресс очевиден.

Как выбрать генератор под свои задачи?

Вся суть в том, что «лучшего» генератора попросту не существует. Каждый из протестированных инструментов тяготеет к своей нише. Midjourney — кладезь для тех, кому нужны изысканные статичные изображения: иллюстрации для блогов, концепт-арт, эскизы интерьеров, стильные портреты. Этот сервис — зрелый, предсказуемый, с огромным сообществом и тоннами обучающих материалов. Он стоит на ногах уверенно. Но если нужно видео — придётся искать союзника.

Nano banana — спасательный круг для тех, у кого ограничен бюджет, а задачи не требуют безупречной точности. Быстрое создание коротких видео для TikTok или Reels, иллюстрации для телеграм-каналов, мемы и визуальный контент для развлекательных пабликов — вот его территория. Серьёзное вложение здесь не требуется, порог входа минимальный. Но не стоит ждать от него стабильного студийного качества.

Kling — выбор для тех, кто грезит о кинематографичном видеоконтенте и готов потратить время на скрупулёзную проработку промтов. Рекламные ролики, анимированные превью для YouTube, оживление фотографий — здесь он творит чудеса. Да и десять секунд видео в 1080p — это внушительный козырь, с которым мало кто может конкурировать на сегодняшний день.

Неочевидные нюансы тестирования

Отдельно стоит упомянуть несколько вещей, которые всплыли уже в процессе работы и не бросаются в глаза при чтении рекламных описаний. Midjourney при генерации крупных планов лиц иногда выдаёт так называемый «эффект кукольности» — кожа становится слишком гладкой, неестественно идеальной, без пор и мелких морщинок. Решается это добавлением в промт слов вроде «raw photo» и «imperfections», но новичок о таком лайфхаке может не догадываться. С Nano banana другая история: сервис периодически «забывает» часть промта. Просишь закат с фиолетовым небом и силуэтом маяка — получаешь закат, фиолетовое небо, но маяк куда-то испаряется. Приходится перегенерировать два-три раза. Kling же грешит избыточной «драматизацией» — даже нейтральные сцены модель стремится подать с кинематографичным пафосом, добавляя контрастное освещение и глубокие тени туда, где их никто не просил.

К тому же нужно учитывать вопрос цензуры. Все три сервиса имеют фильтры контента, но работают они по-разному. Midjourney — самый строгий: на определённые запросы он просто отказывается реагировать и выдаёт предупреждение. Nano banana чуть лояльнее, но тоже режет немало тем. Kling занимает промежуточную позицию. Для коммерческого использования это не критично, но если речь о художественных проектах с провокационной тематикой — стоит знать заранее.

Все топовые нейросети в одном месте

Сравнительный тест: одна и та же сцена в трёх генераторах

Финальный эксперимент. Ради чистоты сравнения я задал всем трём сервисам одинаковый промт: «старый деревянный причал на озере, раннее утро, туман, лодка у берега, мягкий золотистый свет». Midjourney выдал картинку, которую хотелось повесить на стену — идеальная атмосфера, тёплый колорит, детализированная текстура дерева на причале. Каждая доска жила своей жизнью, туман мягко обволакивал деревья на заднем плане. Настоящий изысканный пейзаж из фотоальбома.

Nano banana справился хуже. Общая композиция — достойная, но туман получился скорее «молочной пеленой», наложенной поверх картинки, а не органичным атмосферным явлением. Лодка вышла непропорционально маленькой, а причал — слишком новым для слова «старый» в промте. Впрочем, если не сравнивать напрямую с Midjourney, результат вполне годный для иллюстрации в блоге или поста в социальной сети. И вот тут-то Kling удивил сильнее всего. Я попросил сгенерировать этот же промт в видеоформате, и десятисекундный ролик буквально заставил меня задержать дыхание. Камера медленно скользила над водой к причалу, туман рассеивался слоями, по глади озера пробегала лёгкая рябь. Это было красиво. По-настоящему красиво. И никакой «желейности».

Стоит помнить: ни один генератор не заменит полностью живого фотографа или оператора. Но как инструмент для прототипирования, создания черновых визуалов и решения мелких повседневных задач — каждый из этой тройки уже сегодня способен сэкономить часы рабочего времени.

Куда движется индустрия?

Буквально год назад генерация четырёхсекундного видео казалась прорывом, а сейчас Kling выдаёт десять секунд в Full HD и явно не собирается останавливаться. Midjourney, по слухам из закрытого бета-сообщества, тестирует собственную видеомодель — и если она окажется на уровне их фотогенерации, конкурентам придётся сильно напрячься. Nano banana делает ставку на доступность и скорость, и для массового пользователя это, пожалуй, самый привлекательный подход. Рынок генеративных медиа ещё далёк от насыщения, и обе стороны медали — потрясающие возможности и серьёзные этические вопросы — будут лишь обостряться с каждым новым обновлением моделей.

Так что если вы давно присматривались к нейросетевым генераторам, но не решались окунуться в эту тему — сейчас самый подходящий момент. Midjourney для безупречных картинок, Kling для грандиозного видео, Nano banana для быстрых экспериментов без серьёзных затрат. Комбинация двух, а то и всех трёх сервисов порадует результатом даже самого скептически настроенного пользователя. Удачи в творческих экспериментах — и пусть промты всегда попадают в цель с первого раза.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *