Миджорни или нано банана

В сети представлено множество ожесточённых дискуссий о том, чей генератор изображений выдаёт самую «живую» картинку, заставляя цифровой бомонд ломать копья на профильных форумах. Буквально десятилетие назад само понятие нейросетевого арта казалось чем-то из области научной фантастики, но сейчас генерации льются рекой, а далёкий от индустрии обыватель уже физически не отличает рендер от реальной фотографии. Многие считают, что монополия навсегда закреплена за знаменитой сетью с логотипом парусного кораблика, но на самом деле технологические корпорации не дремлют. Естественно, выход продукта от Google под ироничным названием Nano Banana спутал карты даже самым скрупулёзным промпт-инженерам, привыкшим к устоявшимся правилам игры. Но чтобы не ошибиться в выборе рабочего инструмента для своих будущих проектов, нужно детально разобрать обе стороны медали.

Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸

Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.

Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL

С чего начинается выбор?

Ползунок стилизации выкручен на максимум, параметр хаоса задан где-то на уровне сотни, а в результате на мониторе появляется совершенно непредсказуемая, но чарующая наляпистость. Именно так довольно часто выглядит рабочий процесс в Midjourney. Ведь этот грандиозный генератор исконно тяготеет к художественной выразительности, где каждый сгенерированный пиксель словно пропитан авторским видением алгоритма. А вот Nano Banana работает совершенно иначе. Постулаты этой мощной нейросети зиждутся на жесточайшем подчинении текстовому запросу. Сложно ли добиться от гугловской разработки лёгкой творческой небрежности? Да, сделать это довольно сложно, поскольку система была натренирована выдавать максимально добротный фотореалистичный результат без лишних фантазий. Разумеется, для коммерческого дизайна такой щепетильный точный подход творит чудеса. Привыкшие к творческому хаосу авторы натыкаются на жёсткие рамки, когда пытаются использовать старые текстовые конструкции в совершенно новой среде.

Доступность платформ

Никаких установочных файлов. Скачивать на свой жёсткий диск терабайты весовых коэффициентов в обоих случаях вам не придётся. Вся суть в том, что тяжёлые вычисления происходят исключительно на удалённых мощных серверах компаний. К слову, доступ к гугловскому детищу организован весьма самобытно. Начать взаимодействие логичнее всего через их минималистичный официальный сайт, где пользователю сразу открывается базовый функционал без лишних настроек. Далее следует этап интеграции через сторонние агрегаторы нейросетей, куда проект внедряется довольно агрессивно и быстро. Ну и, наконец, для самых требовательных студий открыт полноценный доступ по API, позволяющий встраивать генерации прямо во внутренние пайплайны. Не стоит забывать, что любые попытки найти «взломанную» версию для локального запуска приведут лишь к заражению компьютера вирусами. Ведь такие махинации с закрытыми облачными архитектурами попросту невозможны.

Стилистика: изысканный арт или колоритный реализм?

Выглядит впечатляюще. Пожалуй, именно эта фраза первой приходит на ум, когда разглядываешь портреты, сгенерированные в шестой версии Midjourney. Алгоритм за долгие годы обучения впитал львиную долю мирового визуального наследия, поэтому здесь солирует именно художественная эстетика. В то время как главное достояние Nano Banana — потрясающая физическая точность работы со светом и материалами. Корпус виртуального фотоаппарата, усиленный рёбрами жёсткости, отлитый из матового полиамида, снабжённый хромированными вставками, будет передан нейросетью от Google с пугающей достоверностью. Именно эта особенность приковывает внимание опытных рекламщиков. К тому же искусственный интеллект от поискового гиганта практически не ошибается в анатомии пальцев или строении человеческого глаза. Тем более, что встроенный в систему фильтр цензуры строго следит за тем, чтобы на экран не выводился сомнительный или жестокий контент. Впрочем, иногда эта излишняя строгость становится настоящей проблемой для концепт-артистов, которым нужен мрачный вычурный антураж.

Как формируется идеальный запрос?

Сработает ли старый текст в новой оболочке? Вовсе нет. Специфический лексикон запросов для «кораблика» требует знания огромного множества параметров, прописываемых через двойное дефис в самом конце строки. Процесс формирования идеального кадра здесь напоминает настройку громоздкого студийного оборудования: сначала задаётся основная тема, затем подбирается соотношение сторон, после чего корректируется влияние конкретных референсов, и лишь затем вносится лепта негативного промпта. Гугловская же модель понимает естественный разговорный язык гораздо лучше. Нужно отметить, что она тесно интегрирована с их собственными передовыми языковыми алгоритмами. Настоящий кладезь возможностей открывается для тех, кто привык описывать сцену длинными связными абзацами, а не сухим набором разрозненных тегов. И всё же иногда излишняя болтливость в запросе только мешает, заставляя алгоритм путаться во второстепенных мелких деталях.

Стоит ли экономить?

Кошелёк станет легче. Оплата подписок на несколько топовых платформ всегда сильно бьёт по бюджету фрилансера, поэтому выбирать основной инструмент приходится с холодной головой. Продукт от Google имеет свою внушительную финансовую изюминку, предлагая пользователям гибкую поштучную тарификацию токенов через API. Это же самое правило касается и популярных агрегаторов, где можно платить сущие копейки только за успешные, понравившиеся генерации. С другой стороны, Midjourney упрямо требует фиксированной ежемесячной оплаты. Такое серьёзное вложение не сильно ударит по кошельку при ежедневном потоковом производстве иллюстраций, но для разовых, редких задач может оказаться совершенно невыгодным. Кроме того, интерфейс Discord, через который долгое время работала нейросеть (до недавнего релиза веб-версии), всегда отпугивал новичков своей хаотичностью. А вот Nano Banana сразу проектировалась с прицелом на максимально понятный, чистый браузерный интерфейс.

Ошибки генерации

Ложка дёгтя обязательно найдётся в любом, даже самом совершенном коде. Всплывут ли артефакты при попытке создать толпу людей на заднем фоне? Безусловно, мелкие искажения остаются неизбежным злом для любой диффузионной модели. Не стоит перебарщивать с количеством персонажей в одном кадре, если вы хотите сохранить их лица узнаваемыми. У Миджорни часто бросается в глаза лёгкая «пластиковость» кожи в стандартных настройках, от которой приходится избавляться специальными параметрами стиля. У Нано Бананы же свои неоднозначные подводные камни. Когда цифровая пыль первых восторгов оседает, пользователь начинает замечать, что этот алгоритм настолько сильно цепляется за фотореализм, что напрочь игнорирует просьбы нарисовать объект в стиле аниме или кубизма. Дело в том, что обучающая выборка корпорации добра явно тяготеет к стоковым фотографиям высокого разрешения. Отказаться от привычки дописывать «в стиле реализма, Unreal Engine» бывает довольно сложно, но в новой среде такие приписки лишь портят итоговую композицию.

Финализация

Постобработка. Именно на этом важнейшем этапе создания цифрового полотна решается итоговая судьба вашей иллюстрации. Не скупитесь на время, потраченное на качественный апскейл и аккуратный инпейтинг мелких огрехов. Стоит отметить, что функционал доработки деталей внутри закрытой экосистемы Google реализован на базе их мощнейших фирменных алгоритмов восстановления утерянных пикселей. Закрасив проблемную область кистью, отправив текстовый запрос на перерисовку рукава куртки, дождавшись быстрого отклика сервера (обычно это занимает секунды три-четыре), вы получаете идеально вписанный в контекст объект. Венчает этот процесс лёгкая автоматическая цветокоррекция. Это надёжно. Потому что алгоритм скрупулёзно учитывает глобальное освещение всей сцены. У прямого конкурента инструменты локальной вариативности работают чуть более непредсказуемо, порой предлагая чересчур креативные смелые решения там, где автору нужна сухая геометрическая точность. Впрочем, для многих художников такая свобода действий как раз и выступает в роли главного мотиватора.

Разложить по полочкам

Попытки заставить одну нейросеть делать абсолютно все задачи — пустая трата ресурсов. Буквально пятилетие назад художники даже не могли мечтать о таких проворных помощниках, а сейчас они капризно перебирают десятки сервисов. Не стоит гнаться за эфемерным идеалом, пытаясь найти кнопку «сделать красиво». Ведь каждое новое чадо технологических гигантов имеет свой неповторимый колоритный характер. Нано Банана прочно стоит на ногах в сфере продуктового дизайна, генерации интерьеров и стоковой фотографии, где важна максимальная предсказуемость результата. А вот для концепт-арта, создания персонажей для настольных игр и поиска неординарных сюрреалистичных форм спасательный круг в виде Миджорни всё ещё уверенно держит пальму первенства. Нельзя не упомянуть, что многие профессионалы предпочитают комбинировать обе системы: генерируют суровую базу в одной, а затем прогоняют через стилистические фильтры другой, чтобы придать нужный шарм.

Не перегружайте свои ежедневные рабочие процессы лишним софтом, пытаясь угнаться за всеми мимолётными трендами кремниевой долины сразу. Лучше отказаться от поверхностного использования обеих платформ и с головой окунуться в глубокое изучение синтаксиса той сети, которая органично ложится в ваш пайплайн. Если вы устали от вечной борьбы с мутировавшими конечностями и жаждете коммерческой стерильности — смело облачайтесь в интерфейс от Google, наслаждаясь его предсказуемостью. Удачи в приручении строптивых пиксельных алгоритмов, ведь вовремя найденный компромисс между хаосом и порядком обязательно запомнится надолго и порадует самых взыскательных заказчиков.