Midjourney или DALL-E: какая нейросеть создаёт лучшие арты

В сети гуляет огромное количество невероятно красивых картинок, глядя на которые обыватель искренне верит во всемогущество искусственного интеллекта. Кажется, будто умная машина считывает мысли, мгновенно перенося их на цифровой холст без малейших усилий со стороны человека. На самом деле за каждым таким шедевром скрываются часы подбора правильных слов, сотни неудачных попыток и откровенно пугающих мутаций. Искусство генерации изображений требует терпения, да и сам процесс часто сопровождается множеством технических трудностей. Но чтобы не разочароваться в технологиях на самом старте, нужно грамотно подобрать свой первый цифровой инструмент.

Все топовые нейросети в одном месте

Что выбрать для старта?

Наряд для избранных. Именно так долгое время воспринималась платформа, созданная Дэвидом Хольцем. Буквально пару лет назад доступ к этому инструменту казался настоящей магией для гиков, но сейчас ситуация заметно изменилась. И всё-таки интерфейс через мессенджер Discord до сих пор отпугивает многих новичков. Сложно ли освоить управление через команды со слешом? Поначалу процесс кажется излишне перегруженным, однако к этому довольно быстро привыкаешь. Тем более, что именно эта щепетильная настройка даёт поистине колоритный художественный результат.

Впечатляющую живописность выдаёт алгоритм при правильном обращении. Если вам нужен самобытный стиль, сложная композиция или вычурный мрачный антураж, то именно эта сеть творит настоящие чудеса. Разумеется, за столь грандиозный результат придётся платить. Ежемесячная подписка ощутимо бьёт по бюджету, особенно если вы планируете генерировать тысячи картинок в коммерческих масштабах. Дело в том, что бесплатные лимиты давно упразднены. Кошелёк станет легче минимум на десять долларов, а за безлимитный тариф придётся отдать и того больше.

Экосистема OpenAI: DALL-E

Совершенно иной подход демонстрирует детище компании, подарившей миру знаменитый текстовый бот. К слову, тесная интеграция в единую языковую модель стала настоящим спасательным кругом для тех, кто не умеет или не хочет писать длинные промпты на английском языке. Пользователь просто формулирует мысль на родном языке, после чего текстовый помощник сам переводит задумку, насыщает её деталями, обогащает нужными терминами и отправляет на отрисовку. Это невероятно удобно. Ведь отпадает необходимость заучивать сложные технические параметры.

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

Буквальное понимание текста — вот главная изюминка этого популярного сервиса. Если вы попросите нарисовать зелёного кота, пьющего малиновый чай из фарфоровой чашки на фоне Эйфелевой башни, машина выдаст ровно то, что было заказано. Естественно, такая скрупулёзная точность невероятно полезна для маркетологов и создателей презентаций. К тому же искусственный интеллект отлично справляется с текстом на самих картинках. Надписи получаются вполне разборчивыми. Без странных иероглифов.

Вредно ли полагаться на автопилот?

Не стоит обольщаться кажущейся простотой и послушностью системы. Огромная ложка дёгтя кроется в жёсткой цензуре, которую навязали разработчики своему продукту. Алгоритм наотрез откажется генерировать изображения известных политиков, сцены насилия или арт в стиле конкретных ныне живущих художников. Из-за этих строгих ограничений творческая свобода часто разбивается о глухую стену корпоративных правил. Впрочем, иногда умная машина перестраховывается слишком сильно, блокируя совершенно невинные запросы из-за подозрительных сочетаний слов.

Да и сама картинка довольно часто тяготеет к излишней пластиковости. Отдаёт откровенным стоковым глянцем. В большинстве случаев результат выглядит слишком прилизанным, лишённым души и той самой художественной небрежности, которую так ценят профессионалы. Безусловно, для яркого рекламного баннера это станет отличным решением, однако творческий бомонд такие арты воспринимает крайне прохладно. Наляпистость некоторых мелких деталей тоже сильно бросается в глаза, когда пытаешься создать сложную многофигурную композицию.

Генерация промптов

Вернёмся к прямому конкуренту с его невероятной эстетикой и глубоким пониманием формы. Нужно отметить, что процесс создания шедевра здесь напоминает сложный магический ритуал. Сначала вы прописываете базовую идею, затем добавляете стилевые модификаторы, после этого регулируете соотношение сторон специальными тегами, ну и, наконец, задаёте уровень стилизации и хаоса. Вся эта хитрая махинация позволяет контролировать каждый пиксель на экране. И хотя параметры вписываются вручную, готовый результат неизменно приковывает внимание.

Львиная доля цифровых художников сегодня уверенно оседает именно на этой продвинутой платформе. Ведь здесь можно получить изысканный атмосферный портрет с фотографической точностью текстуры кожи (вплоть до пор и мелких морщинок). Нельзя не упомянуть тот факт, что нейросеть великолепно понимает сложную игру света и тени. Освещение получается глубоким, кинематографичным, по-настоящему живым. Конечно, натыкаешься и на ошибки в анатомии, однако с выходом свежих обновлений лишние пальцы и пугающие конечности всплывают на холстах довольно редко.

Две стороны одной медали

С творческим потенциалом дело обстоит гораздо сложнее, если попытаться сравнить эти две системы в лоб. С одной стороны, мы имеем добротный послушный инструмент, который идеально точно выполняет прямые указания. С другой стороны, перед нами строптивый, но невероятно талантливый творец, склонный к собственной вольной интерпретации запроса.

Многие считают, что послушание всегда важнее красоты, но на самом деле для полноценного арта визуальная атмосфера строго первична.

Финансовый вопрос тоже требует самого пристального внимания со стороны пользователя. Подписка на премиум-аккаунт чат-бота, включающая полноценную генерацию изображений, обойдётся в те же двадцать долларов. Однако этот абонемент предлагает не только картинки, но и мощнейшую языковую модель для работы с текстами, программным кодом и большими таблицами. Безусловно, это серьёзное вложение. Но оно вполне оправдано широкой многофункциональностью. А вот если вы давно грезят исключительно визуальным искусством, то покупка специализированного художественного инструмента выглядит куда логичнее.

Внимание к деталям

Прядь волос, небрежно спадающая на лоб, или блик тёплого света на мокром асфальте. Именно такие неочевидные мелочи формируют общее впечатление от готовой работы. И здесь внушительный арсенал тонких настроек Midjourney выходит на совершенно иной уровень. Вы можете смело облачиться в шкуру голливудского режиссёра, управляя фокусным расстоянием, типом виртуальной камеры и даже конкретным сортом старой киноплёнки. Ну и, конечно же, специальная команда для плавного смешивания нескольких картинок в одну открывает воистину безграничные просторы для больного воображения.

С типографикой же ситуация обстоит абсолютно диаметрально противоположная. Если вам вдруг понадобится грамотно интегрировать логотип или сделать читаемую вывеску на здании, то здесь громко солирует продукт от OpenAI. Буквы ложатся на фон ровно. Изначальный смысл фразы не теряется. Да и общая интеграция графических элементов выглядит куда более органичной, когда речь заходит о классическом дизайне. Это настоящий неисчерпаемый кладезь для тех, кто ежедневно верстает макеты.

Техническая реализация

Отдельно стоит упомянуть глубокие архитектурные нюансы обеих нейронных сетей. Программный комплекс, управляемый сложными математическими алгоритмами диффузии, настроенный на распознавание тысяч исторических художественных стилей, дополненный функциями изменения конкретных областей холста, даёт автору невероятную гибкость. В обеих тестируемых системах недавно появилась крайне полезная функция локальной дорисовки. Пользователь может легко выделить неудачный фрагмент на экране и попросить систему переделать исключительно эту проблемную зону.

Все топовые нейросети в одном месте

И всё же скрытые подводные камни никуда не исчезли из этого процесса. Исконно человеческое интуитивное восприятие композиции умным алгоритмам пока совершенно недоступно. Машина просто ловко комбинирует выученные цветовые паттерны. Кстати, именно поэтому в сгенерированных искусственным интеллектом изображениях довольно часто отсутствует банальная физическая логика: тени могут внезапно падать в разные стороны, а отражение в старом зеркале жить своей отдельной жизнью. Впрочем, рядовой обыватель такие досадные огрехи замечает далеко не сразу.

Как найти свой стиль?

Не скупитесь на время для глубокого изучения основ правильного промпт-инжиниринга. Лучше отказаться от наивной идеи получить мировой шедевр с первого раза, лениво написав в строке всего два слова. Суровая практика показывает, что оба рассматриваемых алгоритма требуют максимально вдумчивого подхода и постоянных дерзких экспериментов. Не перегружайте свои текстовые запросы лишними сложными эпитетами, если работаете с послушным ботом, и, наоборот, не бойтесь активно насыщать команду поэтическими литературными метафорами при плотной работе с Discord-ботом. Само собой, на этом тернистом пути неминуемо придётся столкнуться с досадными разочарованиями.

Буквально десятилетие назад о таком заоблачном уровне автоматизации нельзя было даже робко мечтать. Когда-то закрытые лаборатории исследователей сейчас превратились в огромные коммерческие конвейеры, доступные каждому владельцу смартфона. Сегодня же обученные на миллиардах картин нейронные сети формируют высокодетализированные цифровые полотна за считанные секунды. И абсолютно каждый желающий может легко внести посильную лепту в развитие этого удивительного технологического направления, просто регулярно отправляя свои необычные запросы на удалённые сервера компаний.

Не бойтесь совершать ошибки и пробовать нестандартные сочетания слов на практике, ведь именно в таких смелых экспериментах рождаются самые яркие колоритные образы.

Грамотный подход к базовым настройкам, щепетильный выбор нужной стилистики и толика живой человеческой фантазии позволят вам создавать поистине потрясающие шедевры цифровой живописи. Пусть освоение новых алгоритмов пройдёт гладко, а готовый визуальный результат ещё долго порадует домочадцев и требовательных заказчиков.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *