В сети представлено такое количество нейросетевых картинок, что глаз уже давно замылился. Ленты соцсетей буквально переполнены однотипными портретами с кукольной кожей, фэнтезийными пейзажами, где драконы парят над замками, и абстрактными композициями, отдающими пластиком. Казалось бы, инструмент один и тот же — Midjourney, — а результаты у разных людей отличаются разительно. Кто-то получает арт, на который хочется смотреть минуту, две, три, а у кого-то выходит нечто невнятное, забывающееся через секунду после скролла. Дело в том, что между «набрать пару слов в строке промта» и «создать цепляющую картинку для паблика ВКонтакте» — пропасть размером с целую дисциплину. Но чтобы эту пропасть преодолеть, совсем не обязательно заканчивать художественную академию — достаточно разобраться в нескольких принципах и набить руку на практике.
Что вообще такое «красивый арт» для ВК?
Прежде чем открывать Discord и вбивать первый промт, стоит задуматься об одной неочевидной вещи. Красота арта в контексте ВКонтакте — понятие довольно прикладное. Это не абстрактная эстетика для выставки в галерее и не технический тест возможностей нейросети. Аудитория паблика пролистывает ленту со скоростью три-четыре поста в секунду, и за это мгновение картинка должна зацепить. Приковать внимание. Заставить палец остановиться. А значит, помимо чисто визуальной привлекательности, в арте нужна читаемая композиция, контрастная цветовая палитра и понятный (хотя бы интуитивно) сюжет. К слову, даже формат имеет значение: квадрат 1:1 ведёт себя в ленте совсем не так, как вертикальный 2:3, и этот нюанс многие упускают.
Ещё один подводный камень — тематика группы. Арт для паблика о кинематографе и арт для сообщества любителей котиков требуют совершенно разного подхода к промтам, стилистике и даже настройкам генерации. Не стоит гнаться за универсальностью. Гораздо продуктивнее определить эстетический коридор конкретной группы и работать внутри него, постепенно расширяя границы.
Промт — это не просто набор слов
Львиная доля новичков совершает одну и ту же ошибку. Они пишут что-то вроде «beautiful girl in a forest, 4k, realistic» и искренне недоумевают, почему результат выглядит как стоковая фотография из 2015 года. Проблема тут не в нейросети, а в самом подходе к промту. Midjourney — инструмент мощный, но довольно капризный: он требует от пользователя если не поэтического мышления, то как минимум понимания того, какие слова и в каком порядке влияют на итоговый результат.
Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈
Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.
Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL
Начать нужно с определения стиля. И здесь многие натыкаются на второй барьер — они попросту не знают, как этот стиль описать словами. Одно дело — видеть разницу между акварелью и масляной живописью, и совсем другое — сформулировать это для нейросети. Стоит отметить, что Midjourney отлично реагирует на имена конкретных художников и фотографов. Добавление «in the style of Greg Rutkowski» или «inspired by Alphonse Mucha» направляет генерацию в нужное русло куда надёжнее, чем абстрактные прилагательные вроде «epic» и «stunning». Впрочем, злоупотребление именами тоже ни к чему — нейросеть начинает путаться, если натолкать в промт пятерых разных мастеров одновременно.
Отдельно стоит упомянуть так называемые модификаторы освещения. Фраза «golden hour lighting» или «dramatic chiaroscuro» способна полностью изменить настроение картинки. А ведь именно настроение — та самая изюминка, которая отличает просто красивую генерацию от арта, вызывающего эмоцию. «Soft diffused light» даст мягкую, мечтательную атмосферу. «Harsh neon glow» — агрессивный киберпанк. Между этими полюсами спрятано огромное количество промежуточных состояний, и экспериментировать с ними — одно удовольствие.
Стоит ли тратить время на параметры?
Безусловно. И вот почему. Многие пользователи месяцами генерируют картинки, ни разу не заглянув в настройки, а потом удивляются, что их арт похож на тысячи других. У Midjourney есть набор параметров, которые кардинально меняют результат. Параметр —ar задаёт соотношение сторон. Для ВК, где посты отображаются преимущественно в мобильной версии, вертикальный формат 2:3 или 9:16 работает лучше всего — картинка занимает больше экранного пространства и буквально вторгается в поле зрения. А вот горизонтальный 16:9, столь любимый для обоев на рабочий стол, в ленте ВК смотрится блёкло — слишком узкая полоска теряется между текстовыми постами.
Следующий важный критерий — параметр —stylize (или —s). Его значение колеблется от 0 до 1000, и именно он определяет, насколько «художественно» нейросеть интерпретирует промт. При низких значениях (около 50–100) Midjourney старается точнее следовать описанию, но результат выглядит суховато. При высоких (750–1000) — добавляет собственную эстетику, порой неожиданную и завораживающую. Для публикаций в пабликах ВК оптимальный диапазон — от 250 до 600. Это золотая середина между контролем и творческой свободой нейросети.
Нельзя не упомянуть параметр —chaos. Он отвечает за вариативность генерации. При нулевом значении все четыре картинки в сетке будут похожи друг на друга, как братья-близнецы. При —chaos 50 или выше результат может удивить — одна из вариаций окажется совершенно непредсказуемой. Иногда именно из такого «хаоса» рождаются самые интересные находки.
Как подобрать стиль под тематику паблика?
Задача не из лёгких. Ведь стилей, которые Midjourney воспроизводит на приличном уровне, — десятки. Тем не менее определённые закономерности прослеживаются. Для пабликов об эстетике, моде и лайфстайле отлично работает арт, тяготеющий к editorial-фотографии: мягкие тона, выверенная композиция, минимум фантастических элементов. Добавление в промт фраз вроде «editorial photography», «Vogue magazine cover», «soft pastel color palette» направит генерацию в нужное русло.
А вот для сообществ по играм и фэнтези подход совершенно иной. Тут солирует концепт-арт — детализированный, динамичный, с драматичным освещением. Упоминание «concept art for AAA game», «cinematic composition», «volumetric fog» творит чудеса. Да и аудитория таких пабликов куда щепетильнее относится к мелочам: корявые руки, сросшиеся пальцы, анатомические несуразности — всё это мгновенно замечают и высмеивают в комментариях. Поэтому проверка и доработка генерации (об этом ниже) здесь особенно важна.
Кстати, для юмористических групп и мем-сообществ неплохо заходит намеренно абсурдный стиль. Сюрреализм в духе Сальвадора Дали, смешанный с поп-артом Энди Уорхола, даёт картинки, которые провоцируют реакцию — а в ВК это, по сути, главная валюта. Не стоит бояться экспериментов: иногда добротный «кринж» набирает больше репостов, чем безупречно красивая иллюстрация.
Композиция и цвет: почему это важнее промта
Многие считают, что промт решает всё. Но на самом деле даже идеально составленный текстовый запрос не спасёт арт, если в нём нет внятной композиции. Вся суть в том, что человеческий глаз считывает изображение за доли секунды, и первое, что он фиксирует, — это распределение визуальных масс, контрастов и цветовых пятен. Только потом мозг начинает разбираться в деталях. Поэтому при составлении промта стоит думать не только о том, что изображено, но и о том, как это расположено в кадре.
Один из самых простых, но действенных приёмов — явное указание ракурса. «Low angle shot» (вид снизу) делает объект монументальным и внушительным. «Bird’s eye view» (вид сверху) создаёт ощущение масштаба. «Close-up portrait with shallow depth of field» — классика для цепляющих аватаров и обложек. И всё же не стоит перебарщивать с операторскими терминами: Midjourney — не кинокамера, и слишком специфические инструкции могут сбить его с толку.
С цветом дело обстоит ещё интереснее. Тем более что в ленте ВК, окружённой бело-голубым интерфейсом, одни палитры работают значительно лучше других. Тёплые насыщенные тона — охра, терракот, глубокий бордовый — бросаются в глаза на фоне холодного дизайна соцсети. А вот бледно-голубые и серебристые генерации, какими бы изысканными они ни были, рискуют просто слиться с интерфейсом. Это мелкий нюанс, но именно из таких мелочей складывается разница между постом с тремя лайками и вирусной картинкой.
Доработка после генерации
Считать, что нейросеть выдаст идеальный результат с первого раза, — чистой воды иллюзия. Даже опытные пользователи Midjourney тратят на один готовый арт от пяти до двадцати генераций. И это нормально. Первая сетка из четырёх картинок — черновик, а не финал. Из этих четырёх вариаций нужно выбрать наиболее перспективную и увеличить её через кнопку U (upscale). Но и на этом процесс не заканчивается.
Дело в том, что у Midjourney есть характерные слабости, всплывающие с завидной регулярностью. Лишние пальцы на руках, асимметричные глаза, текст на изображении, превращающийся в бессмысленный набор символов, — всё это знакомо каждому, кто работал с нейросетью хотя бы неделю. Для публикации в паблике ВК, где аудитория пристально разглядывает каждую картинку (особенно если пост набирает охват), такие артефакты недопустимы. Поэтому постобработка — этап обязательный. Photoshop, GIMP, даже мобильные редакторы вроде Snapseed — подойдёт что угодно. Главное — убрать явные огрехи, подкрутить контрастность и при необходимости кадрировать изображение под нужный формат.
К тому же стоит помнить о разрешении. Midjourney в стандартном режиме генерирует картинки размером примерно 1024×1024 пикселей (при соотношении 1:1). Для ленты ВК этого вполне достаточно, но если арт планируется использовать как обложку группы или баннер, то без апскейлинга через сторонние сервисы — Topaz Gigapixel, Real-ESRGAN — не обойтись. Благо, все эти инструменты либо бесплатны, либо не сильно бьют по кошельку.
Какие промты работают лучше всего?
Конкретика. Вот что отличает хороший промт от посредственного. Вместо «a cat» — «a ginger Maine Coon cat with emerald eyes sitting on a velvet cushion in a baroque palace». Вместо «a city» — «rain-soaked Tokyo street at 2 AM, neon signs reflecting in puddles, lone figure with transparent umbrella». Нейросеть — не телепат, и чем больше деталей она получает, тем точнее попадает в ожидания. Впрочем, есть и обратная сторона медали: слишком длинный промт (больше 60–70 слов) Midjourney начинает игнорировать частично, отбрасывая элементы на свой вкус.
Структура эффективного промта выглядит примерно так. Сначала идёт описание основного объекта или сцены, затем — стиль и художественные отсылки, после — параметры освещения и настроения, ну и, наконец, технические модификаторы через двойное тире. Разумеется, жёстких правил нет — это всё-таки творческий процесс, а не программирование. Но такая последовательность довольно часто даёт предсказуемо хороший результат.
Отдельная тема — негативные промты (то есть указания, чего на картинке не должно быть). В Midjourney этот функционал реализован через параметр —no. Написав «—no text, watermark, blurry, extra fingers», можно заметно снизить вероятность появления самых раздражающих артефактов. Не панацея, конечно. Но помогает.
Регулярность и формирование стиля паблика
Одиночная красивая картинка в группе ВК — событие. Серия арт-постов в едином стиле, выходящих регулярно, — уже контент-стратегия. И именно к последнему варианту стоит стремиться. Ведь аудитория ВК, подписываясь на паблик, ожидает определённый визуальный стандарт, и любое отклонение от него воспринимается болезненно — как если бы любимый журнал вдруг сменил вёрстку и шрифты.
Чтобы выработать узнаваемый визуальный стиль, нет смысла каждый раз сочинять промт с нуля. Гораздо практичнее создать базовый шаблон — так называемый seed-промт — и менять в нём только содержательную часть, оставляя стилистические параметры неизменными. Например, базовый промт может звучать так: «[subject], cinematic lighting, muted color palette, 35mm film grain, soft focus background, —ar 2:3 —s 400 —no text». В квадратные скобки подставляется конкретный сюжет, а всё остальное гарантирует единообразие серии. Это удобно. Ведь группа не будет выглядеть как лоскутное одеяло из разнородных генераций.
Кроме того, стоит завести отдельную папку или таблицу, куда записываются удачные промты вместе с seed-номерами. Midjourney позволяет использовать параметр —seed для воспроизведения конкретного «зерна» генерации. Если какой-то арт получился особенно хорошо, его seed-номер (можно запросить через реакцию ✉️ на сообщение бота) — настоящий кладезь информации. Подставляя тот же seed с изменённым описанием, вы получите вариации в похожей стилистике.
Подводные камни и частые ошибки
Первая и самая распространённая ловушка — слепое копирование чужих промтов. В интернете тысячи подборок в стиле «лучшие промты для Midjourney», и велик соблазн просто скопировать готовую формулу. Однако проблема в том, что один и тот же промт в разных версиях Midjourney (а обновления выходят довольно часто) может давать совершенно разные результаты. Промт, который выдавал шедевры в версии 5.2, в версии 6.1 может сгенерировать нечто невразумительное. Поэтому слепое копирование — путь тупиковый. А вот анализ чужих промтов с целью понять логику их построения — дело полезное.
Вторая ошибка — игнорирование авторских прав. Да, тема неоднозначная и до сих пор юридически не урегулированная во многих странах. Но это не значит, что о ней можно забыть. Если в промте указан конкретный современный фотограф или художник, итоговая генерация может оказаться слишком похожей на его реальные работы. Для личного использования это некритично, а вот для коммерческого паблика — потенциальный риск. Не стоит об этом забывать, тем более что претензии правообладателей к нейросетевому контенту звучат всё громче с каждым месяцем.
Ну и, конечно же, главная ложка дёгтя — зависимость от подписки. Midjourney — сервис платный, и бесплатных генераций у него, по сути, нет (бывают редкие промо-акции, но рассчитывать на них всерьёз не приходится). Базовый тариф стоит около десяти долларов в месяц и даёт ограниченное количество генераций. Для активного ведения паблика этого может не хватить. Тариф Standard за тридцать долларов снимает большинство ограничений, но и кошелёк станет легче. Впрочем, если арт-контент приносит группе подписчиков и монетизацию, такое вложение быстро окупается.
Несколько слов об оформлении поста в ВК
Сам по себе арт — половина успеха. Вторая половина — его подача. Буквально десятилетие назад картинку в соцсетях можно было выложить без подписи, и никто не задавал вопросов. Сейчас же аудитория ВК ожидает контекста. Короткий атмосферный текст под артом, описывающий настроение, историю или идею, увеличивает время просмотра поста и стимулирует комментарии. Не стоит писать роман — хватит трёх-четырёх предложений. Но и публикация голой картинки без единого слова работает хуже, чем хотелось бы.
Ещё один нюанс — хэштеги. В ВК они работают не так активно, как в той же запрещённой сети, но всё же помогают в индексации и поиске внутри платформы. Два-три тематических хэштега внизу поста — оптимальный минимум. Перебарщивать не стоит: десяток хэштегов выглядит как спам и отталкивает аудиторию.
Генерация арта в Midjourney — процесс не сложный, но кропотливый. Главное — угадать с палитрой настроения, которую хочет видеть аудитория паблика, а техническая сторона подтянется с опытом.
Ну, а напоследок — совет, которым сам пользуюсь постоянно. Заведите привычку ежедневно делать хотя бы пять-десять генераций «для себя», без оглядки на паблик. Экспериментальные промты, безумные стили, абсурдные сочетания объектов — всё это тренирует насмотренность и расширяет творческий арсенал. Со временем формулировки начнут рождаться интуитивно, а результат станет попадать в цель с первой-второй попытки. И тогда арт для группы ВК — от обложки до рядового поста — будет получаться ярким, самобытным и живым. Удачи в генерациях и пусть каждый промт приносит как минимум одну картинку, которой хочется поделиться.

