Создание качественного коллажа в нейросети часто кажется задачей тривиальной, ведь искусственный интеллект, по идее, должен уметь смешивать образы лучше любого человека. Многие новички, вдохновившись работами цифровых художников, просто вводят слово «коллаж» и ожидают шедевр, но вместо стильной композиции получают хаотичное нагромождение объектов, где головы кошек плавно перетекают в тостеры, а границы между элементами размываются до полной неразличимости. Проблема кроется в том, что алгоритмы генерации изображений изначально обучены создавать целостные, реалистичные сцены, и попытка заставить их «разбить» картинку на фрагменты вступает в конфликт с их базовой логикой. Но чтобы не ошибиться и получить действительно стоящий результат, нужно понимать не только художественные стили, но и специфические команды, заставляющие нейросеть мыслить фрагментарно.
Сложно ли управлять хаосом?
Управлять генерацией коллажа — это, пожалуй, одна из самых нетривиальных задач в промпт-инжиниринге. Сложно ли это? Да, если не знать правильных «рычагов» давления на модель. Ведь нейросеть всегда тяготеет к сглаживанию, к тому, чтобы сделать картинку единым целым. Нам же нужно обратное — подчёркнутая искусственность, видимые швы, разница фактур и чёткое разделение элементов. Приходится буквально бороться с желанием машины «поженить» все объекты в кадре. И всё-таки, добится контроля можно. Главное — использовать правильные токены, которые служат своего рода разделителями реальности. А начать стоит с определения того, какой именно тип коллажа вы хотите видеть: от винтажной газетной вырезки до современного веб-дизайна.
Анатомия запроса
Структура промта для коллажа имеет свои особенности (довольно существенные). Здесь нельзя просто перечислить объекты через запятую. Сначала стоит задать общую технику. Слова-маркеры, такие как «cutout» (вырезка), «paper cut» (бумажная вырубка) или «mixed media» (смешанная техника), дают нейросети сигнал: мы не рисуем реальность, мы её конструируем. Далее следует описание центрального объекта. Если это портрет, то стоит уточнить, из чего он сделан. Например, «face made of flowers and gears» (лицо из цветов и шестерёнок).
К слову, огромную роль играет описание фона и связующих элементов. Обыватель часто забывает про фон, оставляя его на откуп случайности, а зря. Белый фон («white background») или текстура старой бумаги («old paper texture») могут кардинально изменить восприятие. Ну и, наконец, стиль исполнения. Без указания стиля (например, «dadaism» или «constructivism») нейросеть выдаст усреднённый, довольно скучный результат.
Винтажная эстетика
Этот стиль, безусловно, солирует в мире нейро-коллажей. Есть в нем что-то притягательное, ностальгическое. Для создания эффекта старинного альбома или скрапбукинга отлично работают комбинации токенов, указывающих на возраст материалов. К первой группе относятся слова, описывающие бумагу: «vintage paper», «yellowed newspaper», «torn edges». Это создает базу. Затем нужно добавить элементы декора: «dried flowers», «postage stamps», «handwritten letters».
Особый интерес вызывает техника «рваного края». Чтобы получить эффект, будто картинку грубо вырвали из журнала, стоит добавить в промт фразу «torn paper edge effect». А вот пример готового, довольно добротного промта для создания атмосферного ретро-коллажа, который можно использовать как базу:
«Artistic collage, mixed media style, portrait of a woman 1920s fashion, vintage newspaper clippings background, torn paper details, dried red roses, grunge texture, sepia and muted tones, surreal composition –ar 2:3»
Этот запрос создаст вертикальное изображение (идеально для Pinterest или обложки) с ярко выраженной стилистикой 20-х годов. Заметьте, здесь нет глаголов действия, только описание фактур и объектов. Это надёжно. Потому что проверено. Временем.
Сюрреализм и дадаизм
Если душа требует чего-то более безумного и вычурного, стоит обратиться к наследию дадаистов. Эти ребята знали толк в абсурде. В нейросетях этот жанр творит чудеса, позволяя совмещать несовместимое. Ключевым моментом здесь является противопоставление объектов. Огромный глаз в небе, рыба на велосипеде, дверь, ведущая в космос — всё это классика жанра.
Для такого стиля промт должен содержать слова «surrealism», «dada art», «absurd». Тем более, что нейросети (вроде Midjourney) просто обожают такие задачи. Вот пример запроса, который выдаст впечатляющий, немного пугающий результат:
«Surreal collage art, giant human eye floating in the sky over a vintage city, clouds made of cotton wool, black and white photography elements mixed with colorful oil paint strokes, mysterious atmosphere, Rene Magritte style –v 6.0»
Здесь мы смешиваем фотографию и живопись, что добавляет работе глубины. А упоминание конкретного художника (Магритта) задаёт правильный вектор для композиции, хотя и не копирует его работы напрямую.
Мудборды и сетки
Отдельно стоит упомянуть такой вид коллажа, как мудборд (доска настроения) или «knolling» (раскладка предметов). Это не совсем художественный коллаж в привычном понимании, но для дизайнеров — настоящий кладезь. Задача здесь — показать набор предметов, объединённых одной темой или цветовой гаммой, аккуратно разложенных на плоскости.
Сложно ли это сделать? Вовсе нет, если знать волшебное слово «knolling». Оно мгновенно организует хаос. Также помогают токены «grid layout» (сетка) и «flat lay» (вид сверху). Для дизайнера интерьера или одежды такой промт станет отличным решением:
«Knolling photography, interior design moodboard, scandinavian style, beige and sage green color palette, fabric swatches, wood samples, ceramic tiles, dried plants, organized layout, soft natural lighting, high detail, 8k –ar 16:9»
Такой запрос создаст горизонтальное изображение с аккуратно разложенными материалами. Это выглядит профессионально и дорого. И, кстати, не требует долгих часов поиска картинок в стоках.
Цифровой глитч и киберпанк
Современные коллажи не обязаны быть «пыльными» и старыми. Стиль «Digital collage» открывает двери в мир неонового безумия и компьютерных ошибок. Здесь правит бал эстетика ошибки, разрушения цифрового кода. Глитч-арт, пикселизация, кислотные цвета — всё это элементы современного визуального языка.
Чтобы получить такой результат, нужно использовать слова «glitch art», «VHS effect», «cyberpunk aesthetic». К тому же, интересно работают сочетания классического искусства и цифровых помех. Попробуйте такой вариант:
«Digital collage, cyberpunk style, classical marble statue with neon glowing geometric shapes, glitch art distortion, datamoshing effect, circuit board texture overlay, purple and cyan lighting, futuristic composition –stylize 250»
Параметр --stylize (или --s) в конце отвечает за степень художественной свободы нейросети. Высокое значение (как 250 или даже 750) сделает картинку более артистичной и менее фотореалистичной, что для глитч-арта только плюс.
Технические ошибки: чего стоит избегать?
Даже с хорошим промтом можно получить плохой результат. Самая частая ошибка — перегруз деталями. Если попытаться впихнуть в один запрос «космос, динозавров, викторианский замок, киберпанк и котиков», нейросеть выдаст невнятную кашу. Львиная доля успеха зависит от умения вовремя остановиться. Лучше сделать несколько генераций и потом склеить их в Photoshop, чем пытаться получить «всё и сразу» одной кнопкой.
Ещё один нюанс — «кровавые» переходы. Иногда нейросеть слишком буквально понимает слово «cut» (разрез) и добавляет ненужные анатомические подробности, если речь идёт о людях. Чтобы этого избежать, используйте эвфемизмы вроде «paper silhouette» или «artistic composition». Не стоит забывать и про негативный промт (в Stable Diffusion это отдельное поле, в Midjourney параметр --no). Слова вроде «blur», «low quality», «3d render» (если нужен 2D эффект) помогут почистить выдачу.
Как работать с текстом в коллаже?
Текст — это ахиллесова пята большинства нейросетей. Хотя современные модели (вроде DALL-E 3 или Ideogram) уже неплохо справляются с надписями, в сложном коллаже текст часто превращается в инопланетные иероглифы. Поэтому, если вам нужны конкретные заголовки или фразы, лучше добавлять их уже после генерации, в графическом редакторе. Однако, для создания фактуры текста (без смысловой нагрузки) отлично подходят промты с упоминанием газет или писем.
Запрос для создания текстовой фактуры может выглядеть так:
«Abstract collage background, layers of old handwritten letters, calligraphy text fragments, newspaper headlines overlay, grunge typography texture, black ink on parchment –ar 3:2»
Это создаст отличную подложку, на которую потом можно наложить основные объекты. Впрочем, иногда случайные буквы, сгенерированные ИИ, выглядят даже более стильно и загадочно, чем осмысленный текст.
Выбор палитры и освещения
Цвет в коллаже — это не просто украшение, это инструмент навигации для глаза зрителя. Без четкой цветовой схемы коллаж разваливается. Поэтому в промт обязательно стоит включать описание палитры. Это может быть как простое перечисление («red and black palette»), так и более сложные кинематографические описания («teal and orange color grading»).
Освещение тоже играет роль, хотя в коллажах оно часто намеренно плоское. Но если вы хотите добавить объёма вырезанным элементам, попробуйте добавить «drop shadow» (падающая тень). Это создаст иллюзию, что кусочки бумаги действительно лежат друг на друге. Пример промта с акцентом на цвет:
«Minimalist fashion collage, high fashion model silhouette, vivid color blocking, primary colors (red, blue, yellow), bauhaus style geometry, clean lines, studio lighting, drop shadows for depth –v 5.2»
Этот вариант подойдет для создания стильных постеров или рекламных макетов. Он выглядит свежо и современно, в отличие от тяжеловесного винтажа.
Где искать вдохновение?
Идей для промтов — великое множество, и порой натыкаешься на них в самых неожиданных местах. Не бойтесь экспериментировать с названиями художественных течений, материалов и даже эмоций. Смешивайте «oil painting» и «polaroid photo», «blueprint» (чертёж) и «embroidery» (вышивка). Самые интересные результаты получаются на стыке несовместимых понятий.
Помните, что универсального «волшебного» промта не существует. Каждый запрос — это база, которую нужно допиливать под свои нужды. Меняйте объекты, играйте с соотношением сторон (параметр --ar), добавляйте имена любимых художников. Искусственный интеллект — это всего лишь кисть (пусть и очень сложная цифровая кисть), а художником всё равно остаётесь вы.
Ваш идеальный коллаж уже где-то в латентном пространстве нейросети, осталось только подобрать правильные слова, чтобы его оттуда извлечь. Удачных экспериментов и пусть каждая генерация попадает точно в цель!