Промты для ии с другом (с примерами готовых промтов)

Сгенерировать качественный одиночный портрет в современных нейросетях — задача сегодня довольно тривиальная, с которой, пожалуй, справится даже абсолютный новичок после пары минут практики. Сеть переполнена изображениями идеальных лиц, однако стоит добавить в кадр второго персонажа, как алгоритм начинает сходить с ума, смешивая тела, путая цвета волос и превращая дружеские объятия в боди-хоррор, поэтому к составлению запросов для парных сцен нужно подходить с особой скрупулёзностью и знанием технических нюансов.

Сложно ли создать идеальный дуэт?

Да, но результат того стоит. Сама механика работы диффузных моделей (вроде Midjourney или Stable Diffusion) устроена так, что внимание искусственного интеллекта рассеивается, когда объектов становится больше одного. Главная проблема — это так называемое «кросс-опыление» атрибутов. Вы просите нарисовать блондина в синей куртке и брюнета в красной, а получаете двух шатенов в фиолетовых рубашках. Нейросеть смешивает признаки. Это раздражает. Ведь хочется получить точный контроль над сценой. Но отчаиваться не стоит. Существуют проверенные методы, позволяющие разграничить персонажей и заставить «бездушную машину» понять, кто есть кто. А начать разбор полётов лучше всего с базовой логики построения описания.

Композиция и взаимодействие

Ключ к успеху кроется не столько в описании внешности, сколько в чётком задании взаимодействия. Если просто перечислить «два друга, парень и девушка», ИИ поставит их рядом, словно истуканов. Скучно. Куда интереснее задать динамику. И здесь на помощь приходят глаголы действия. Один из самых беспроигрышных вариантов — совместное занятие. Например, промпт может строиться вокруг игры в видеоприставку. Выглядеть это может так:

«Two best friends sitting on a couch, holding gamepads, emotional reaction, intense gaming moment, cozy living room interior, evening lighting» (Два лучших друга сидят на диване, держат геймпады, эмоциональная реакция, напряжённый игровой момент, уютный интерьер гостиной, вечернее освещение).

Заметьте, мы сначала задали сцену, а уже потом детали. Это помогает модели понять контекст.

Далее следует упомянуть о физическом контакте. С этим у нейросетей отношения сложные. Руки часто прорастают сквозь одежду, а пальцы живут своей жизнью. Чтобы минимизировать риск мутаций, стоит выбирать позы, где контакт очевиден, но прост. Например, «high five» (дай пять) или «back to back» (спина к спине). Сценарий, где друзья стоят спиной к спине, вообще является спасательным кругом для многих генераторов. Промт для такой сцены может звучать следующим образом:

«Cinematic shot of two friends standing back to back, confident expression, urban city background, neon lights, cyberpunk style, rain, detailed clothing» (Кинематографичный кадр двух друзей, стоящих спиной к спине, уверенное выражение лица, городской фон, неоновые огни, стиль киберпанк, дождь, детализированная одежда).

Здесь мы убиваем двух зайцев: создаём крутую атмосферу и избегаем сложного переплетения конечностей.

Как разделить персонажей?

Задача не из лёгких. Особенно если друзья должны выглядеть кардинально по-разному. В Midjourney, например, довольно часто используют приём разделения описания через :: (двойное двоеточие) или просто чёткое структурирование предложений, но даже это не всегда спасает. Более надёжный способ — использование конструкции «…on the left» и «…on the right». Ну и, конечно же, уточнение деталей для каждого субъекта.

Представьте ситуацию: вам нужно изобразить встречу в кафе. Один пьёт кофе, другой читает книгу. Если написать это сплошным текстом, велик риск, что книгу будут читать оба, прихлёбывая кофе из воздуха. Попробуйте разбить описание на логические блоки. Рабочий вариант промта будет выглядеть примерно так:

«A split composition showing two friends at a cafe table. On the left: a young man with glasses reading a book. On the right: a girl with curly hair drinking coffee. Sunlight through the window, highly detailed, realistic texture» (Разделённая композиция, показывающая двух друзей за столиком в кафе. Слева: молодой человек в очках читает книгу. Справа: девушка с кудрявыми волосами пьёт кофе. Солнечный свет через окно, высокая детализация, реалистичная текстура).

Слово «split» (разделённый) здесь иногда творит чудеса, заставляя нейросеть думать о персонажах как об отдельных объектах.

Впрочем, есть и другой нюанс. Цветовая гамма. Если вы хотите избежать смешивания цветов одежды, старайтесь разносить персонажей по контрасту. Например, один в светлом, другой в тёмном. Это ИИ понимает лучше, чем «красная футболка» и «зелёная футболка», которые в итоге могут превратиться в рождественскую кашу.

Стилистика и атмосфера

Стиль гранж в интерьере или аниме-эстетика? Выбор визуального языка кардинально меняет восприятие дружбы на картинке. Реализм требует идеальной анатомии, а вот стилизация прощает многие огрехи. Если вы устали бороться с лишними пальцами, попробуйте переключиться на иллюстративный стиль.

К первой группе популярных решений относится стиль студии Ghibli. Он вызывает тёплые, ностальгические чувства. Промт для душевной прогулки может быть таким:

«Anime style by Studio Ghibli, two friends walking down a rural path, summer vibe, fluffy clouds, green grass, laughing, wide angle, vibrant colors» (Стиль аниме от студии Ghibli, два друга идут по сельской тропинке, летняя атмосфера, пушистые облака, зелёная трава, смеются, широкий угол, яркие цвета).

Такая картинка, безусловно, порадует глаз и скроет мелкие дефекты генерации за счёт художественного упрощения.

Для любителей чего-то более мрачного и серьёзного подойдет нуар или чёрно-белая фотография. Отсутствие цвета вообще снимает проблему смешивания оттенков одежды. Это же гениально! Промт:

«Black and white photography, two male friends sitting at a bar counter, dramatic lighting, shadows, noir atmosphere, smoking, chatting, vintage style» (Чёрно-белая фотография, два друга-мужчины сидят за барной стойкой, драматичное освещение, тени, атмосфера нуар, курят, беседуют, винтажный стиль).

Такой подход придаёт изображению кинематографичность и глубину, делая акцент на эмоциях, а не на пестроте нарядов.

Текстовые нейросети: друг-собеседник

А теперь перейдём от картинок к словам. Ведь «ИИ с другом» — это не только генерация изображений, но и общение с чат-ботами (ChatGPT, Claude, GigaChat) в формате ролевой игры. Обыватель часто использует нейросеть как поисковик, забывая, что она может стать отличным собеседником, если задать правильный контекст. Львиная доля успеха здесь зависит от системного промта или первого сообщения, задающего тон.

Хочется поддержки? Не стоит писать сухое «подбодри меня». Лучше создать персонажа. Попробуйте такой шаблон:

«Act as my best friend who has known me for 10 years. You are supportive, funny, and slightly sarcastic. I am going through a tough time at work. Listen to me, make a joke to cheer me up, and give one practical piece of advice. Do not be formal» (Веди себя как мой лучший друг, который знает меня 10 лет. Ты поддерживающий, смешной и немного саркастичный. У меня тяжёлый период на работе. Выслушай меня, пошути, чтобы подбодрить, и дай один практический совет. Не будь официальным).

Такой подход сразу переключает языковую модель из режима «робот-справочник» в режим «эмпатичный приятель».

Бывает и другая ситуация. Нужен мозговой штурм или конструктивная критика. Друг-скептик. Промт:

«Roleplay as a critical thinking partner. I will share my business idea with you. Your goal is to find holes in my logic and ask tough questions, just like a honest friend would. Don’t sugarcoat anything» (Сыграй роль партнера по критическому мышлению. Я поделюсь с тобой своей бизнес-идеей. Твоя цель — найти дыры в моей логике и задать жёсткие вопросы, как это сделал бы честный друг. Ничего не приукрашивай).

Это невероятно полезный инструмент для проверки своих гипотез. Ведь настоящий друг скажет правду, даже если она неприятна.

Подводные камни генерации

Чего следует избегать? Во-первых, слишком длинных и перегруженных предложений в промтах для изображений. ИИ «забывает» начало фразы, пока читает конец. Пишите тезисно. Рублено.

Во-вторых, в текстовых моделях не стоит забывать о «температуре» общения. Если бот становится слишком слащавым, добавьте в промт уточнение: «Speak casually, use slang occasionally, keep answers short» (Говори непринуждённо, иногда используй сленг, отвечай коротко). Это придаст диалогу живости.

В изображениях же главный враг — это количество людей. Если вы напишете «группа друзей», вы получите месиво из лиц. Лучше конкретизировать: «Three friends» или «Four friends». Но помните: каждое дополнительное лицо снижает качество проработки остальных. Оптимальное число — два. Максимум — три. Да и самим персонажам на холсте будет тесновато, если их будет больше.

Примеры готовых сценариев для Midjourney/Stable Diffusion

Чтобы вам не пришлось изобретать велосипед, вот несколько готовых конструкций, которые можно брать за основу и модифицировать под свои нужды.

Сценарий «Путешественники». Отличный вариант для динамичного кадра.
Промт:

«Wide shot of two friends hiking in the mountains, standing on a cliff edge looking at the sunset, backpacks, adventure gear, breathtaking view, golden hour lighting, photorealistic, 8k» (Широкий кадр двух друзей в походе в горах, стоят на краю обрыва и смотрят на закат, рюкзаки, туристическое снаряжение, захватывающий вид, освещение золотого часа, фотореалистичность, 8k).

Изюминка этого промта в том, что персонажи, скорее всего, будут изображены со спины или в профиль, что, как мы уже выяснили, спасает от проблем с лицами.

Сценарий «Учёба/Работа». Спокойная, статичная сцена.
Промт:

«Cozy library atmosphere, two students sitting at a wooden table, studying together, piles of books, laptop, focused expression, warm lamp light, dark academia aesthetic» (Уютная атмосфера библиотеки, два студента сидят за деревянным столом, учатся вместе, стопки книг, ноутбук, сосредоточенное выражение лица, эстетика тёмной академии).

Здесь антураж играет на руку, создавая сложное, наполненное деталями пространство.

Сценарий «Футуристичная вечеринка». Ярко и дерзко.
Промт:

«Portrait of two cyberpunk friends, glowing makeup, futuristic fashion, neon city street background, night time, blue and pink lighting, bokeh effect, sharp focus» (Портрет двух друзей в стиле киберпанк, светящийся макияж, футуристичная мода, фон неоновой городской улицы, ночное время, синее и розовое освещение, эффект боке, резкий фокус).

Двойные прилагательные вроде «blue and pink» задают тон всей картинке.

Технические «костыли» и лайфхаки

Иногда даже идеальный промт не срабатывает. Картинка выходит плоской или персонажи выглядят как близнецы. В таком случае помогает использование референсов (image prompt). Загрузите фото двух реальных людей в той позе, которая вам нужна, и дайте ссылку на него нейросети вместе с текстовым описанием. Это служит своего рода каркасом.

Также не стоит пренебрегать функцией Vary Region (в Midjourney) или Inpainting (в Stable Diffusion). Если у одного друга получилось идеальное лицо, а у второго — гримаса ужаса, не нужно перегенерировать всё изображение. Просто выделите неудачный кусок и попросите ИИ перерисовать только его. Это экономит кучу времени и нервов. Процесс этот не сложный, но кропотливый, требующий усидчивости.

Ну и, наконец, негативные промты. В Stable Diffusion это обязательный пункт программы. В поле Negative Prompt всегда стоит вписывать: «fused bodies, extra limbs, mutated hands, missing fingers, bad anatomy, clones, twins» (слитые тела, лишние конечности, мутировавшие руки, отсутствующие пальцы, плохая анатомия, клоны, близнецы). Это, конечно, не панацея, но довольно мощный фильтр, отсекающий откровенный брак.

Творческий поиск

На самом деле, работа с промтами — это всегда эксперимент. Не существует универсальной формулы, которая работала бы в 100% случаев, ведь алгоритмы постоянно обновляются. То, что работало в версии 5, может не сработать в версии 6. Поэтому не бойтесь менять слова местами, добавлять странные эпитеты или смешивать несмешиваемое. Иногда ошибка в запросе дарит шедевр, который невозможно было бы создать намеренно.

Экспериментируйте с ракурсами. Попробуйте «drone view» (вид с дрона) или «worm’s eye view» (вид снизу). Необычный угол обзора часто скрывает недостатки генерации и делает картинку более профессиональной. А если ещё добавить описание погоды — туман, снег или песчаную бурю — то сцена обретёт настоящий объём.

Главное в этом деле — не опускать руки после первой неудачи. Нейросеть — это всего лишь инструмент, кисть в ваших руках, пусть и с собственным, порой скверным, характером. Научившись говорить с ней на одном языке, вы сможете создавать истории о дружбе, которые будут выглядеть живыми и настоящими. Удачи в творчестве, и пусть каждый ваш запрос превращается в маленький шедевр, который запомнится надолго!