Промты для фото с другом (с примерами готовых промтов)

Сгенерировать качественный портрет одного человека нейросеть сейчас способна буквально за считанные секунды, а вот добавить в кадр второго персонажа — задача не из лёгких. Казалось бы, чего проще: попросил искусственный интеллект нарисовать двух друзей, и готово. Но на практике пользователи сталкиваются с тем, что алгоритм смешивает черты лиц, путает цвет волос или вовсе превращает двух людей в одного сиамского близнеца с лишним набором конечностей. Проблема кроется в том, как именно модель «видит» и интерпретирует запрос, распределяя внимание между объектами. Однако зная правильные формулировки и хитрости построения промта, добиться впечатляющего и, главное, контролируемого результата вполне реально.

Сложно ли управлять двумя персонажами?

Да, контроль над двумя объектами требует большей скрупулёзности (иногда даже педантичности). Ведь нейросети, будь то Midjourney или Stable Diffusion, склонны «размазывать» характеристики одного персонажа на другого. Если вы напишете «девушка в красном и парень в синем», велик риск получить обоих в фиолетовых одеждах или с перепутанными элементами гардероба. С чего начинается построение грамотного запроса? С четкого разделения субъектов. Львиная доля успеха зависит от того, насколько точно вы разграничите героев в текстовом описании.

Техника разделения персонажей

Чтобы избежать смешения, стоит использовать конструкцию, где каждому персонажу отведен свой «блок» описания. Эффективным методом считается указание конкретного места в кадре или действия. Например, «[Person A description] on the left» и «[Person B description] on the right». Это помогает алгоритму понять, что перед ним две разные сущности, а не вариации одной и той же. К слову, довольно часто помогает уточнение пола и возраста для каждого героя отдельно, даже если они одинаковые.

Взаимодействие и позы

Просто поставить две фигуры рядом — скучно, да и выглядит это зачастую неестественно. Живости кадру добавляет взаимодействие. Но здесь есть подводные камни. Слишком сложные переплетения рук или объятия нейросеть рисует с трудом — пальцы превращаются в «спагетти», а анатомия трещит по швам. На первых порах стоит ограничиться простыми действиями: разговор, смех, совместная прогулка или взгляд в одну сторону. Пример запроса для дружеской беседы может звучать так: «Two best friends sitting at a cafe table, laughing and drinking coffee, cinematic lighting». Тем более, что простые сюжеты выглядят более жизненно и «лампово».

Уличная фотография: Городской ритм

Съёмка на улице позволяет добавить в кадр динамику и интересный задний план. Городская среда — настоящий кладезь для создания атмосферных снимков. Главное — угадать с освещением и детализацией фона. Если вы хотите получить кадр в стиле стрит-стайл, стоит добавить параметры камеры и плёнки.

Вот пример добротного промта для такой сцены:

«Full body shot of two stylish friends walking down a busy street in Tokyo, neon signs background, rainy night, cyberpunk vibe, wearing futuristic streetwear, distinct faces, shot on 35mm lens, realistic textures, 8k.»

Здесь мы видим четкое указание локации (Токио), атмосферы (неон, дождь) и стиля одежды. Особый интерес вызывает уточнение «distinct faces» — это своего рода команда нейросети следить за тем, чтобы лица не были копиями друг друга.

Студийная съёмка и мода

Впрочем, иногда требуется не случайный кадр, а постановочный портрет с идеальным светом. В студийной стилистике солирует работа с освещением и текстурой кожи. Не стоит забывать про такие слова-маркеры, как «studio lighting», «rim light» или «softbox». Они творят чудеса, превращая плоскую картинку в объемное изображение.

Попробуйте такой вариант:

«Medium shot of two friends posing back to back, studio grey background, high fashion photography, wearing elegant suits, dramatic lighting, sharp focus, detailed skin texture, magazine cover quality.»

Этот запрос ориентирован на глянцевый результат. Фраза «back to back» (спина к спине) — отличный способ избежать проблем с отрисовкой рук, так как они в таком ракурсе обычно скрыты или находятся в естественном положении.

Отдых на природе

Природа прощает многие огрехи генерации, ведь листва и трава создают естественный визуальный шум, скрывающий мелкие дефекты. К тому же, естественный свет (особенно на закате) делает лица более привлекательными. Сценарии могут быть самыми разными: от пикника до похода в горы.

Пример расслабленного, тёплого промта:

«Two friends sitting on a wooden pier by the lake, sunset lighting, golden hour, cozy sweaters, holding mugs of tea, warm atmosphere, soft bokeh, realistic photography, Fujifilm colors.»

Упоминание «Fujifilm colors» придает картинке приятный, слегка ностальгический оттенок, характерный для плёночных фотоаппаратов этой марки. Это добавляет снимку «души» и убирает пластиковый блеск, свойственный цифровым изображениям.

Винтаж и ретро-стиль

Сейчас в тренде стилизация под 90-е или полароидные снимки. Такая эстетика скрывает несовершенства генерации за зернистостью и цветовыми искажениями. Это спасательный круг для тех случаев, когда нейросеть никак не может выдать фотореалистичную кожу.

Попробуйте окунуться в прошлое с таким запросом:

«Polaroid photo of two friends at a music festival in the 1990s, vintage clothes, grunge style, slightly blurred, flash photography, night time, candid shot, authentic look.»

Слова «slightly blurred» (слегка размыто) и «flash photography» (свет вспышки) создают эффект присутствия, будто фото сделал кто-то из толпы на мыльницу тридцать лет назад. Выглядит это зачастую куда убедительнее, чем вылизанный 8K рендер.

Как избежать эффекта «близнецов»?

Это, пожалуй, самая частая головная боль. Вы просите нарисовать двух друзей, а получаете клонов. Чтобы этого избежать, нужно максимально развести описания внешности. Используйте контраст: разный цвет волос, кожи, одежды, разный рост или комплекция.

Вот пример промта, где персонажи максимально отличаются:

«Two friends standing together. Person on the left is a tall man with short black hair wearing a white t-shirt. Person on the right is a woman with long red curly hair wearing a green denim jacket. Contrast of colors, distinct features, realistic portrait, urban setting.»

Нужно отметить, что даже с таким подробным описанием придётся сделать несколько генераций (re-roll), чтобы нейросеть «поймала» суть. Но вероятность успеха возрастает в разы.

Ошибки, которые портят кадр

Нельзя не упомянуть и о том, чего делать не стоит. Перегружать промт десятками противоречивых деталей — верный путь к провалу. Если вы напишете «смотрят в камеру, смотрят друг на друга, смотрят в небо», алгоритм сойдет с ума и выдаст косоглазие. Лучше выбрать одно конкретное направление взгляда. Также не стоит перебарщивать с количеством прилагательных для каждого элемента одежды. Чем проще структура, тем легче машине её обработать. А вот эмоциональные эпитеты («joyful», «melancholic», «serious») нейросети понимают довольно хорошо.

Технические команды для улучшения качества

В конце промта опытные пользователи всегда добавляют блок технических параметров. Это своего рода «полировка» результата. К таким параметрам относятся указание модели камеры (например, «shot on Canon R5»), фокусного расстояния («85mm lens» для портретов или «35mm» для общих планов) и типа плёнки («Kodak Portra 400»).

Универсальный «хвост» для любого промта может выглядеть так:

«…highly detailed, 8k uhd, raw photo, realistic skin texture, no filters, natural lighting, –ar 16:9 –v 6.0»

Параметр «–ar 16:9» задает широкий формат кадра (кинематографичный), а «–v 6.0» (актуально для Midjourney) включает последнюю, самую продвинутую версию движка. Разумеется, соотношение сторон можно менять: для социальных сетей лучше подойдёт «–ar 4:5» или «–ar 9:16».

Креативные идеи для совместных фото

А если хочется чего-то совсем необычного? Сюрреализм или фэнтези тоже никто не отменял. Представьте друзей в космосе или в мире постапокалипсиса.

Вот вариант для любителей научной фантастики:

«Two astronauts, best friends, taking a selfie on Mars, red dust background, futuristic space suits, reflection in the helmet visor, highly detailed, cinematic lighting, epic scale.»

Или сказочный сюжет:

«Two elves sitting on a giant tree branch, fantasy forest, magical glowing plants, detailed armor, sharp focus, ethereal atmosphere, digital painting style.»

Такие запросы позволяют уйти от проблем с анатомией, так как зритель подсознательно готов к некоторой неестественности в фантастических сюжетах.

Диалог: Стоит ли использовать имена знаменитостей?

Поможет ли это зафиксировать лица? Отчасти да. Если вы напишете «Brad Pitt and Leonardo DiCaprio having a beer», нейросеть выдаст очень узнаваемые лица. Можно использовать этот трюк, смешивая известных личностей для создания нового, уникального лица, чтобы избежать прямых ассоциаций. Однако стоит помнить об этической стороне вопроса и правилах использования образов реальных людей, которые в некоторых нейросетях могут быть ограничены цензурой.

Детализация через отрицание

В некоторых моделях (например, Stable Diffusion) важную роль играет поле «Negative Prompt» — то, чего на картинке быть не должно. Туда стоит вписать: «clones, twins, mutated hands, extra fingers, missing limbs, bad anatomy, blurry faces». В Midjourney это можно сделать через параметр «–no», например: «–no ugly, deformed, duplicates». Это своего рода фильтр грубой очистки, отсекающий откровенный брак ещё на этапе зарождения изображения.

Влияние цвета на восприятие

Цветовая палитра — это мощный инструмент настроения. Тёплые тона сближают героев, холодные — создают дистанцию или драматизм. Указание «pastel colors» сделает картинку нежной и воздушной, а «high contrast, dark tones» добавит брутальности.

Пример для драматичного мужского портрета:

«Portrait of two men in a dark bar, moody lighting, smoke in the air, noir style, black and white photography, high contrast, shadows and highlights, serious expression.»

Чёрно-белая фотография, кстати, отлично скрывает несоответствие тона кожи, если нейросеть вдруг решила наградить одного друга загаром, а другого сделать бледным как полотно.

Создание групповой динамики

А если друзей не двое, а больше? Принцип остается тем же, но сложность возрастает в геометрической прогрессии. Для группы из трёх-четырёх человек лучше использовать общие описания: «Group of friends», «Party atmosphere». Пытаться детально описать каждого из пятерых участников — задача неблагодарная. Лучше сосредоточиться на общем вайбе и композиции.

Промт для вечеринки:

«Wide shot of a group of joyful friends dancing at a rooftop party at night, city lights background, motion blur, confetti, energetic atmosphere, candid moment, realistic textures.»

Здесь «motion blur» (размытие в движении) добавит динамики и скроет возможные огрехи в прорисовке задних планов.

Финальные штрихи

Работа с промтами — это всегда эксперимент. Не существует одной «волшебной таблетки», которая с первого раза выдаст шедевр. Приходится менять слова местами, добавлять вес отдельным токенам и перебирать десятки вариантов. Но сам процесс поиска идеальной формулы увлекает не меньше, чем результат. Начните с простых сюжетов, постепенно усложняя их деталями и локациями. И помните, что даже самый совершенный ИИ — это всего лишь инструмент в руках творца, и именно ваша фантазия задаёт вектор движения. Удачи в генерациях, и пусть ваши виртуальные друзья получаются неотличимыми от реальных!