Промт для фотосессии машины (с примерами готовых промтов)

Почему сгенерированный автомобиль так часто выглядит как пластиковая игрушка из дешёвого набора, а не как мощный зверь из металла и карбона? Этот вопрос довольно часто мучает цифровых художников, ведь нейросети, при всей их гениальности, порой слишком буквально воспринимают запрос или, наоборот, уходят в сюрреализм там, где требуется инженерная точность. Кажется, что достаточно просто написать марку машины, и шедевр готов. Но на самом деле алгоритм нуждается в четких инструкциях, касающихся не только объекта, но и света, оптики, атмосферы и даже типа пленки. Ведь именно нюансы превращают безжизненную картинку в фотореалистичный кадр, от которого захватывает дух. А начать стоит с понимания того, как вообще строится «язык» общения с искусственным интеллектом в автомобильной тематике.

С чего начинается построение запроса?

Фундамент любого качественного изображения — это вовсе не название бренда, как многие ошибочно полагают. Разумеется, указать модель необходимо, но это лишь верхушка айсберга. Структура идеального промта напоминает слоеный пирог, где каждый ингредиент усиливает вкус предыдущего. Сначала идет главный объект (Subject), затем следует окружение (Environment), после него — освещение (Lighting), а венчает всё это техническое описание (Camera & Settings). Сложно ли это собрать воедино? На первых порах — да, но, поняв логику, процесс пойдет как по маслу. К слову, порядок слов имеет значение: то, что стоит в начале, нейросеть считает наиболее важным. Поэтому, если вы хотите акцент на цвете, выносите его вперёд.

Стиль и атмосфера

Утро в мегаполисе.
Свет, пробивающийся сквозь утренний туман, играет на полированных боках седана совершенно иначе, чем жесткие неоновые лучи ночного города. Задание атмосферы — это, пожалуй, львиная доля успеха. Если целью стоит создание рекламного глянца, то тут помогут такие теги, как «studio lighting», «softbox», «clean background» или «commercial photography». Такой подход изолирует автомобиль, делая его единственным героем кадра. Но если же хочется драйва и жизни, то сценарий меняется кардинально. В ход идут «motion blur» (размытие в движении), «rainy asphalt» (мокрый асфальт) или «dust trail» (шлейф пыли). Стоит отметить, что нейросети отлично понимают кинематографические отсылки. Фразы вроде «cinematic shot», «dramatic lighting» или даже упоминание конкретных фильмов (например, «style of Mad Max») творят чудеса.

Техническая часть: Камера и объектив

Имеет ли значение виртуальный объектив? Безусловно. Игнорирование этого параметра — распространенная ошибка новичков. Нейросеть по умолчанию часто выдает что-то среднее, похожее на снимок с телефона. Чтобы придать кадру профессиональный вид, нужно указать фокусное расстояние. Для съёмки автомобилей традиционно хороши 35mm или 50mm для общих планов, где виден контекст. А вот 85mm или 100mm отлично подойдут для крупных планов и сжатия перспективы, когда машина выглядит более плотной и агрессивной. Также не стоит забывать про диафрагму. Указание «f/1.8» или «f/2.8» создаст приятное боке (размытие фона), что мгновенно добавит снимку глубины и дороговизны. Ну и, наконец, тип пленки или сенсора: «Kodak Portra 400» добавит тёплого зерна и винтажности, а «Fujifilm» уведет цвета в холодные, стильные тона.

Примеры промтов: Городской спорткар

Представим ситуацию, когда нам нужен агрессивный, современный образ. Машина должна выглядеть так, словно она только что сошла с трассы «Формулы-1», но при этом находится в городской среде. Здесь важно подчеркнуть динамику и блеск. Хороший промт может выглядеть следующим образом:

«Hyper-realistic photo of a metallic grey Porsche 911 GT3 driving fast on a rainy Tokyo highway at night, neon signs reflecting on the wet asphalt and car body, motion blur, shot on Sony A7R IV, 35mm lens, f/2.8, cinematic lighting, highly detailed, photorealistic, 8k resolution, Unreal Engine 5 render style».

Разберем этот пример. Мы задали конкретный объект и цвет (metallic grey Porsche), поместили его в богатую на рефлексы среду (rainy Tokyo night), добавили динамики (motion blur) и закрепили результат техническими параметрами камеры. Результат, скорее всего, будет впечатляющим.

Внедорожники и природа

Грязь — это красиво.
Особенно если она летит из-под колес мощного джипа. Для внедорожников глянцевая студийная съёмка подходит редко, ведь их стихия — бездорожье. Здесь лексикон меняется на более брутальный. Нам понадобятся слова «mud», «dirt», «forest», «mountains», «splashing water». Пример готового решения для генерации:

«Front low angle shot of a rugged Ford Bronco climbing a steep rocky hill, mud splashing from tires, dusty atmosphere, golden hour sunlight breaking through pine trees, dramatic shadows, raw photo style, shot on Canon EOS R5, 24mm lens, action shot, detailed texture of tires and rocks».

Обратите внимание на ракурс: «Low angle» (нижний ракурс) делает машину визуально больше и внушительнее, что для джипа является ключевой характеристикой. А «golden hour» (золотой час) обеспечивает то самое тёплое, объёмное освещение, которое так любят пейзажные фотографы.

Ретро и классика

Старые автомобили требуют особого уважения к эпохе. Генерировать классический «Мустанг» в футуристичном киберпанке можно, но это требует мастерства, чтобы не скатиться в китч. Куда органичнее смотрятся кадры, стилизованные под плёночную фотографию тех лет. Это создаёт ощущение подлинности, некой документальности.
Промт может звучать так:

«Vintage photo of a 1967 Chevrolet Impala parked near an old American diner, sunset, grainy film texture, Kodak Gold 200, muted colors, nostalgic atmosphere, wide angle shot, chrome details reflecting the orange sun, American suburbs aesthetic, 1960s style».

Здесь «grainy film texture» и «muted colors» (приглушенные цвета) играют решающую роль. Они убирают цифровую стерильность, добавляя изображению «душу». Да и антураж закусочной (diner) сразу отправляет зрителя в нужное время.

Детализация: Макросъёмка

Иногда вся соль не в целом автомобиле, а в его изгибе, фаре или эмблеме. Макросъёмка позволяет показать качество материалов, текстуру кожи салона или капли дождя на капоте. Это довольно сложный жанр для ИИ, так как нейросеть может запутаться в геометрии мелких деталей. Но попробовать стоит.
Пример запроса для детального кадра:

«Extreme close-up shot of a raindrop on a red Ferrari carbon fiber hood, reflection of a street light inside the drop, macro photography, 100mm lens, f/2.8, depth of field, sharp focus on the drop, bokeh background, hyper-detailed texture, 8k, ray tracing».

Такой промт фокусирует все ресурсы генерации на текстуре (carbon fiber) и физике света (reflection inside the drop). Использование термина «ray tracing» (трассировка лучей) подсказывает алгоритму, что нужно просчитать освещение максимально реалистично.

Как избежать эффекта «зловещей долины»?

Главная проблема генераций — это искаженная геометрия. Колеса могут стать овальными, эмблема превратиться в непонятное пятно, а количество дверей не соответствовать модели. Полностью избавиться от этого сложно, но минимизировать риски реально. Во-первых, не стоит перегружать промт противоречивыми командами. Нельзя одновременно требовать «sunny day» и «night sky», это собьет алгоритм с толку. Во-вторых, используйте «negative prompt» (негативный промт), если ваш инструмент это позволяет. Впишите туда: «deformed wheels», «bad geometry», «blurry», «extra limbs» (да, иногда ИИ пытается пририсовать машине ноги, если неправильно поймет контекст). Ну и, конечно же, помогает указание конкретных рендер-движков: «Octane Render» или «Redshift». Они задают стандарт качества 3D-графики, к которому будет тяготеть изображение.

Свет: Инструмент художника

Освещение решает всё.
Можно создать идеальную модель, но убить её плоским светом. В промт-инжиниринге есть свои «читерские» слова для света. «Volumetric lighting» создаёт объёмные лучи, проходящие через пыль или туман. «Rim lighting» (контурный свет) подсвечивает края объекта, отделяя его от фона — это просто спасательный круг для тёмных машин на тёмном фоне. «Softbox lighting» дает мягкие тени, идеальные для демонстрации форм кузова без резких контрастов.
Вот пример промта с акцентом на сложное освещение:

«Dark moody shot of a matte black Audi RS7, rim lighting outlining the silhouette, smoke on the floor, red tail lights glowing in the dark, studio environment, volumetric fog, mystery atmosphere, high contrast, 8k resolution, sharp details».

Этот запрос создаст стильное, несколько зловещее изображение, где главную скрипку играет силуэт и свет фар.

Цветовая палитра и пост-обработка

Нейросети склонны к перенасыщению цветов. Картинка часто получается «вырвиглазной». Чтобы этого избежать, полезно использовать термины из цветокоррекции. Слова «desaturated» (обесцвеченный), «pastel tones» (пастельные тона) или «color grading» (цветокоррекция) помогут успокоить буйство красок. С другой стороны, если нужен эффект «Матрицы» или «Бегущего по лезвию», смело пишите «teal and orange» — это классическая кинематографическая схема, сочетающая бирюзовые и оранжевые оттенки. Она всегда выглядит выигрышно и дорого.

Коммерческая подача

Бывает, что нужно просто показать машину «как в каталоге». Без лишней драмы, грязи и дождя. Чисто, понятно, продающе. Тут на помощь приходят термины из архитектурной и предметной визуализации.
Пример строгого коммерческого промта:

«Full side profile studio shot of a white Tesla Model S, infinity white background, soft studio lighting, clean reflections, minimalist style, 4k, architectural photography style, sharp focus, advertising photography».

«Infinity white background» создаёт бесконечный белый фон, на котором ничто не отвлекает от продукта. Это классика, которая никогда не устареет.

Особенности разных нейросетей

Стоит помнить, что Midjourney, Stable Diffusion и DALL-E имеют свои диалекты. Midjourney, например, больше тяготеет к художественности и эпичности. Ей можно скармливать более абстрактные понятия («speed», «power», «anger»), и она интерпретирует их великолепно. Stable Diffusion (особенно с установленными моделями вроде Juggernaut или Realistic Vision) — это инструмент для тех, кто любит контроль. Там важен сухой технический язык. DALL-E же лучше всего понимает естественную человеческую речь, поэтому с ним можно общаться как с ассистентом: «Покажи мне красную машину на мосту». Однако для достижения фотореализма всё же лучше придерживаться структуры, описанной выше.

Творческий поиск

Генерация изображений — это процесс перебора. Редко когда первый же вариант попадает в десятку. Обычно приходится менять объективы, переставлять свет и «перекрашивать» кузов прямо в строке запроса. Это нормально. Не стоит бояться экспериментировать с неожиданными сочетаниями. Ламборгини в лесу? Почему бы и нет. Жигули в киберпанке? Звучит как отличный концепт-арт. Главное — не ограничивать свою фантазию рамками привычного. Ведь нейросеть — это всего лишь кисть, а художником остаётся человек.

Удачных экспериментов и пусть каждый ваш сгенерированный кадр вызывает желание сесть за руль и умчаться в закат!