У каждого, кто хоть раз пытался сгенерировать реалистичное фото в нейросети, возникало чувство глубокого разочарования при виде пластиковых лиц или странных конечностей. Казалось бы, задача довольно простая: попросить искусственный интеллект нарисовать человека в студии. Но на выходе мы часто получаем либо пережаренный HDR, либо скучную картинку, которой место на стоках десятилетней давности. А ведь проблема кроется не в самой нейросети (будь то Midjourney или Stable Diffusion), а в неумении «объяснить» машине, как именно должен падать свет и какую оптику использовал бы настоящий фотограф. И всё же добиться результата, от которого захватывает дух, вполне реально. Но чтобы не ошибиться, нужно подойти к составлению промта не как к набору случайных слов, а как к настройке сложного технического оборудования.
С чего начинается построение кадра?
С понимания света. Без него в студийной съёмке делать нечего. Нейросеть, по своей сути, — это огромная база данных, которая видела миллиарды снимков, и львиная доля качественных портретов базируется на классических схемах освещения. Просто написать «studio lighting» недостаточно. Это слишком размытое понятие. Стоит конкретизировать. Например, схема «Rembrandt lighting» (свет Рембрандта) создаст тот самый знаменитый треугольник света на щеке модели, добавив драматизма. А если вы хотите получить мягкую, обволакивающую картинку без резких теней, то здесь выручит «Softbox lighting» или «Octabox». Кстати, довольно часто новички забывают про контровой свет. А ведь именно «Rim light» или «Backlight» отделяет модель от фона, создавая сияющий контур вокруг волос и плеч. Разумеется, не стоит перебарщивать, иначе модель превратится в светящегося ангела, но грамотный акцент творит чудеса.
Техническая база
Камера и объектив — это фундамент. Если вы не укажете параметры, ИИ выберет что-то среднее, скучное и плоское. В представлении многих пользователей достаточно написать «high quality», но это заблуждение. На самом деле, нужно оперировать терминами фотографов. Для портретов золотым стандартом считается фокусное расстояние 85mm или 100mm. Напишите «85mm lens» — и пропорции лица станут правильными, исчезнут искажения, свойственные широкому углу. Апертура тоже играет роль. Значение «f/1.8» или «f/2.8» даст вам то самое красивое размытие фона (боке), которое так ценится в профессиональной среде. К слову, упоминание конкретных моделей камер, вроде «Sony A7R IV» или «Hasselblad», также добавляет детализации текстурам кожи и одежды. Это проверено практикой: стоит добавить название дорогой камеры, как нейросеть начинает тщательнее прорисовывать микроконтраст.
Стиль и антураж
Студия — это не всегда белая циклорама. Это может быть и лофт с кирпичными стенами, и тёмное пространство с неоновыми лампами. Здесь важно задать настроение. Изысканный «Minimalism» подойдет для фэшн-съёмки, где ничто не отвлекает от одежды. А вот если душа тяготеет к чему-то более дерзкому, можно использовать стиль «Cyberpunk» или «Neon noir». Но есть и подводные камни. Чем больше деталей вы описываете в фоне, тем выше риск, что нейросеть смешает их с главным объектом. Поэтому для чистого студийного кадра лучше использовать уточнения вроде «solid background», «grey background» или «textured wall». Тем более, что простые фоны сейчас снова в тренде. Ну и, наконец, плёнка. Имитация плёночного зерна через промты типа «film grain», «Kodak Portra 400» или «analog photography» придает снимку ту самую «ламповую» атмосферу и убирает цифровую стерильность.
Готовые решения: Классический портрет
Перейдём к практике. Допустим, вам нужен добротный, дорогой мужской портрет для бизнес-издания. Промт для такой задачи должен быть строгим и техничным. Выглядеть он может примерно так:
Male model in a black turtleneck, confident look, studio lighting, Rembrandt lighting scheme, dark grey background, shot on 85mm lens f/2.8, highly detailed skin texture, 8k resolution, cinematic lighting
Обратите внимание, здесь нет ничего лишнего. Каждый тег отвечает за конкретный параметр: одежду, эмоцию, свет, фон и технические характеристики. Такой подход гарантирует, что на выходе вы получите именно то, что заказывали, а не случайную генерацию. Результат обычно выглядит внушительно и сразу бросается в глаза своей проработкой.
Женский образ в стиле High Fashion
Здесь задача сложнее. Фэшн-фотография требует иного подхода к свету и позам. Часто используются более жёсткие источники света, чтобы подчеркнуть фактуру ткани и макияж. Конструкция промта будет следующей:
Fashion photography, female model posing in avant-garde dress, butterfly lighting, hard shadows, vibrant colors, fashion editorial style, shot on Hasselblad X1D, 50mm lens, sharp focus, professional makeup, vogue magazine style
Тут ключевую роль играет связка «butterfly lighting» (свет бабочки), которая создает симметричную тень под носом и подчёркивает скулы. Добавление «fashion editorial» подсказывает нейросети, что композиция должна быть журнальной, немного вычурной и смелой. Ведь именно в таких нюансах и кроется отличие любительского кадра от профессионального.
Эстетичны ли чёрно-белые снимки?
Безусловно. Чёрно-белая фотография — это кладезь эмоций и текстур. Она убирает отвлекающий цвет, оставляя только суть. Промт для драматичного ч/б портрета может звучать так:
Black and white photography, close-up portrait of an old man with deep wrinkles, dramatic side lighting, high contrast, emotional eyes, pure black background, Leica M monochrome, sharp details, noir atmosphere
Главное — угадать с контрастом. Тег «high contrast» здесь просто необходим, иначе изображение может получиться серым и блёклым. А упоминание камеры «Leica monochrome» — это своего рода сигнал для ИИ использовать алгоритмы, имитирующие легендарную чёрно-белую плёнку.
Предметная съёмка
Не стоит забывать и о съемке предметов. Студийный свет здесь важен как никогда. Представьте, что вам нужно снять флакон духов. Это тяжёлый, но увлекательный процесс, даже если снимаете вы в виртуальной студии. Промт будет выглядеть так:
Product photography, glass perfume bottle on a reflective surface, soft studio lighting, rim light, bokeh background, splashes of water, macro lens 100mm, commercial aesthetics, hyper-realistic, 8k
Здесь «reflective surface» создает отражение снизу, что добавляет снимку дороговизны, а «macro lens» позволяет показать мельчайшие детали стекла и жидкости. Такой подход не сильно ударит по кошельку, ведь не нужно арендовать реальную студию, но результат может вполне сгодиться для рекламных макетов.
Ошибки, которые убивают кадр
Часто пользователи пытаются впихнуть в промт всё и сразу. «Студийный свет, лес, горы, закат, неон, взрывы» — такой винегрет только запутает алгоритм. Наляпистость — враг хорошего кадра. Нейросеть начнет галлюцинировать, пытаясь совместить студийное освещение с закатным солнцем. Также не стоит использовать противоречивые стили, например, «minimalism» и «baroque» одновременно. Это приведет к визуальному хаосу. Ещё один нюанс — переизбыток улучшайзеров. Десятки слов вроде «super», «mega», «ultra», «best» практически не влияют на результат, но занимают место в токене, вытесняя действительно важные технические параметры. Лучше отказаться от мусорных слов в пользу конкретики.
Настройка цвета и цветокоррекция
Цвет в студии — это отдельный инструмент управления вниманием. Вы можете задать палитру прямо в промте, используя термины колористов. Связки вроде «teal and orange» дадут кинематографичный контраст тёплых и холодных тонов. А «pastel tones» сделают картинку нежной и воздушной. Если же хочется чего-то более агрессивного, попробуйте «acid colors» или «duotone». Пример промта с акцентом на цвет:
Cyberpunk girl portrait, neon blue and pink lighting, studio dark background, wet skin effect, futuristic makeup, saturated colors, cinematic grading
Здесь «color grading» — это команда применить постобработку, как в кино. Это же правило касается и винтажных стилей. Теги «sepia» или «faded colors» мгновенно состарят фото, придав ему налет времени.
Влияние параметров соотношения сторон
Хотя это не совсем часть текстового описания, параметр соотношения сторон (–ar в Midjourney) критически важен для композиции. Вертикальный кадр (2:3) идеален для ростовых портретов, так как он оставляет воздух над головой и позволяет модели «встать на ноги» в кадре. Квадрат (1:1) хорош для соцсетей и крупных планов лица. А вот широкий формат (16:9) в студийной портретной съёмке используется реже, но он отлично подходит для групповых снимков или когда нужно показать интерьер студии. И всё же, начинать эксперименты лучше с классического 2:3 или 3:4.
Детализация кожи и текстур
Одна из главных проблем ИИ-генерации — «мыльная» кожа. Чтобы этого избежать, нужно использовать текстурные маркеры. Слова «skin texture», «pores», «moles», «imperfections» заставляют нейросеть рисовать живого человека, а не манекен. Натуральность сейчас в моде. Поэтому в промт стоит добавить «natural look», «no makeup» (если это уместно) или «freckles». Удивительно, но добавление недостатков делает изображение более совершенным с точки зрения восприятия. Глаз зрителя натыкается на эти детали и верит в реальность происходящего.
Как собрать идеальный промт?
Сборка промта — это как конструктор. Сначала вы выбираете объект (Кто?), затем помещаете его в среду (Где?), выставляете свет (Как освещено?), берёте в руки камеру (Чем снято?) и, наконец, задаёте стиль (В какой манере?). Не меняйте этот порядок без нужды. Логическая структура помогает нейросети правильно расставить приоритеты. Вначале всегда идёт самое важное — главный герой. А технические детали, хоть и важны, но обычно замыкают описание. Впрочем, иногда эксперименты с порядком слов могут дать неожиданный и интересный результат, но это уже уровень для продвинутых пользователей.
Экспериментируйте с ракурсами.
«Low angle» (вид снизу) сделает модель монументальной и властной. «High angle» (вид сверху) добавит уязвимости или кокетства. «Dutch angle» (заваленный горизонт) внесёт динамику. Статичная фронтальная поза — это классика, но она может быть скучной. Попробуйте добавить в промт действия: «walking», «dancing», «looking over shoulder». Это вдохнёт жизнь в застывшую студийную атмосферу. Ведь даже в ограниченном пространстве студии есть место для движения.
Пробуйте разные версии нейросетей.
Разные модели (например, Midjourney v5.2 против v6) по-разному понимают свет. Более новые версии лучше работают с короткими, естественными описаниями, тогда как старые требуют больше технических костылей. Поэтому универсального рецепта на все времена не существует. Придётся адаптироваться. Но база, описанная выше — свет, камера, композиция — останется актуальной всегда, потому что она основана на физике фотографии, а не на алгоритмах кода.
Погружение в мир промт-инжиниринга открывает двери в бесконечную цифровую фотостудию, где вы — главный режиссёр, осветитель и фотограф. Здесь нет капризных моделей, аренды оборудования и сломанных затворов. Есть только ваше воображение и точность формулировок. Пусть каждый ваш запрос превращается в маленький шедевр, который будет радовать глаз и вызывать вопросы: «Неужели это снято не на камеру?». Удачных генераций и побольше вдохновения!