Цвет в фотографии — это, безусловно, мощный инструмент воздействия, но порой именно его отсутствие заставляет зрителя увидеть суть. Способна ли нейросеть почувствовать эту тонкую грань между простым обесцвечиванием и настоящей драматургией света? Вопрос риторический, ведь алгоритмы обучались на миллионах снимков великих мастеров прошлого, и весь этот колоссальный опыт доступен пользователю буквально по щелчку пальцев. Однако многие новички, пытаясь создать шедевр в монохроме, натыкаются на серые, невыразительные картинки, лишённые глубины и контраста. А ведь секрет успеха кроется не только в кнопке «сгенерировать», но и в умении правильно сформулировать задачу, подобрав нужные эпитеты и технические параметры. И чтобы не блуждать в потёмках генеративного искусства, стоит разобраться в анатомии идеального чёрно-белого запроса.
Чёрно-белое или монохром?
Казалось бы, какая разница? Но для искусственного интеллекта эти понятия имеют разные веса. Слово monochrome нейросеть часто воспринимает довольно широко: это может быть и сепия, и синий тинт, и любое однотонное изображение. А вот жёсткое black and white photography задает конкретный вектор. К слову, львиная доля удачных генераций начинается именно с определения типа плёнки или стиля съёмки. Если просто написать «чёрно-белое фото девушки», результат будет усредненным, похожим на случайный фильтр в телефоне. Но стоит добавить analog film style или указать конкретную марку фотоплёнки, как изображение обретает плотность, зернистость и тот самый «ламповый» антураж. Опытные промпт-инженеры знают, что упоминание классических материалов творит чудеса.
Работа со светом
Свет. В чёрно-белой фотографии он солирует. Без цвета глазу не за что зацепиться, кроме как за перепады яркости, поэтому описание освещения должно быть максимально скрупулезным. Здесь на помощь приходят термины из кинематографа и живописи. Один из самых мощных инструментов — chiaroscuro (кьяроскуро), техника, построенная на резком контрасте света и тени. Она придает драматизм и объем, буквально вылепливая формы из темноты. Не менее эффективен термин dramatic lighting, который заставляет нейросеть рисовать глубокие тени. А вот если хочется чего-то мягкого и воздушного, выручит soft lighting или volumetric fog. Интересно наблюдать, как меняется настроение кадра при смене всего одного прилагательного: harsh sunlight (жёсткий солнечный свет) создаст чёткие геометрические тени, идеально подходящие для уличной фотографии, тогда как diffused light (рассеянный свет) сделает портрет нежным и спокойным.
Портреты: детализация и текстура
Главная проблема цифровых (и нейросетевых) лиц — их пластмассовая идеальность. В чёрно-белом это бросается в глаза особенно сильно. Чтобы избежать эффекта куклы, нужно акцентировать внимание на текстуре кожи. Такие слова, как highly detailed texture, skin pores, wrinkles (если уместно) и sharp focus, добавляют реализма. К тому же, в чёрно-белом портрете особое значение приобретают глаза. Фраза expressive eyes или catchlight in eyes (блик в глазах) оживляет взгляд, делая его глубоким и притягательным. Ну и, конечно же, нельзя забывать про эмоциональную составляющую. Нейросеть отлично считывает настроение: melancholic look, mysterious smile или intense gaze. Сочетание текстурных уточнений и эмоциональных маркеров дает тот самый добротный результат, который не стыдно распечатать и повесить на стену.
Уличная фотография и нуар
Тяготеет ли ваша душа к эстетике 40-х годов или к суровой документалистике? В зависимости от ответа будет строиться и промт. Для создания атмосферы старого детективного фильма незаменимым станет слово Film Noir. Оно автоматически подтягивает целый пласт визуальных кодов: жалюзи, отбрасывающие полосатые тени, дым сигарет, мокрый асфальт и плащи с поднятыми воротниками. А вот для имитации репортажной классики в духе Анри Картье-Брессона лучше использовать связку street photography, candid shot (случайный кадр) и leica m6. Это дает ощущение момента, выхваченного из потока жизни. Важный нюанс: в уличной фотографии композиция играет решающую роль. Слова leading lines (направляющие линии) или rule of thirds (правило третей) помогут ИИ выстроить кадр гармонично.
Стилизация под плёнку
Цифра слишком чистая. Стерильная. Чтобы вдохнуть в изображение жизнь, нужно добавить немного «грязи» — в хорошем смысле этого слова. Зернистость плёнки — это та изюминка, которая делает кадр живым. Используйте фразы film grain, noisy image или указывайте конкретные ISO, например, ISO 3200 для сильного зерна. Грезят многие и о конкретной эстетике легендарных плёнок. Попробуйте добавить в промт Kodak Tri-X 400 — это даст высокий контраст и классическую структуру зерна. Или же Ilford HP5 Plus, если хочется более широкого динамического диапазона и мягкости. Удивительно, но нейросети действительно различают эти нюансы, имитируя характерную картинку конкретных эмульсий. Это серьезное вложение интеллектуальных усилий в промт, но оно того стоит.
Примеры готовых промтов
Теория — это прекрасно, но практика расставляет всё по местам. Ниже приведены конкретные конструкции, которые можно использовать как базу, меняя сюжет под свои задачи. Сначала рассмотрим вариант для драматичного мужского портрета. Задача здесь — показать возраст, опыт и текстуру.
Промт:
Black and white photography, close-up portrait of an old fisherman with a weathered face, deep wrinkles, thick beard, intense eyes looking at the horizon, dramatic side lighting, chiaroscuro, dark background, high contrast, sharp focus, shot on Kodak Tri-X 400, 35mm lens, realistic texture, cinematic grain –ar 2:3
Этот запрос сработает на ура, потому что мы указали и объект, и свет, и плёнку.
Теперь перенесемся на ночные улицы. Нам нужен нуар, дождь и загадка.
Промт:
Film Noir style photo, silhouette of a detective in a trench coat standing under a street lamp, rainy night, wet asphalt reflections, volumetric fog, shadows and mystery, high contrast monochrome, grain, 1940s atmosphere, cinematic shot, low angle view –ar 16:9
Здесь ключевую роль играют атмосферные маркеры (туман, дождь, отражения) и стилистическая привязка к эпохе.
А что, если хочется легкости и фешн-эстетики? Попробуем студийный свет.
Промт:
Fashion photography in black and white, elegant woman in a silk dress, dynamic pose, blowing fabric, studio lighting, softbox, clean gray background, minimalist composition, high fashion magazine style, sharp details, Hasselblad camera, –stylize 250 –v 6.0
В данном случае мы уходим от зерна и грязи в сторону глянцевой чистоты и композиционного минимализма.
Отрицательные промты: чего избегать?
Иногда нейросеть так и норовит добавить цветные пятна или сделать картинку блёклой, похожей на выцветшую газету. Чтобы этого не происходило, в Stable Diffusion (и в параметре –no в Midjourney) стоит использовать негативные подсказки. Разумеется, первым делом отсекаем цвет: color, colorful, sepia, polychrome. Но этого мало. Часто всплывают проблемы с контрастом. Поэтому добавляем в список исключений low contrast, washed out, gray, dull, blurry, flat lighting. Это своего рода спасательный круг, который удержит генерацию в рамках качественного монохрома. Также не стоит забывать про исключение дефектов, если они не являются частью задумки: scratches, dust, artifacts.
Технические параметры и ракурсы
Нельзя не упомянуть и о чисто технических настройках, которые влияют на восприятие. Соотношение сторон (aspect ratio) меняет композицию кардинально. Вертикальный кадр (–ar 2:3 или 9:16) идеален для портретов, он позволяет показать фигуру и придает величественности. Широкий формат (–ar 16:9 или 21:9) автоматически включает «киношный» режим восприятия, заставляя зрителя искать сюжет и историю. А вот квадрат (1:1) — это классика среднего формата, отсылающая к старым камерам Rolleiflex. Угол съёмки тоже имеет значение. Low angle (снизу вверх) делает объект доминирующим, грандиозным, а high angle (сверху вниз) может подчеркнуть уязвимость или одиночество. Все эти нюансы — кирпичики, из которых строится итоговое впечатление.
Типичные ошибки новичков
Самая распространенная ошибка — перегруженность запроса. Обыватель часто пытается впихнуть в промт всё и сразу: и «киберпанк», и «19 век», и «космический корабль», и всё это в ч/б. В итоге получается каша. Чёрно-белая фотография — это искусство отсечения лишнего. Лучше отказаться от сложного фона, если он не несет смысловой нагрузки. Ещё один момент — конфликт стилей. Не стоит смешивать soft dreamy focus и harsh brutalist architecture в одном предложении, если вы не уверены на 100%, что хотите получить сюрреализм. Нейросеть просто не поймёт, что делать: мылить картинку или наводить резкость. Последовательность — залог успеха. Сначала объект, потом свет, затем стиль и камера.
Важность экспериментов
Каждый генеративный движок имеет свой «характер». Midjourney, например, тяготеет к большей художественности и живописности, поэтому там отлично работают короткие, емкие эпитеты. Stable Diffusion любит точность и хорошо реагирует на технические термины объективов и настроек камеры. DALL-E же часто понимает естественный язык лучше, чем наборы тегов. Поэтому один и тот же промт в разных нейросетях выдаст совершенно разные результаты. Это же правило касается и версий одной модели. То, что работало в версии 5.2, может потребовать корректировки в шестерке. Процесс поиска идеального промта — это всегда путь проб и ошибок, но именно он приносит истинное удовольствие исследователя.
Напоследок стоит сказать, что чёрно-белая нейрофотография — это не попытка сэкономить на красках, а способ поговорить со зрителем на языке форм и света. Не бойтесь использовать слова noir, graphite, shadows. Ищите вдохновение в работах классиков фотографии, переносите их приемы в текстовые запросы, и результат вас обязательно порадует. Удачный чёрно-белый кадр всегда выглядит стильно и вне времени, а правильно подобранный промт станет отличным решением для реализации самых смелых творческих задумок.