В сети представлено множество руководств по генерации изображений, где обыватель натыкается на стену непонимания при попытке отсечь лишние детали от главного объекта. Довольно часто вместо кромешной тьмы нейросети выдают грязновато-серые градиенты или случайный антураж, который безжалостно бьёт по бюджету времени, выделенному на проект. Ведь исконно тёмная студийная пустота требует весьма специфических лингвистических конструкций, учитывающих логику машинного зрения. А искусственный интеллект, как известно, панически боится пустоты и постоянно норовит заполнить задний план ненужным визуальным мусором. Но чтобы не ошибиться, нужно лишь грамотно настроить виртуальный свет и подобрать правильные технические термины.
Все лучшие нейросети мира теперь в твоём кармане! ⚡
Тексты, топовое видео, картинки и аудио. Самые мощные версии GPT, Claude, Midjourney, Sora, Kling и еще 90+ ИИ-моделей собраны в одном месте. Работает невероятно быстро: через удобный сайт или прямо в Telegram. Больше никаких блокировок, VPN, иностранных карт и переплат.
Жми на ссылку ниже и забирай свои бесплатные генерации для тест-драйва платформы 👉 https://clck.ru/3RNCRL
Как выстроить освещение?
Задача не из лёгких. Казалось бы, достаточно просто написать «black background», однако на практике всплывут непредвиденные световые пятна и артефакты. И всё же добиться нужного эффекта можно, если добавить в текстовую строку термины из арсенала профессиональных фотографов. К слову, львиная доля успеха кроется в упоминании узконаправленного студийного света, который выхватывает из мрака только нужные детали. Например, скрупулёзный технический запрос:
a dramatic low-key portrait of a wise old man, single rim light, completely pure black background, 8k resolution, shot on Hasselblad H6D
творит настоящие чудеса. Свет в такой сцене мягко очерчивает лишь контуры лица, а вся остальная наляпистость просто исчезает во тьме.
Достаточно ли этого для стабильного результата? Вовсе нет. Нужно отметить, что виртуальная камера часто тяготеет к созданию атмосферной дымки или отражений. Чтобы избежать этого, в промт вносят лепту такие словосочетания, как:
pitch-black empty space, no ambient light, isolated on absolute black
А вот оригинальное название схем освещения, вроде Rembrandt lighting или split lighting, заставит алгоритм сфокусироваться на жёстком контрасте между объектом и пустотой. Естественно, эти нюансы работают в идеальной связке с правильно подобранным объективом, прописанным в самом конце строки.
Предметная фотография
Работа с коммерческими объектами требует особого подхода и внимания к деталям. Первым делом в строку ввода отправляется название самого предмета, за которым сразу же следует указание на материалы корпуса. Далее логично прописать параметры отражения и бликов, а замыкает эту цепочку строгий запрет на отрисовку любого фона. Безусловно, изысканный ювелирный браслет потребует макро-объектива, поэтому запрос:
macro photography of a luxury diamond ring resting on an invisible surface, infinite dark black background, harsh directional light, sharp focus, hyper-realistic, 100mm macro lens
станет отличным решением. Это же правило касается глянцевой электроники или дорогого парфюма.
Многие считают, что еда на тёмном фоне выглядит удручающе, но на самом деле именно такой контраст приковывает внимание зрителя к фактуре продукта. Разумеется, добротный сочный бургер или колоритный сырный кусок только выиграют от драматичного окружения. Для кулинарных изысков стоит использовать конструкцию:
commercial food photography of a steaming hot burger with melted cheese, flying drops of sauce, dark moody lighting, pure pitch-black background, cinematic lighting, f/2.8
Впрочем, не стоит забывать про струйки пара, которые всегда солируют на тёмном полотне, создавая необходимый объём и глубину кадра. К тому же, такой подход не сильно ударит по кошельку, если заказчику нужны сотни референсов для меню.
Портрет в высоком разрешении
Наряд для избранных. Буквально десятилетие назад студийный чёрный фон был признаком элитарной съёмки, но сейчас нейросети позволяют воссоздать его за пару секунд. Лучше отказаться от расплывчатых формулировок, описывая внешность модели максимально сухо и точно. Запрос:
cinematic fashion portrait of a pale woman with red lips, wearing a red silk dress, chiaroscuro lighting, solid black background, crisp details, highly detailed face, Vogue magazine style
разложит по полочкам все требования к композиции. А если ещё вспомнить про важность жёстких теней, то результат превзойдёт любые ожидания.
Животные в таком антураже выглядят невероятно внушительно. Да и самим зверькам (даже виртуальным) визуально комфортнее оставаться единственным объектом в кадре, не теряясь на фоне пёстрого леса. Тем более, что простая фраза:
wildlife photography of an angry roaring lion, golden rim lighting, pitch black background, hyper-detailed fur, 8k, photorealistic
мгновенно изолирует хищника от среды. Ложкой дёгтя может стать лишь случайный блик в глазах зверя, отражающий несуществующую комнату или небо. Следовательно, этот небольшой нюанс придётся исправлять уже на этапе постобработки в графическом редакторе.
Стилизация в неоновом свете
Каплями светящейся краски забрызгано всё лицо. Именно так обыватель представляет себе классический киберпанк, когда речь заходит о тёмной эстетике. Само собой, для генерации таких образов одной темноты мало, здесь требуется агрессивный и насыщенный цветовой контраст. Запрос:
a cybernetic female face glowing with neon pink and blue light, heavy shadows, isolated on a completely black background, futuristic concept art, octane render
блестяще справляется с поставленной задачей. Обе стороны медали в данном случае — это глубокий мрак и бьющий по глазам мощный светящийся пигмент.
Не стоит перебарщивать с количеством оттенков. Ведь излишняя пестрота убьёт ту самую изюминку, ради которой выстраивалась вся эта сложная композиция. Напротив, лучше ограничиться двумя-тремя цветами, чтобы колоритный световой рисунок не превратился в нечитаемую кашу. Например, промт:
minimalist glowing blue smoke trails, absolute black background, smooth curves, 3D abstract rendering
показывает, как форма изящно тяготеет к минимализму. Ну и, конечно же, для рендера качественных абстракций стоит добавлять в текст названия популярных движков вроде Unreal Engine 5.
Стоит ли усложнять запрос?
Дело в том, что текстовые подсказки имеют свойство перекрывать друг друга при избыточной длине. Вся суть в том, что алгоритмы обладают ограниченным окном внимания и могут просто проигнорировать слова, стоящие в самом конце длиннющей конструкции. Поэтому попытки обмануть машину без использования негативного промта часто заканчиваются появлением серых градиентов. Подводные камни кроются в генерации лишней мебели, окон, размытых силуэтов или странных текстур позади объекта. Значит, в поле Negative Prompt стоит вбить увесистый список:
grey background, gradient, room, furniture, outdoors, texture, noise, light spots, studio wall
Это серьёзное вложение в стабильность результата.
С другой стороны, короткие запросы тоже способны сбить фокус нейросети. Когда-то давно энтузиастам приходилось писать целые поэмы, чтобы убрать один стул с заднего плана, но сейчас системы стали куда понятливее. Кстати, использование весовых коэффициентов для слов отлично решает проблему недостаточной темноты. Если написать конструкцию (pure black background:1.5), то шанс получить идеальную студийную пустоту возрастает многократно. Тем более, что такой математический подход исключает любые вольные интерпретации со стороны алгоритма.
Особенности разных генераторов
Алгоритмы постоянно развиваются и меняют логику восприятия текста. Буквально в прошлом году Midjourney пятой версии выдавала потрясающие шедевры, однако на этом дело не закончилось. В актуальных версиях понимание коротких фраз стало почти безупречным, поэтому длинные перечисления теряют свой смысл. В начале строки стоит указать главный объект, затем схему освещения, а потом уже технические параметры камеры и фона. Для Stable Diffusion подход остаётся немного иным, требуя больше контроля. Сначала прописывается ядро композиции, далее следуют токены качества, а замыкают эту сложную архитектуру детализированные описания окружения. Нельзя не упомянуть, что DALL-E 3 предпочитает живой разговорный стиль, поэтому сцену ему лучше описывать связными полными предложениями.
Качественный коммерческий результат требует щепетильного отношения к каждому введённому слову. Впрочем, даже при идеальном промте местный бомонд цифровых художников иногда делает десяток попыток ради одного кадра. Махинации с параметрами стилизации или хаоса (например, –stylize или –c в Midjourney) могут внести непредсказуемые, но весьма впечатляющие изменения в работу со светом. Кроме того, самобытный текстурный фон можно получить, если заменить привычное слово black на более изысканные варианты вроде dark obsidian, matte charcoal или vanta black color.
Искусство общения с нейросетями не терпит суеты и спешки. Не стоит расстраиваться, если первые попытки выдадут вам серый шум вместо ожидаемой космической бездны. Просто продолжайте шлифовать свои текстовые конструкции, смело экспериментируя со светом, резкими тенями и техническими терминами. Удачи в поисках идеального промта, пусть каждая ваша генерация порадует кристальной чистотой чёрного цвета.