Строгая геометрия мундира, тусклый блеск наград и тяжёлый, пронзительный взгляд человека, прошедшего сквозь огонь, всегда приковывают внимание зрителя, будь то кинокадр или цифровая иллюстрация. Казалось бы, создать подобный образ в нейросети — задача на пару минут, ведь достаточно вбить слово «солдат» и нажать кнопку генерации. Однако результат довольно часто разочаровывает: вместо эпичного героя на экране появляется пластиковая кукла с непонятным набором знаков различия, перепутанной эпохой или вовсе с тремя руками. А всё потому, что искусственный интеллект, несмотря на свою мощь, нуждается в чётком, почти инженерном руководстве. Но чтобы не ошибиться и получить действительно добротный результат, нужно понимать не только техническую часть, но и художественные нюансы составления запроса.
Стоит ли начинать с абстракции?
Ни в коем случае. С определения главного героя начинается любой качественный промт. Нейросеть — это не телепат, а исполнитель. Если вы напишете просто «военный», алгоритм выдаст вам нечто усреднённое, скучное и, скорее всего, похожее на персонажа компьютерной игры десятилетней давности. Конкретика здесь творит чудеса. Важно указать пол, примерный возраст, этническую принадлежность и даже выражение лица. Совсем другое дело — запрос, где прописан «пожилой генерал с суровым взглядом» или «молодой рекрут с испугом в глазах». Ведь эмоция задает тон всему изображению. К тому же, стоит сразу определиться с родом войск. Разница между формой моряка, летчика и пехотинца колоссальная, и без уточнения вы рискуете получить странный гибрид, который вызовет лишь смех у знающей аудитории.
Эпоха и детализация
Историческая достоверность — это настоящий камень преткновения для любителей генеративного искусства. ИИ довольно вольно обращается с фактами. Он может смело нацепить советский орден на мундир наполеоновского солдата или вручить современную штурмовую винтовку рыцарю. Чтобы избежать подобной «каши», необходимо жестко ограничивать временные рамки. Указание конкретного года (например, «1944 год» или «эпоха Вьетнамской войны») помогает алгоритму отсечь лишнее. Но и здесь есть свои подводные камни. Даже при указании года нейросеть может ошибиться в деталях петлиц или форме каски. Львиная доля успеха зависит от дополнительных дескрипторов: «потёртая ткань», «грязь на лице», «старая кожа». Эти мелочи оживляют картинку, убирая тот самый эффект искусственного глянца. А если ещё вспомнить про освещение, то результат может стать поистине кинематографичным.
Примеры запросов
Разберём конкретные сценарии. Допустим, стоит задача создать максимально реалистичный, суровый портрет современного бойца спецподразделения. Здесь важно сделать акцент на текстурах и освещении. Сам запрос может выглядеть следующим образом:
«Close-up portrait of a special forces soldier in modern tactical gear, multicam camouflage, dusty face, intense stare, scars, night rain atmosphere, cinematic lighting, 8k resolution, highly detailed texture, unreal engine 5 render style»
В этом примере мы видим чёткую структуру. Сначала идет объект (солдат спецназа), затем уточнение экипировки (мультикам), детали атмосферы (ночной дождь) и технические параметры качества. Результат, скорее всего, порадует высокой детализацией капель воды на шлеме и реалистичной текстурой ткани. Это надёжно. Потому что проверено. Временем.
Другой случай — историческая реконструкция. Нам нужен солдат времен Второй мировой войны, но не в бою, а в момент затишья. Здесь лексика должна быть иной. Пример промта:
«1940s photography style, exhausted WWII soldier sitting in a trench, drinking tea from a metal mug, faded colors, film grain, sepia tone, authentic uniform, historical accuracy, soft natural lighting, emotional atmosphere»
Обратите внимание на смену акцентов. Вместо «8k» и «Unreal Engine» мы используем «film grain» (зернистость пленки) и «sepia tone». Это создаёт тот самый антураж старой фотографии, который заставляет зрителя верить в происходящее. Тут уже не нужна звенящая резкость, наоборот, некоторая размытость и мягкость света пойдут только на пользу.
Отдельно стоит упомянуть стилизацию под живопись. Иногда нужен не фотореализм, а пафосный плакат или картина маслом. Попробуйте такой вариант:
«Heroic general on a horse, pointing forward with a sword, battlefield in the background, smoke and fire, oil painting style, thick brushstrokes, dramatic composition, golden hour lighting, intricate details, epic scale, inspired by classical battle paintings»
Здесь ключевыми становятся слова «oil painting» (масляная живопись) и «thick brushstrokes» (толстые мазки). Нейросеть перестанет пытаться имитировать кожу и переключится на имитацию художественной техники. Выглядит впечатляюще.
Освещение и работа с камерой
Свет — это инструмент, который может как спасти, так и уничтожить кадр. В промтах для военных фото часто используют «dramatic lighting» (драматичное освещение) или «rim light» (контровой свет). Последний особенно хорош для выделения силуэта на тёмном фоне. А вот плоское, фронтальное освещение делает лицо скучным. Разумеется, стоит экспериментировать с ракурсами. «Low angle» (вид снизу) придаст фигуре монументальность и величие, сделает солдата визуально выше и значительнее. В то время как «high angle» (вид сверху) может подчеркнуть уязвимость или показать масштаб поля боя. Не стоит забывать и про глубину резкости. Параметр «depth of field» или «bokeh» поможет размыть задний план, акцентируя внимание на глазах или деталях амуниции.
Подводные камни
Казалось бы, всё просто, однако есть нюанс. И даже не один. Главная проблема при генерации людей в форме — это знаки различия, шевроны и текст. Нейросети до сих пор плохо «читают» и «пишут». Скорее всего, вместо надписи «ARMY» вы получите нечитаемую абракадабру, а звезды на погонах превратятся в бесформенные кляксы. С этим довольно сложно бороться через сам промт. Лучше отказаться от требований нарисовать конкретную медаль или читаемую нашивку с фамилией. Проще дорисовать эти детали потом в фоторедакторе, чем тратить часы на попытки заставить ИИ сделать это идеально. Ещё одна беда — оружие. Нейросети часто склеивают пальцы с прикладом или создают футуристические гибриды автомата Калашникова и винтовки М16. Чтобы минимизировать этот эффект, старайтесь не акцентировать внимание на сложных сценах взаимодействия с оружием, если не готовы к долгому перебору вариантов (inpaint).
Нужен ли негативный промт?
Безусловно. Это спасательный круг, который отсекает всё лишнее. В поле Negative Prompt (если ваш инструмент это позволяет) стоит внести такие слова, как: «cartoon, anime, plastic, deformation, bad anatomy, extra fingers, blurry, low quality, incorrect uniform, makeup». Это поможет избежать появления мультяшных глаз у сурового вояки или гламурного макияжа, который нейросеть порой норовит добавить даже мужчинам. Также полезно исключить «bright colors» (яркие цвета), если вы стремитесь к реализму окопной правды, ведь война — это, как правило, грязь, пыль и приглушённые тона, а не карнавал красок.
Стиль Sci-Fi и будущее
А что, если мы хотим заглянуть в будущее? Военная форма в стиле научной фантастики — это настоящий кладезь для творчества. Здесь можно не ограничивать себя историческими рамками. Попробуйте такой запрос:
«Futuristic super soldier, full body armor made of carbon fiber and neon lights, glowing visor, cyberpunk city background, rain, neon reflections, high tech weaponry, ominous atmosphere, unreal engine 5, ray tracing»
В таком контексте «пластиковость» кожи или неестественный блеск материалов могут сыграть на руку, создавая ощущение синтетики и кибернетики. К слову, добавление слов «distressed» или «battle damaged» к описанию брони сделает образ более живым и «пожившим». Ведь даже в будущем солдаты пачкаются и получают царапины.
Секреты композиции
Нельзя не упомянуть и о том, как строится кадр. Статичная поза «по стойке смирно» подходит для справочника, но не для художественного произведения. Используйте глаголы действия. Пусть ваш герой «кричит», «бежит», «целится» или «перевязывает рану». Динамика оживляет изображение. Пример динамичного промта:
«Action shot, soldier sprinting through ruins under fire, debris flying, dynamic blur, shouting expression, intense combat scene, explosion in background, chaotic atmosphere, hyperrealism»
Такой запрос заставит алгоритм размыть фон, добавить летящие осколки и исказить лицо в крике. Да, количество брака при генерации сложных поз возрастает, но удачные варианты окупают все затраты времени.
Материалы и текстуры
Особый интерес вызывает проработка материалов. Военная форма — это не просто цвет, это фактура. Грубый брезент, холодный металл, потёртая кожа портупеи. Используйте слова: «coarse fabric» (грубая ткань), «rusty metal» (ржавый металл), «muddy» (грязный), «wet» (мокрый). Двойное прилагательное «грязный рваный» (dirty torn) в отношении плаща может полностью изменить восприятие персонажа, превратив его из парадного солдатика в выжившего ветерана. И всё же, не перегружайте запрос. Слишком много деталей могут запутать нейросеть, и она начнет игнорировать часть инструкций. Лучше двигаться от общего к частному.
Как выбрать цвет?
Цветокоррекция (Color grading) задает настроение. Для военных драм отлично подходят «desaturated colors» (обесцвеченные тона) или «bleach bypass» (эффект удержания серебра, как в фильме «Спасти рядового Райана»). Для пустынных операций уместна тёплая гамма — «warm palette», «sunset lighting». А вот для ночных стелс-миссий — «cool tones», «blue shadows». Пример атмосферного запроса:
«Sniper lying in high grass, ghillie suit, camouflage, blending with nature, sunset light, warm lens flare, highly detailed sniper rifle scope, tense atmosphere, national geographic photo style»
Здесь свет играет роль камуфляжа, создавая мягкую, но напряженную картинку.
Вопросы масштаба
Иногда нужно показать не одного человека, а целую армию. Это задача не из лёгких. Групповые портреты часто страдают от «лиц-близнецов» или превращения людей на заднем плане в бесформенную массу. Тем более, что проработка деталей падает пропорционально количеству персонажей. Если вы всё же решились на массовую сцену, используйте слова «army formation», «marching troops» или «silhouette of soldiers». Силуэты на фоне заката или дыма скрывают недостатки генерации лиц и создают эпичный масштаб без необходимости прорисовывать каждую пуговицу. Это довольно хитрый, но эффективный приём.
Влияние соотношения сторон
Не стоит забывать и про технические параметры формата. В Midjourney, например, команда «–ar 3:2» (для горизонтального кадра) или «–ar 2:3» (для вертикального) меняет композицию. Вертикальный формат идеален для ростовых портретов, где нужно показать форму целиком. Горизонтальный — для батальных сцен и пейзажей. Квадрат (1:1), который часто стоит по умолчанию, не всегда дает нужный простор для «воздуха» в кадре. Экспериментируйте с форматом «16:9» (–ar 16:9) для создания ощущения кинокадра. Широкий формат позволяет добавить больше контекста — разрушенные здания, военную технику или просто красивый, тревожный горизонт.
Финальный штрих
Работа с промтами — это всегда поиск баланса между вашим воображением и возможностями машины. Не бойтесь смешивать стили. Попробуйте соединить «военную хронику» и «киберпанк», или «рыцарские доспехи» и «современный камуфляж». Иногда самые неожиданные комбинации дают уникальный, самобытный результат, который невозможно получить, действуя строго по инструкции. Главное — не останавливаться на первой же генерации. Меняйте слова местами, добавляйте веса (в некоторых нейросетях это делается через двоеточие, например, «uniform::2»), играйте с синонимами. Ведь каждый новый запрос — это шанс создать маленький шедевр цифрового искусства.
Удачи в творческих экспериментах, и пусть ваши генерации станут отличным решением для любого проекта!