Ни один современный цифровой художник уже не удивляется, когда вместо обещанного шедевра получает изображение существа с шестью пальцами или глазами, смотрящими в разные вселенные. Эта «болезнь» нейросетей знакома каждому, кто хоть раз пытался сгенерировать реалистичный портрет, доверившись лишь простому описанию вроде «красивая девушка» или «суровый мужчина». Разочарование в таких случаях наступает мгновенно, ведь искусственный интеллект — это не телепат, а довольно исполнительный, но совершенно лишенный фантазии (в человеческом понимании) инструмент. Он мыслит тегами, весами и паттернами, а не образами. И вся соль в том, что красота результата напрямую зависит от точности, с которой вы сможете перевести свои мысли на язык машины. Но чтобы не ошибиться и не тратить часы на генерацию монстров, нужно освоить искусство написания правильных промтов.
С чего начинается работа?
А начинается она вовсе не с выбора цвета волос или фасона платья. Фундамент — это определение стиля и технического носителя. Спросите себя: что именно вы хотите получить? Будет ли это имитация плёночного снимка 90-х, глянцевая цифровая фотография или же гиперреалистичный 3D-рендер? Если этот момент упустить, нейросеть выдаст нечто среднее, пластиковое и безжизненное. Поэтому первым делом в промт стоит вписать “medium” — тип изображения. Для фотореализма отлично работают связки вроде «award winning photography», «shot on 35mm» или указание конкретной модели камеры, например, «Sony A7R IV». Это дает алгоритму жёсткую привязку к текстуре и физике света. Ведь именно физически корректное освещение превращает набор пикселей в живого человека.
Анатомия запроса
Сложно ли составить идеальную формулу? Довольно просто, если разложить всё по полочкам. Структура промта напоминает слоёный пирог, где каждый ингредиент важен. Основа — это субъект. Описывать его нужно скрупулёзно, но без фанатизма. Не стоит писать «красивый», лучше уточнить детали: «high cheekbones» (высокие скулы), «freckles» (веснушки), «heterochromia» (разный цвет глаз). Конкретика творит чудеса. Далее следует окружение. Где находится ваш герой? В туманном лесу, неоновом мегаполисе или стерильной студии? Ну и, конечно же, освещение. Без него даже самая детальная модель будет выглядеть плоской. Используйте термины «volumetric lighting» (объёмный свет), «rembrandt lighting» (свет Рембрандта) или «softbox». Завершает этот ансамбль блок технических параметров — разрешение, соотношение сторон и детализация («8k», «highly detailed», «hyperrealistic»).
Ошибки новичков
Главный бич начинающих — многословие. Огромные полотна текста, скопированные из интернета, нейросеть часто просто игнорирует. Она «забывает» начало фразы, пока дочитывает конец. Ещё одна ловушка — противоречивые команды. Нельзя одновременно требовать «sunny day» (солнечный день) и «midnight atmosphere» (атмосфера полуночи), хотя некоторые экспериментаторы пытаются. Результат в таких случаях получается неоднозначный, чаще — удручающий. Также не стоит пренебрегать негативными промтами. Это тот самый спасательный круг, который отсекает лишние конечности, размытые лица и кривые горизонты. В этот блок (обычно обозначается как –no или Negative Prompt) обязательно стоит вносить «deformed», «blur», «bad anatomy», «extra fingers».
Примеры для портретной съёмки
Допустим, наша цель — создать глубокий, драматичный мужской портрет. Обыватель напишет «man portrait». Профессионал же пойдёт иным путем. Вот добротный вариант для старта:
Close-up portrait of an elderly fisherman with a weathered face, deep wrinkles, white beard, wearing a yellow raincoat, stormy ocean background, dramatic lighting, raindrops on face, shot on Canon EOS 5D Mark IV, 85mm lens, f/1.8, hyperrealistic, 8k –ar 2:3
Здесь каждое слово работает на атмосферу. Объектив 85mm дает красивое размытие фона (боке), а диафрагма f/1.8 фокусирует внимание на глазах.
А если нужна женская эстетика?
Для нежного, почти эфирного образа девушки стоит сменить тональность и технические настройки. Попробуйте такой сценарий:
Young woman with pale skin and long red hair, standing in a field of lavender during golden hour, soft sunlight, dreamy atmosphere, wearing a white vintage dress, intricate details, cinematic look, shot on Kodak Portra 400, grain, emotional expression –ar 3:4
Упоминание плёнки Kodak Portra добавляет кадру тот самый «тёплый» и ламповый оттенок, который так ценится фотографами. И обратите внимание на время суток — «golden hour» (золотой час). Это гарантия мягкого, обволакивающего света.
Ростовые фотографии и динамика
Сложнее всего нейросетям даются фигуры в полный рост. Проблемы с пропорциями и ногами всплывают довольно часто. Чтобы минимизировать риск, нужно четко задать позу и ракурс. Например, для фэшн-съёмки подойдет такой запрос:
Full body shot of a fashion model walking on a wet street in Tokyo at night, wearing futuristic cyberpunk clothing, neon lights reflecting in puddles, dynamic pose, low angle shot, wide angle lens, 35mm, high fashion photography, Vogue style, sharp focus –ar 9:16
Ракурс «low angle» (вид снизу) визуально удлиняет ноги и добавляет модели величия. А упоминание «Vogue style» подсказывает алгоритму, какую именно эстетику и композицию вы ищете.
Стилизация под эпоху
Иногда хочется окунуться в прошлое. Винтажные фото имеют свой неповторимый шарм. Чтобы получить эффект старого снимка, нужно использовать специфический лексикон. Вот пример для фото в стиле 1920-х:
Black and white photograph from 1920s, portrait of a gangster in a suit smoking a cigar, fedora hat, smoky jazz club background, noise, scratches, sepia tone, vintage camera style, daguerreotype style, high contrast
Слова «noise» (шум) и «scratches» (царапины) искусственно старят изображение, делая его практически неотличимым от архивного документа. Это же касается и техники дагерротипа.
Работа с текстурами кожи
Самая частая претензия к ИИ-генерациям — «пластиковая» кожа. Лица выглядят слишком идеальными, как у манекенов. Чтобы этого избежать, в промт необходимо добавлять маркеры несовершенства. Звучит странно, но именно недостатки делают нас людьми. Используйте слова «skin pores» (поры кожи), «imperfections» (несовершенства), «moles» (родинки), «natural texture» (натуральная текстура). Пример промта для макросъёмки глаза:
Extreme close-up macro shot of a human blue eye, visible iris details, veins in the eye, eyelashes, natural skin texture, pores visible, moisture, reflection in the eye, hyper-detailed, photorealistic, studio lighting
Такой подход заставляет нейросеть прорисовывать микродетали, а не «замыливать» их.
Влияние художников и фотографов
Можно ли использовать имена реальных творцов? Безусловно. Это один из самых мощных инструментов калибровки стиля. Если вы добавите в промт «by Annie Leibovitz», картинка приобретет характерную для неё драматичность и постановочный свет. А упоминание «by Steve McCurry» направит генерацию в сторону документальной, живой фотографии с насыщенными цветами. Однако тут есть тонкий нюанс: нейросеть может слишком сильно увлечься копированием стиля и потерять оригинальность вашего запроса. Поэтому имена лучше использовать как «приправу», добавляя их в конце промта с небольшим весом, или же смешивать нескольких авторов: «style of Peter Lindbergh mixed with Wes Anderson». Такой коктейль часто дает неожиданно интересные, самобытные результаты.
Освещение как инструмент драматургии
Свет — это не просто условие видимости, это настроение кадра. Игнорировать его описание — значит пустить всё на самотёк. А ведь вариантов масса. «Cinematic lighting» делает картинку похожей на кадр из кинофильма. «Natural lighting» подходит для лайфстайл-фотографий. Но есть и более сложные схемы. Например, «bioluminescent lighting» создаст фантастическое свечение, исходящее от самой кожи или одежды, что идеально для фэнтези. А «rim light» (контровой свет) очертит силуэт, отделив фигуру от фона. Кстати, умелое использование теней («harsh shadows») может добавить снимку тревожности и загадочности, что часто используется в нуарных сюжетах.
Одежда и ткани
Нейросети обожают детализированную одежду, но часто путаются в сложных фасонах. Поэтому описывать гардероб стоит простыми, но ёмкими фразами. Не «сложное платье с кучей оборок», а «intricate lace dress» (платье из сложного кружева) или «silk blouse» (шёлковая блузка). Материал имеет значение. Указание «leather», «denim», «velvet» дает алгоритму подсказку, как именно должен отражаться свет от поверхности. Пример для текстурного образа:
Portrait of a warrior wearing rusted metal armor with fur details, dirt on armor, leather straps, realistic texture, cinematic lighting, dark background
Здесь «rusted» (ржавый) и «fur» (мех) создают тот самый тактильный контраст, за который цепляется взгляд.
Генерация эмоций
Пустой взгляд — ещё одна «болезнь» цифровых людей. Чтобы вдохнуть жизнь, нужно прописывать эмоции. И не просто «happy» или «sad». Используйте более тонкие определения: «smirk» (ухмылка), «grief» (горе), «euphoria» (эйфория), «suspicious look» (подозрительный взгляд). Это меняет мимику, положение бровей и даже наклон головы. Простой промт «laughing woman» даст стандартную улыбку. А вот «woman laughing hysterically, tears in eyes, head thrown back» создаст мощную, динамичную сцену, полную экспрессии. К слову, глаза — зеркало души даже в генеративном искусстве, поэтому фразы вроде «expressive eyes» или «piercing gaze» (пронзительный взгляд) никогда не будут лишними.
Технические «костыли» и лайфхаки
Есть слова, которые работают как усилители качества, независимо от сюжета. Их называют модификаторами. Список довольно стандартный, но эффективный: «masterpiece», «best quality», «ultra-detailed», «Unreal Engine 5 render» (да, упоминание игрового движка часто улучшает 3D-свет). Однако не стоит бездумно копировать их все подряд. Это перегружает промт и может привести к появлению артефактов. Лучше выбрать 2-3 наиболее подходящих под вашу задачу. И помните про формат соотношения сторон (–ar или –aspect). Для портретов в соцсети идеально 2:3 или 9:16, а для кинематографичных пейзажей с фигурой человека — 16:9 или даже 21:9.
Проблема «зловещей долины»
Иногда, несмотря на все усилия, лицо получается отталкивающим. Вроде всё правильно, но что-то не так. Этот эффект называется «зловещей долиной». Чаще всего виновата симметрия. Живые лица не идеально симметричны. Попробуйте добавить в промт «slightly asymmetrical face» или наклон головы. Также помогает добавление очков, шарфов или прядей волос, падающих на лицо. Это разбивает искусственную идеальность и делает образ более приземленным и достоверным. Не бойтесь закрывать часть лица тенью или предметами — недосказанность порой выглядит реалистичнее полной открытости.
Эксперименты с цветом
Цветовая палитра (Color Grading) — мощнейший инструмент воздействия на зрителя. Вы можете прямо указать гамму: «pastel colors», «cyberpunk neon palette», «black and white», «sepia». Или же пойти дальше и заказать эмуляцию конкретной киноплёнки, например, «Kodachrome», которая славится своими насыщенными красными и жёлтыми оттенками. Цветовые акценты тоже важны. Фраза «mostly blue image with red accents» заставит нейросеть выстроить композицию на контрасте, что всегда смотрится выигрышно и профессионально. Впрочем, иногда стоит довериться случаю и не указывать цвета вовсе, позволяя алгоритму самому подобрать гармонию на основе освещения.
Не бойтесь ошибаться. Генерация изображений — это процесс перебора, своего рода цифровая рыбалка. Вы закидываете удочку (промт) и смотрите, что клюнет. Иногда нужно изменить всего одно слово, чтобы «улов» превратился из посредственного в гениальный. Пробуйте, смешивайте стили, добавляйте странные детали. Пусть ваша цифровая галерея пополнится действительно уникальными портретами, которые заставят зрителя гадать: снято это на камеру или создано кодом? Вдохновения вам и удачных генераций!