Казалось бы, что может быть проще: открыл диалоговое окно, ввёл пару фраз о красивом закате или портрете девушки, нажал кнопку — и через минуту перед тобой шедевр цифрового искусства. В сети представлено множество галерей, где работы выглядят так, словно их снимал профессиональный фотограф с многолетним стажем на камеру стоимостью в автомобиль. Однако на практике обыватель довольно часто сталкивается с суровой реальностью: нейросеть выдаёт то шесть пальцев, то «пластиковую» кожу, то совершенно не тот антураж, о котором мечталось. И дело здесь вовсе не в «глупости» алгоритма, а в неумении найти с ним общий язык, который, к слову, имеет свой синтаксис и свои жёсткие правила. Поэтому, чтобы результат не стал разочарованием, а заставлял зрителя замереть в восхищении, стоит разобраться в архитектуре правильного запроса и разобрать работающие примеры.
Как устроена анатомия запроса?
В представлении многих новичков промт — это просто описание того, что должно быть на картинке. Это верно лишь отчасти. Для нейросети, будь то Midjourney или Stable Diffusion, запрос представляет собой слоёный пирог, где каждый ингредиент отвечает за свой нюанс. Фундаментом всегда выступает главный объект. Без чёткого указания «кто» или «что» находится в центре композиции, алгоритм начнет импровизировать, и эти импровизации редко бывают удачными. Сразу за объектом следует описание действия и окружения. Где находится герой? Что он делает? Стоит на краю обрыва или сидит в уютном кафе? Ну и, наконец, «вишенкой на торте» становятся технические параметры и стилистические модификаторы, которые превращают простую картинку в фотореалистичное полотно.
Технические модификаторы
Сухой перечень объектов не даст того самого эффекта «фотографии». Чтобы обмануть глаз зрителя, нужно говорить с нейросетью на языке фотографов. Здесь в игру вступают названия камер, объективов и типов плёнки. Довольно часто в промтах можно встретить упоминание «Canon EOS 5D Mark IV» или «Sony A7R IV». Это даёт системе сигнал о том, что изображение должно иметь высокую детализацию и определённую цветопередачу. Не стоит забывать и про объективы. Если нужен портрет с размытым фоном, смело добавляйте «85mm lens» или «f/1.8». Это создаёт тот самый эффект боке, который так ценится в портретной съёмке. А для широких панорамных видов отлично подойдёт «wide angle» или «16mm». К слову, упоминание конкретной фотоплёнки, например «Kodak Portra 400», добавит кадру теплоты и едва заметной зернистости, делая его живым и ламповым.
Свет как инструмент
Именно свет выступает в роли главной кисти в фотографии, и генерация изображений здесь не исключение. Плоский, скучный свет способен убить даже самую гениальную композицию. А вот правильное освещение творит чудеса. Одним из самых популярных запросов является «cinematic lighting» (кинематографичное освещение), которое придаёт кадру драматизм и глубину. Если же хочется добавить объёма, стоит использовать «volumetric lighting» — это создаст эффект лучей, пробивающихся сквозь пыль или туман. Для портретов отлично работает «Rembrandt lighting», создающий характерный треугольник света на щеке, или «softbox lighting» для мягкого, студийного рисунка без резких теней. А если цель — передать атмосферу загадочности, то на помощь придёт «bioluminescent lighting» с его неоновым свечением.
Портретная съёмка: реализм в деталях
Главная проблема сгенерированных людей — их идеальность. Гладкая, словно отполированная кожа сразу выдаёт искусственное происхождение кадра. Чтобы этого избежать, нужно принудительно добавлять текстуру. В промт стоит вписать такие маркеры, как «highly detailed skin texture», «pores», «moles» или даже «freckles» (веснушки). Это сбивает с алгоритма спесь глянцевого журнала и добавляет лицу жизни. Глаза — зеркало души, и в промте им нужно уделить особое внимание. Фразы вроде «detailed iris» или «reflection in eyes» делают взгляд осмысленным и глубоким. Рассмотрим конкретный пример запроса для создания характерного мужского портрета.
Промт: «Hyper-realistic close-up portrait of an old weathered fisherman with a white beard, wearing a yellow raincoat, storm at sea background, rain droplets on face, deep wrinkles, intense look, shot on 35mm lens, cinematic lighting, dark atmosphere, 8k resolution, high detail.»
В этом запросе мы видим чёткую структуру: сначала объект (старый рыбак), затем детали внешности (белая бороды, морщины), одежда (жёлтый плащ), окружение (шторм), и, наконец, технические параметры (35мм, 8к). Результат такого запроса обычно выглядит впечатляюще и практически неотличим от реального снимка.
Женский портрет: нюансы стиля
С женскими образами ситуация обстоит несколько иначе. Здесь часто хочется добиться не суровой брутальности, а эстетики и нежности. Но и тут есть свои подводные камни. Излишняя «кукольность» портит впечатление. Попробуем создать образ девушки в городском антураже.
Промт: «Street photography, candid shot of a young stylish woman laughing in a cafe in Paris, sunlight through the window, bokeh background, natural skin texture, casual clothes, shot on Fujifilm XT-4, color grading, realistic shadows.»
Слово «candid» здесь играет ключевую роль — оно означает случайный, непостановочный кадр, что сразу добавляет живости. Упоминание Парижа и кафе задаёт атмосферу, а «Fujifilm XT-4» диктует определённую цветовую палитру, свойственную этой камере. Это же правило касается и макияжа: если не уточнить «natural make-up», нейросеть может нарисовать боевой раскрас.
Пейзажи и архитектура
Здесь масштаб имеет значение. Чтобы показать величие природы или монументальность здания, нужно правильно выбрать точку съёмки. Маркеры «aerial view» (вид с воздуха) или «drone shot» позволяют взглянуть на мир с высоты птичьего полёта. Для архитектуры отлично работает «low angle view» (съёмка с нижней точки), что визуально увеличивает здание, делая его доминирующим. Освещение в пейзажах — это, пожалуй, 80% успеха. «Golden hour» (золотой час) — беспроигрышный вариант для тёплых, мягких теней. А для мрачных, готических видов подойдёт «blue hour» (сумерки) или «overcast» (пасмурно).
Промт: «Majestic futuristic city with vertical gardens and glass bridges, harmony of nature and technology, solar punk style, waterfall from a skyscraper, warm sunset lighting, birds in the sky, wide angle shot, highly detailed, photorealistic, Unreal Engine 5 render.»
Обратите внимание на упоминание «Unreal Engine 5». Хотя это движок для игр, нейросети воспринимают этот тег как команду к максимальной детализации и современному 3D-рендерингу. Стиль «solar punk» задаёт настроение: светло, зелено, технологично.
Предметная съёмка: Еда и товары
В коммерческой фотографии главное — вызвать желание. Еда должна выглядеть аппетитно, а товары — дорого. Здесь в ход идут такие определения, как «juicy» (сочный), «delicious» (вкусный), «steam» (пар). Для напитков обязательным атрибутом становятся «condensation» (капли конденсата) и «splash» (всплеск). Фон не должен отвлекать, поэтому часто используют «blurred background» или «studio background».
Промт: «Macro shot of a juicy double cheeseburger with melting cheese and bacon, sesame bun, steam rising, fresh lettuce, professional food photography, dark moody background, spotlight, hyper-realistic, 8k, sharp focus.»
Слово «macro» позволяет рассмотреть текстуру мяса и блеск расплавленного сыра. «Dark moody background» создаёт контраст, благодаря которому сам бургер буквально светится и приковывает внимание. Это серьёзное вложение усилий в текст, которое окупается качественным результатом.
Стилизация и художественные приёмы
Иногда фотореализм — не самоцель. Порой хочется чего-то необычного, сказочного или стилизованного под ретро. В таких случаях можно обращаться к конкретным историческим периодам или художественным направлениям. Например, «1980s polaroid» даст характерную размытую картинку с винтажными цветами. А «vaporwave» окрасит всё в фиолетово-розовые тона.
Промт: «Cyberpunk street samurai girl, neon lights, rain, wet asphalt, futuristic armor, katana, Tokyo night city background, synthwave style, pink and blue colors, chromatic aberration, detailed art.»
Тег «chromatic aberration» (хроматическая аберрация) добавляет лёгкое искажение цветов по краям объектов, что свойственно старой оптике или стилистике киберпанка. Это та самая изюминка, которая делает картинку стильной.
Негативные промты: отсекаем лишнее
Нельзя не упомянуть и о том, как убрать из кадра ненужное. Негативный промт (Negative Prompt) — это спасательный круг для тех, кто устал от артефактов. Сюда обычно вписывают всё то, чего на картинке быть не должно. Стандартный набор выглядит примерно так: «ugly, deformed, extra fingers, bad anatomy, blurry, watermark, text, low quality». Это своего рода фильтр, который очищает генерацию от мусора. Ведь нейросеть, предоставленная сама себе, может нарисовать и три ноги, и размытое лицо. Использование негативных промтов существенно повышает качество итогового изображения.
Параметры и настройки
В Midjourney, например, огромную роль играют параметры, которые пишутся в конце запроса через двойное тире. Соотношение сторон задаётся командой «–ar». Для киношного кадра идеально подойдёт «–ar 16:9», а для сторис в соцсетях — «–ar 9:16». Параметр стилизации «–stylize» (или «–s») отвечает за то, насколько вольно нейросеть будет интерпретировать ваш запрос. Низкие значения (около 50-100) заставят её строго следовать тексту, а высокие (700-1000) дадут ей творческую свободу, что может привести к неожиданным, но красивым результатам. Есть ещё параметр «–chaos», который определяет вариативность результатов. Высокий хаос выдаст четыре совершенно непохожих друг на друга картинки.
Ошибки, которые портят всё
Львиная доля неудач связана с противоречивыми запросами. Не стоит требовать от нейросети одновременно «солнечный день» и «ночное небо» — результат будет непредсказуемым и, скорее всего, странным. Также новички часто грешат чрезмерным количеством слов. Огромные «простыни» текста путают алгоритм. Он просто теряет фокус и забывает, что было в начале предложения. Лаконичность и точность — вот залог успеха. Лучше написать «majestic lion» (величественный лев), чем три строчки описывать его королевскую осанку и степень пушистости гривы, если это не критично для сюжета. Ещё один нюанс — порядок слов. То, что стоит в начале промта, имеет для сети больший вес. Поэтому самое важное выносим вперёд.
Сложно ли научиться?
Да, поначалу кажется, что нужно выучить какой-то магический язык. Но на самом деле это вопрос практики и насмотренности. Анализируя чужие работы и промты, можно довольно быстро понять логику машины. Не стоит бояться экспериментировать. Замените «soft light» на «hard light», добавьте «fog» (туман) или измените время года. Нейросети — это бесконечный полигон для творчества, где единственным ограничением является ваша фантазия. К тому же, сообщество постоянно находит новые интересные токены и связки слов, которые дают неожиданные эффекты.
А стоит ли копировать чужие промты? Безусловно, на первых порах это лучший способ обучения. Берёте готовый работающий запрос, меняете в нём объект или цвет одежды, и смотрите, как меняется результат. Это позволяет «нащупать» влияние каждого слова. Но чтобы создавать действительно уникальные вещи, придётся рано или поздно начать писать свои собственные сценарии, комбинируя стили, эпохи и техники. И пусть каждая генерация станет для вас небольшим открытием, а итоговая картинка займёт достойное место в портфолио или просто порадует глаз своей эстетикой. Удачи в творческих поисках!