Сложно сегодня найти человека, который не слышал бы о нейросетях, способных рисовать картины за считанные секунды. Кажется, что магия доступна каждому: ввёл пару слов, нажал кнопку — и вот уже на экране красуется шедевр цифрового искусства. Но эйфория обывателя часто сменяется разочарованием, когда вместо ожидаемого портрета голливудского качества на мониторе появляется нечто с тремя руками или размытым лицом. Ведь искусственный интеллект — это не телепат, а всего лишь исполнительный инструмент, требующий предельно точных инструкций. И если результат напоминает детские каракули, винить в этом стоит не алгоритм, а неумение формулировать свои мысли на понятном машине языке. А начать стоит с освоения базы — искусства написания промтов.
Что такое промт и как он работает?
Промт — это текстовое описание, на основе которого нейросеть генерирует изображение. Можно ли назвать его просто набором тегов? Пожалуй, нет. Это скорее сложносочинённый рецепт, где важен каждый ингредиент, его количество и порядок добавления. Если переборщить с деталями, система может запутаться, а если пожадничать — выдаст усредненный, скучный результат. К слову, львиная доля успеха зависит от того, насколько грамотно вы сможете объяснить машине, что именно хотите увидеть. Нейросети, будь то Midjourney или Stable Diffusion, мыслят образами, привязанными к ключевым словам. И здесь вступает в игру первое правило: чем конкретнее запрос, тем предсказуемее результат.
Структура идеального запроса
Из чего же состоит хороший промт? Фундаментом здесь служит объект съёмки. Это то, на чём будет сфокусировано внимание зрителя. Но ограничиться одним словом, например, «кот», было бы довольно опрометчиво. Система, конечно, выдаст кота, но будет ли он рыжим, пушистым или вообще мультяшным — решит рандом. Поэтому описание объекта должно быть скрупулёзным. Уточните пол, возраст, одежду, эмоции и даже позу.
Следом за объектом в игру вступает окружение. Где происходит действие? На шумной улице мегаполиса, в уютной кофейне или на марсианской пустоши? Антураж задает тон всему изображению. Однако не стоит перегружать фон деталями, если они не несут смысловой нагрузки. Иначе нейросеть может сместить акцент с главного героя на пролетающую мимо птицу.
Третий кит, на котором держится качественная генерация, — это стиль и технические параметры. Хотите ли вы получить фотореалистичное изображение, стилизацию под масло или киберпанк? Здесь на помощь приходят специфические термины, знакомые фотографам и художникам. Но о них мы поговорим чуть ниже. Ну и, наконец, освещение и цветовая гамма. Именно свет творит чудеса, превращая плоскую картинку в объёмное, живое полотно.
Технические параметры для фотореализма
Многие грезят о том, чтобы сгенерированные картинки невозможно было отличить от реальных фотографий. Сложно ли этого добиться? Да, но результат того стоит. Секрет кроется в использовании профессиональной терминологии. Нейросети обучались на миллионах снимков, и они прекрасно знают, как выглядит кадр, сделанный на конкретную камеру.
Попробуйте добавить в конец вашего запроса название камеры. Например, «Shot on Sony A7R IV» или «Canon EOS R5». Это сразу даст сигналу системе, что нужно стремиться к высокой детализации и определённой цветопередаче. А если упомянуть пленку, скажем, «Kodak Portra 400» или «Fujifilm Pro 400H», то изображение приобретет характерное зерно и мягкие, ламповые цвета.
Нельзя не упомянуть и про объективы. Указание фокусного расстояния кардинально меняет восприятие кадра. Хотите широкий угол и эпичность? Впишите «16mm» или «wide angle». Нужен красивый портрет с размытым фоном? Тогда вашим выбором станет «85mm» или «100mm». Кстати, само размытие фона отлично вызывается словами «bokeh» или «depth of field». Это придаёт снимку глубину и отделяет объект от заднего плана.
Высокое разрешение и детализация также задаётся текстом. Добавление таких маркеров, как «8k», «highly detailed», «hyperrealistic», «UHD», заставляет нейросеть прорисовывать каждую морщинку и травинку. Разумеется, это увеличивает время генерации, но качество изображения возрастает в разы.
Свет и атмосфера
Освещение — это душа фотографии. Без правильного света даже самая интересная композиция будет выглядеть уныло. И здесь есть где разгуляться фантазии. Самым популярным и беспроигрышным вариантом считается «golden hour» (золотой час) — время перед закатом, когда свет мягкий и тёплый.
Если же хочется драмы и контраста, стоит попробовать «cinematic lighting» (кинематографичное освещение) или «dramatic lighting». Для портретов отлично подходит «Rembrandt lighting» (свет Рембрандта), создающий выразительную тень на одной стороне лица. А вот для футуристичных сюжетов незаменимым станет «neon lighting» (неоновое освещение) или «volumetric lighting» (объёмный свет), который создаёт красивые лучи, пробивающиеся сквозь дымку или пыль.
Тёмное, загадочное настроение передает «low key» (низкий ключ), а светлое и воздушное — «high key» (высокий ключ). Экспериментировать с этими параметрами можно бесконечно, каждый раз получая совершенно новую картинку.
Примеры готовых промтов: Портрет
Теория — это хорошо, но практика куда полезнее. Давайте разберём конкретные примеры запросов для создания реалистичных портретов.
Женский портрет в городе:
Prompt: A stunningly beautiful young woman with freckles and green eyes, walking down a rainy street in Tokyo at night, neon lights reflecting in puddles, holding a transparent umbrella, shot on Sony A7R IV, 85mm lens, f/1.8, bokeh, cinematic lighting, hyperrealistic, 8k, highly detailed texture of skin.
Разберем этот запрос по полочкам. Мы начали с объекта (красивая девушка с веснушками и зелеными глазами), поместили её в контекст (дождливый Токио, ночь, неон), добавили действие (идет, держит зонт). Затем задали технические параметры камеры и объектива для размытия фона (bokeh), определили свет (cinematic) и потребовали максимальной детализации кожи. Результат будет впечатляющим.
Мужской возрастной портрет:
Prompt: Close-up portrait of an old fisherman with a white beard and weathered skin, wearing a yellow raincoat, stormy sea in the background, dramatic lighting, gloomy atmosphere, sharp focus on eyes, intricate details, shot on 35mm film, Kodak Portra 400, grainy texture, realistic.
Здесь мы сделали упор на фактуру. Слова «weathered skin» (обветренная кожа) и «intricate details» (сложные детали) помогут нейросети прорисовать каждую складку на лице. Плёночная эстетика (Kodak Portra) добавит снимку настроения и драматизма, соответствующего теме шторма.
Примеры готовых промтов: Пейзажи и архитектура
С пейзажами дело обстоит несколько иначе. Здесь важнее масштаб и композиция.
Фантастический пейзаж:
Prompt: A majestic futuristic city floating in the clouds, glass and steel spires, waterfalls cascading down into the void, sunset with purple and orange clouds, epic scale, wide angle, aerial view, volumetric lighting, ray tracing, unreal engine 5 render, highly detailed, 8k.
Обратите внимание на использование «unreal engine 5 render» и «ray tracing». Казалось бы, это термины из мира видеоигр, но они отлично работают и для генерации картинок, подсказывая нейросети, что нужно создать технически безупречное изображение с идеальным светом. «Aerial view» (вид с воздуха) задает нужный ракурс.
Уютный интерьер:
Prompt: A cozy living room interior in Scandinavian style, large window with a view of a snowy forest, fireplace with crackling fire, knitted blanket on the sofa, warm lighting, wooden floor, highly detailed, architectural photography, photorealistic, 4k.
Этот промт нацелен на создание атмосферы уюта. Ключевые слова «Scandinavian style», «fireplace», «knitted blanket» работают на создание определённого настроения. Уточнение «architectural photography» помогает выстроить правильную композицию кадра, характерную для интерьерных журналов.
Примеры готовых промтов: Еда и предметы
Фуд-фотография — отдельный вид искусства, и нейросети справляются с ним довольно неплохо, если правильно поставить задачу.
Аппетитный бургер:
Prompt: A delicious juicy gourmet burger with melting cheddar cheese, crispy bacon, fresh lettuce and tomatoes, on a wooden board, dark background, smoke, professional food photography, studio lighting, macro shot, sharp focus, 8k, mouth-watering.
Слова «juicy» (сочный), «melting» (плавящийся) и «crispy» (хрустящий) важны для передачи текстуры еды. «Macro shot» (макросъёмка) позволяет показать продукт максимально близко, а «studio lighting» обеспечивает идеальные блики на булочке и мясе.
Предметная съёмка (духи):
Prompt: An elegant bottle of perfume made of blue glass, surrounded by white flowers and water splashes, on a mirror surface, bright clean background, product photography, soft lighting, commercial look, high resolution, 8k.
Здесь мы используем маркер «product photography» и «commercial look», чтобы получить изображение, готовое для рекламы. «Water splashes» (брызги воды) добавляют динамики статичному кадру.
Нужен ли негативный промт?
Многие новички игнорируют поле Negative Prompt, а зря. Ведь именно он отсекает всё лишнее, что нейросеть может по ошибке добавить в кадр. Это своего рода фильтр безопасности. Обязательно ли его заполнять? В простых запросах можно обойтись и без него, но для сложных сцен это необходимость.
Что обычно туда пишут? В первую очередь, дефекты анатомии. Ugly, deformed, noisy, blurry, distorted, out of focus, bad anatomy, extra limbs, poorly drawn face, strangely bent fingers. Для фотореализма стоит добавить запрет на рисованные стили: cartoon, 3d, vector, illustration, sketch, painting.
Использование негативного промта значительно повышает шансы получить чистое изображение с первого раза. Это экономит и время, и токены генерации.
Распространённые ошибки
Почему же, даже зная теорию, у некоторых выходят плохие картинки? Чаще всего проблема кроется в противоречиях. Если вы напишете «солнечный день» и «ночное небо» в одном запросе, нейросеть сойдет с ума и выдаст сюрреалистичную кашу. Логика — ваш лучший друг.
Вторая ошибка — «словесный салат». Не стоит просто копировать облако тегов из интернета, не понимая их значения. Огромные простыни текста нейросеть часто игнорирует, выхватывая лишь начало и конец. Лаконичность и точность работают лучше, чем хаотичный набор из сотни слов.
Также не стоит забывать про вес слов. В некоторых нейросетях (например, Midjourney) слова, стоящие в начале промта, имеют больший приоритет. Поэтому самое важное (объект) всегда ставьте вперёд, а детали уводите в конец предложения.
Эстетика и композиция
Впрочем, техническая сторона — это лишь полдела. Нельзя забывать и о художественной составляющей. Композиционные приёмы, такие как «rule of thirds» (правило третей), «symmetry» (симметрия) или «leading lines» (направляющие линии), делают кадр гармоничным и приятным глазу.
Попробуйте поиграть с ракурсами. «Low angle» (нижний ракурс) придает объекту величия, а «top down» (вид сверху) интересен для раскладок предметов или карт местности. «Selfie» — понятный всем жанр, который тоже отлично генерируется, если добавить правильные эмоции и фон.
И, конечно же, стиль. Добавление имён известных фотографов (например, Annie Leibovitz, Steve McCurry, Ansel Adams) может направить нейросеть в нужное эстетическое русло, заимствуя их манеру работы со светом и цветом. Это не плагиат, а скорее оммаж великим мастерам.
Подводные камни генерации
Бывает и так: промт идеален, а результат удручающий. Глаза косят, пальцев шесть, а фон плывет. В чём же дело? Искусственный интеллект всё ещё учится. Руки и тексты — его ахиллесова пята. Бороться с этим можно бесконечными перегенерациями (рероллами) или использованием функции inpainting, позволяющей перерисовать конкретный участок изображения.
Не стоит отчаиваться при первой неудаче. Иногда достаточно изменить одно слово, убрать лишнюю запятую или поменять соотношение сторон (aspect ratio), чтобы картинка заиграла новыми красками. Эксперимент — вот главный двигатель прогресса в нейроарте.
Творческий поиск
На самом деле, написание промтов — это увлекательный процесс, похожий на поиск сокровищ. Вы перебираете комбинации слов, смешиваете стили, добавляете неожиданные эпитеты и наблюдаете за реакцией «чёрного ящика». И когда на экране появляется именно то, что вы задумали, или даже лучше — это ни с чем не сравнимое чувство.
Главное — не бояться пробовать. Копируйте чужие промты, разбирайте их на части, меняйте переменные и смотрите, как меняется результат. Создайте свой собственный словарь удачных выражений и связок. Ведь нейросеть — это всего лишь мощный инструмент, а настоящим творцом остаётесь вы. Пусть ваши запросы всегда будут точными, а генерации — впечатляющими. Удачи в создании цифровых шедевров, которые поразят воображение!