Создание идеального изображения с помощью нейросетей давно перестало быть уделом избранных гиков и превратилось в повседневную необходимость для дизайнеров, маркетологов и просто любителей прекрасного. Казалось бы, что может быть проще: вбил пару слов в строку, нажал кнопку и получил шедевр, достойный обложки глянцевого журнала. Однако на практике результат довольно часто разочаровывает: вместо «девушки с загадочной улыбкой» на экране появляется существо с семью пальцами и пластиковой кожей, а «уютный домик в лесу» напоминает декорации из дешёвого хоррора. Проблема здесь кроется вовсе не в несовершенстве алгоритмов, как принято считать. Львиная доля успеха зависит от умения грамотно сформулировать запрос. А начать стоит с понимания того, как машина «видит» наш язык и какие слова служат для неё теми самыми триггерами, запускающими процесс создания магии.
Структура правильного запроса
Сложно ли написать хороший промт? Технически — нет, но вот составить его так, чтобы искусственный интеллект понял вас с полуслова, — задача, требующая скрупулезного подхода. Фундамент любого качественного изображения держится на трёх китах: объект, окружение и технические детали. Первым делом мы всегда обозначаем главного героя или предмет. Это может быть «рыжий кот», «футуристический автомобиль» или «женщина средних лет». Но одного существительного машине мало. Ей нужна конкретика. Поэтому сразу же добавляйте описания: во что одет персонаж, какая у него эмоция, что он делает. К слову, именно глаголы действия оживляют картинку. Далее следует описание локации. Где всё происходит? В лесу, в студии, на Марсе? Ну и, наконец, третий, самый важный слой — это стиль и параметры съёмки. Без них вы получите просто рисунок, а не фотореалистичный кадр.
Освещение
Главную скрипку в восприятии фотографии всегда играет свет. Именно он задаёт настроение, объём и ту самую «киношность», за которой все гоняются. Если вы оставите этот пункт без внимания, нейросеть выставит свет на своё усмотрение, и результат может оказаться плоским и скучным. Один из самых беспроигрышных вариантов — это «естественное освещение» или «мягкий солнечный свет». Такой запрос гарантирует приятную, живую картинку. Для более драматичных портретов стоит использовать «студийный свет», «рембрандтовское освещение» или «контровой свет». А если хочется добавить загадочности и объёма, попробуйте прописать «объёмный свет» или «лучи солнца, пробивающиеся сквозь листву». Кстати, время суток тоже имеет значение. «Золотой час» (время перед закатом) подарит тёплые, медовые оттенки, а «синий час» (сразу после заката) окрасит кадр в холодные, мистические тона. Не стоит забывать и про искусственные источники: «неоновая подсветка» или «свет от костра» кардинально меняют антураж.
Как выбрать камеру и объектив?
Нужно ли разбираться в фототехнике, чтобы генерировать картинки? Да, и это тот самый нюанс, который отличает новичка от профи. Нейросети прекрасно знают характеристики реальных объективов и имитируют их работу. Если ваша цель — классический портрет с красивым размытием фона (боке), смело добавляйте в промт «85mm» или «100mm». Это фокусные расстояния, которые делают лицо пропорциональным и красиво отделяют его от фона. Для пейзажей и архитектуры, где важно захватить как можно больше пространства, лучшим решением станет «широкоугольный объектив» или конкретные цифры «16mm», «24mm». А вот для макросъёмки жучков, цветов или глаз используйте «макрообъектив» или «macro lens». Кроме того, можно указывать конкретные модели камер. Упоминание «Sony A7R IV» или «Fujifilm GFX 100» даст сигналу алгоритму, что нужно выдать картинку с высочайшей детализацией и определённой цветопередачей. Это же правило касается и пленки. Фразы вроде «снято на Kodak Portra 400» добавят изображению характерное зерно и тёплые, ламповые цвета.
Портретная фотосессия: примеры и разбор
Давайте перейдём от теории к практике и рассмотрим конкретные сценарии. Допустим, вам нужен качественный деловой портрет. Простой запрос «мужчина в костюме» выдаст что-то среднее и безликое. А вот детализированный промт сотворит чудеса. Попробуйте такую конструкцию:
«Фотореалистичный портрет уверенного мужчины 35 лет, европейская внешность, лёгкая небритость, одет в тёмно-синий деловой костюм и белую рубашку, стоит в современном офисе с панорамными окнами, естественный дневной свет, взгляд направлен в камеру, высокая детализация кожи, снято на 85mm f/1.8».
Здесь мы указали всё: возраст, внешность, одежду, локацию и свет. Результат будет на голову выше.
Другой пример — художественный женский портрет. Часто хочется получить что-то нежное и воздушное. В таком случае стоит использовать следующие формулировки:
«Крупный план молодой девушки с веснушками и голубыми глазами, растрёпанные ветром волосы, мягкий утренний свет, поле с полевыми цветами на заднем плане, мечтательное выражение лица, эстетика плёнки, пастельные тона, высокая детализация глаз».
Обратите внимание на эпитеты «мечтательное», «мягкое», «пастельное». Они задают настроение.
Предметная съёмка и еда
Фотографии еды или товаров — это отдельный жанр, где важна «аппетитность» и фактура. Здесь работают свои законы. Если вам нужно сгенерировать изображение бургера, не скупитесь на описание ингредиентов и текстур. Пример готового промта:
«Сочный чизбургер на деревянной доске, расплавленный сыр чеддер стекает по котлете, капли конденсата на стакане с колой рядом, тёмный фон, профессиональное фуд-фото, жёсткий студийный свет, высокая контрастность, 8k разрешение».
Упоминание «капель конденсата» или «пара» добавляет живости.
Для рекламы косметики или духов подход будет иным. Тут важна чистота и элегантность. Попробуйте такой вариант:
«Флакон духов из прозрачного стекла с золотой крышкой, стоит на зеркальной поверхности, вокруг лепестки розовых роз, мягкий рассеянный свет, рекламная фотография, минимализм, чистота, высокое разрешение, макросъёмка».
Слова «минимализм» и «чистота» помогут избежать визуального мусора, который нейросети любят добавлять от себя.
Уличная фотография и архитектура
Передать атмосферу города довольно сложно, но возможно. Главное — поймать момент и детали. Для стрит-фото отлично подходят запросы, описывающие случайные сцены. Например:
«Чёрно-белая фотография, пожилой мужчина играет на саксофоне на оживлённой улице Нью-Йорка, вокруг спешащие прохожие, эффект размытия в движении, дождливая погода, отражения в лужах, высокая контрастность, стиль Анри Картье-Брессона».
Упоминание имени известного фотографа — это мощный приём. Нейросеть считает стиль мастера и попытается его сымитировать.
А если ваша цель — архитектура, то здесь важна геометрия и масштаб. Пример промта для современного здания:
«Футуристический небоскрёб из стекла и бетона, изогнутые линии, зелёные сады на террасах, яркий солнечный день, голубое безоблачное небо, вид снизу вверх, широкоугольный объектив, архитектурная визуализация, гиперреализм».
Фраза «вид снизу вверх» задаёт ракурс, который делает здание величественным и внушительным.
Стилизация и художественные приёмы
Иногда фотореализм — это не совсем то, что нужно. Хочется чего-то необычного, сказочного или стилизованного. Нейросети — настоящий кладезь стилей. Вы можете превратить обычное фото в кадр из киберпанк-фильма, просто добавив нужные маркеры. Пример для киберпанка:
«Девушка-киборг с неоновыми имплантами на лице, стоит под дождём в ночном городе будущего, яркие неоновые вывески с иероглифами, фиолетовое и голубое освещение, мокрый асфальт, кинематографичный кадр, стиль Бегущий по лезвию».
А для любителей ретро отлично подойдёт стиль 80-х или 90-х. Промт может звучать так:
«Групповой портрет подростков в джинсовых куртках, стиль 90-х годов, интерьер игровой комнаты с аркадными автоматами, вспышка в лоб, эффект полароида, винтажные цвета, лёгкая зернистость, несовершенства плёнки».
Именно фраза «вспышка в лоб» (direct flash) даёт тот самый эффект любительской фотографии из прошлого.
Ошибки, которых стоит избегать
Даже с хорошим промтом можно получить плохой результат, если допустить ряд типичных ошибок. Во-первых, не стоит перегружать запрос противоречивыми командами. Если вы пишете «минимализм» и тут же добавляете «множество деталей», нейросеть сойдёт с ума и выдаст кашу. Во-вторых, избегайте слишком длинных и сложных предложений с деепричастными оборотами. Машина лучше понимает короткие фразы, разделённые запятыми. В-третьих, не забывайте про негативные промты (Negative Prompt). Это поле, куда нужно вписывать то, чего вы НЕ хотите видеть. Обычно туда пишут: «уродливые руки, лишние пальцы, размытость, текст, водяные знаки, искажённые лица». Это своеобразный фильтр, отсекающий брак. Тем более, что многие современные интерфейсы нейросетей позволяют сохранять шаблоны негативных промтов, чтобы не вводить их каждый раз заново.
Нюансы русского языка в промтинге
Большинство топовых нейросетей (Midjourney, Stable Diffusion) обучались на английском языке. Понимают ли они русский? Некоторые — да, но с нюансами. Отечественные разработки вроде Kandinsky или Шедеврум прекрасно работают с «великим и могучим». Однако при работе с зарубежными моделями стоит учитывать, что прямой перевод не всегда корректен. Например, слово «лук» машина может понять и как овощ, и как оружие (bow/onion). Поэтому уточнения в скобках или контекст просто необходимы. Если вы пишете промты на русском для англоязычной сети (через встроенный переводчик), старайтесь использовать простые и однозначные слова. Вместо витиеватого «девушка с бездонными очами» лучше написать «девушка с глубокими синими глазами». Это снизит риск недопонимания.
Полезные модификаторы
Существует ряд слов-усилителей, которые буквально творят чудеса с качеством картинки. Их стоит добавлять в конце почти любого промта. К таким словам относятся: «высокая детализация», «4k», «8k», «мастерпис» (шедевр), «тренды ArtStation», «профессиональное фото», «резкий фокус». Эти теги служат для алгоритма сигналом качества. Они подтягивают текстуры, делают освещение более проработанным, а композицию — завершённой. Однако не стоит перебарщивать. Если напихать в промт пятьдесят таких слов, их вес размоется, и эффекта не будет. Лучше выбрать 3-5 самых подходящих под вашу задачу.
Также полезно использовать референсы к материалам. Если вы генерируете одежду или интерьер, указывайте: «шёлк», «бархат», «массив дуба», «мрамор». Нейросеть отлично знает, как свет падает на разные поверхности, и это добавит реализма. Ведь именно в мелочах кроется дьявол.
Практика и эксперименты
На самом деле, идеального промта не существует. То, что сработало сегодня, завтра может выдать иной результат из-за обновления модели или случайного зерна генерации (seed). Промтинг — это процесс постоянного перебора и настройки. Не бойтесь менять местами слова. Те слова, что стоят в начале запроса, имеют для нейросети больший вес. Если вам кажется, что цвет платья недостаточно красный, перенесите описание платья в самое начало строки. Это довольно просто, но эффективно.
Экспериментируйте с неожиданными сочетаниями. Попробуйте смешать стили: «Портрет Ленина в стиле киберпанк» или «Звёздные войны в стиле советских мультфильмов». Иногда именно абсурдные запросы рождают самые оригинальные и вирусные изображения. Да и самим нейросетям, кажется, нравится решать нестандартные задачи.
Погружаясь в мир генерации изображений, помните, что вы — режиссёр, а нейросеть — лишь оператор и художник-постановщик. У неё нет вкуса и чувства прекрасного, но есть огромная база знаний и технические возможности. Ваша задача — направить эту мощь в нужное русло. Используйте полученные знания, комбинируйте приёмы, играйте со светом и камерами. И пусть каждый ваш запрос превращается в маленький шедевр, который будет радовать глаз и собирать лайки. Творческих успехов в генерациях!