Социальные сети сегодня буквально переполнены изображениями, и порой отличить реальный снимок от сгенерированного становится задачей практически невыполнимой. Казалось бы, что может быть проще, чем попросить нейросеть нарисовать автопортрет? Однако на практике пользователь довольно часто сталкивается с пластиковыми лицами, пустыми взглядами или пугающим количеством пальцев, которое вовсе не соответствует анатомическому атласу. Разочарование от потраченных кредитов и времени — чувство, знакомое многим энтузиастам цифрового искусства. Ведь искусственный интеллект — это не телепат, а исполнительный, но весьма специфический художник, требующий чётких инструкций. А начать стоит с понимания того, как именно машина “видит” ваш запрос и какие слова становятся ключом к созданию настоящего шедевра.
Что такое промт и как он работает?
Сложно ли составить правильный запрос? На первый взгляд — нет, но здесь кроется масса нюансов. Промт — это текстовое описание, которое служит руководством к действию для генеративной модели. Представьте, что вы объясняете слепому художнику, что именно хотите увидеть на холсте, но делать это нужно на его языке. Обыватель часто пишет просто «красивая девушка делает селфи», а затем удивляется посредственному результату. Искусственный интеллект нуждается в конкретике, деталях и правильных акцентах.
Львиная доля успеха зависит от последовательности слов. В начале предложения стоит размещать самый важный объект, так как нейросеть уделяет первым словам максимальное внимание. Если вы напишете «селфи на фоне взрыва», взрыв может оказаться важнее лица. Поэтому логика построения фразы должна быть следующей: сначала — кто (объект), затем — что делает (действие/поза), далее — где (окружение), и уже в конце — как это снято (стиль, освещение, камера). Такой подход позволяет разложить задачу по полочкам и избежать смысловой каши.
Освещение: Ключ к реализму
Светом в фотографии, пусть и сгенерированной, пренебрегать не стоит. Именно освещение превращает плоскую картинку в объёмное, живое изображение. Нейросети отлично понимают термины из мира профессиональной фотографии. Самый простой и беспроигрышный вариант — это «natural lighting» (естественное освещение). Он дает мягкие тени и приятный тон кожи. Но если хочется драмы, в игру вступают более сложные схемы.
Особый интерес вызывает «cinematic lighting» (кинематографическое освещение). Оно добавляет кадру глубину и часто используется для создания атмосферных, немного загадочных портретов. А вот для имитации студийной съёмки отлично подойдёт «studio lighting» или «rembrandt lighting» (свет Рембрандта), который создает характерный треугольник света на щеке. Любители же ночной эстетики и киберпанка довольно часто используют «neon lighting» (неоновый свет) или «bioluminescent» (биолюминесцентный), чтобы добавить кадру футуристичности. Главное — не смешивать противоположные типы света в одном запросе, иначе результат будет непредсказуемым.
Технические параметры камеры
Обязательно ли разбираться в фототехнике? Вовсе нет. Но знание пары терминов творит чудеса. Искусственный интеллект обучен на миллионах фотографий, и он прекрасно знает, как выглядит снимок, сделанный на конкретный объектив. Чтобы избавиться от эффекта компьютерной графики, стоит добавить в промт название камеры или плёнки. Например, «shot on 35mm» (снято на 35мм) добавит лёгкое искажение и естественность, свойственную плёночным фотоаппаратам.
А вот для максимальной детализации кожи и текстур спасательным кругом станет фраза «shot on Sony A7R IV» или «8k resolution». Это сигнал для нейросети проработать каждую пору и волосок. Хотите размытый фон? Используйте «bokeh» или «depth of field» (глубина резкости). Это сразу выделит лицо и уведёт задний план в мягкий расфокус. Кстати, упоминание конкретной фотоплёнки, такой как «Kodak Portra 400», придаст снимку тот самый тёплый, ламповый оттенок, по которому многие так грезят.
Примеры готовых промтов: Фотореализм
Создание реалистичного портрета — задача не из лёгких. Здесь важно соблюсти баланс и не перегрузить запрос лишними эпитетами. Рассмотрим вариант для создания естественного женского образа. Основа запроса может выглядеть так:
hyper-realistic selfie of a 25-year-old Scandinavian woman, platinum blonde messy bun, natural skin texture, freckles, wearing a beige knitted sweater, sitting in a cozy coffee shop, soft morning sunlight through window, shot on iPhone 15 Pro, –ar 9:16
Разберем этот пример. Мы указали возраст и типаж (скандинавский), добавили детали внешности (веснушки, небрежный пучок), одели модель (свитер) и поместили в контекст (кофейня). Уточнение про утренний свет через окно задаёт настроение, а упоминание iPhone 15 Pro намекает на характерную для смартфонов постобработку. Параметр –ar 9:16 в конце задаёт вертикальный формат, идеальный для сторис.
Для мужского портрета можно использовать иной подход. Брутальный и детальный запрос будет звучать следующим образом:
closeup selfie of a bearded man with blue eyes, rough skin texture, wearing a leather jacket, standing on a rainy street at night, neon city lights reflecting in background, bokeh, cinematic lighting, raw photo style, –v 6.0
Здесь мы делаем упор на текстуру кожи («rough skin texture») и атмосферу ночного города, что придаёт снимку характер и глубину.
Стилизация и художественные эксперименты
Реализм — это прекрасно, но иногда хочется чего-то необычного. Нейросети позволяют примерить на себя образы, невозможные в реальной жизни. Популярностью пользуется стилистика киберпанка. Промт для такого селфи может быть таким:
futuristic selfie of a cyborg girl, half face is mechanical with glowing circuits, pink and blue neon lighting, futuristic Tokyo background, cyberpunk aesthetic, detailed wires, digital art, sharp focus
Результат получится ярким, с высокой контрастностью и обилием мелких деталей. Другой интересный вариант — стилизация под живопись или рисунок. Если вы хотите увидеть себя героем аниме, попробуйте следующий шаблон:
anime style selfie of a cute boy with spiky silver hair, wearing school uniform, cherry blossoms falling in background, vibrant colors, Studio Ghibli art style, high detail
Упоминание конкретной студии (Studio Ghibli) задаёт определённую цветовую палитру и настроение, делая картинку узнаваемой и душевной.
А для любителей ретро и винтажа подойдёт такой вариант:
vintage polaroid selfie from the 90s, group of friends laughing at a beach party, flash photography, overexposed, grainy texture, film burn, authentic retro look
Слова «flash photography» (съёмка со вспышкой) и «grainy texture» (зернистость) здесь играют ключевую роль, имитируя несовершенство старых камер.
Подводные камни и ошибки
Чего делать категорически не стоит? Не перегружайте промт абстрактными понятиями вроде «beautiful», «amazing», «fantastic» в огромных количествах. Для нейросети эти слова значат довольно мало. Лучше описать, в чём именно заключается красота: «symmetrical face», «glowing skin», «expressive eyes». Также избегайте противоречивых требований. Нельзя одновременно просить «sunny day» (солнечный день) и «night sky» (ночное небо) — машина выдаст галлюцинацию или артефакты.
Ещё один нюанс касается количества конечностей и пальцев. Это, пожалуй, самая известная проблема генераций. Чтобы минимизировать риск появления третьей руки, старайтесь не просить сложные позы, где руки находятся возле лица, если это не крупный план. А если руки всё же нужны, используйте негативный промт (negative prompt), вписывая туда слова: «bad anatomy», «extra fingers», «missing limbs», «deformed hands». Это не панацея, но значительно повышает шансы на успех.
Как управлять эмоциями?
Лицо без эмоций выглядит манекеном. Чтобы вдохнуть жизнь в персонажа, нужно конкретизировать мимику. Простого слова «smile» часто бывает недостаточно — оно может выдать жутковатый оскал. Попробуйте уточнить: «subtle smirk» (лёгкая ухмылка), «laughing out loud» (громкий смех) или «thoughtful expression» (задумчивое выражение). Глаза — зеркало души, и в промте им стоит уделить внимание. Фразы вроде «looking directly at camera» (смотрит прямо в камеру) или «sparkle in eyes» (блеск в глазах) создают тот самый зрительный контакт, который цепляет зрителя.
Стилевые модификаторы
Существует целый пласт слов-модификаторов, которые меняют саму структуру изображения. Например, слово «minimalistic» очистит фон от лишнего мусора, оставив только суть. А вот «ornate» или «intricate» (замысловатый), наоборот, добавят массу мелких деталей, узоров и текстур, что отлично подходит для фэнтезийных образов.
Кстати, использование имён известных художников или фотографов тоже работает безотказно. Добавление «by Annie Leibovitz» придаст снимку журнальный лоск и драматизм. А приписка «in the style of Van Gogh» превратит селфи в вихрь экспрессивных мазков. Однако с этим нужно быть осторожнее: некоторые модели имеют ограничения на использование имён ныне живущих творцов из этических соображений.
Настройка соотношения сторон
Параметр соотношения сторон (aspect ratio) критически важен для композиции. По умолчанию многие нейросети выдают квадрат (1:1). Но для селфи это не всегда удачный выбор. Для портретов, которые планируется публиковать в ленте, лучше подходит формат 4:5 («–ar 4:5»), так как он занимает больше места на экране смартфона. А вот для кинематографичных кадров, имитирующих скриншот из фильма, идеальным решением станет 16:9 («–ar 16:9»). Это позволяет включить в кадр больше окружения и создать контекст.
Процесс доработки результата
Получить идеал с первой попытки удается редко. Это нормальный рабочий процесс. Махинации с весом слов (word weights) могут помочь скорректировать результат. В некоторых интерфейсах можно поставить двоеточие и цифру после слова, например «red hair::2», чтобы усилить влияние именно этого параметра. Или, наоборот, уменьшить влияние фона, если он перетягивает внимание.
Кроме того, существует функция Image-to-Image (img2img), когда вы загружаете своё реальное фото и просите нейросеть стилизовать его. Промт в этом случае должен описывать не только то, что вы хотите получить, но и то, что уже есть на снимке. Это позволяет сохранить черты лица, меняя лишь антураж и стилистику. Такой метод — настоящий кладезь возможностей для создания аватарок.
Важность экспериментов
Универсальной формулы, работающей на 100% во всех случаях, не существует. Модели обновляются, меняются алгоритмы их восприятия текста. То, что работало в пятой версии Midjourney, может выдавать странный результат в шестой. Поэтому добротный промт — это всегда результат проб и ошибок. Не бойтесь менять одно-два слова, переставлять их местами или добавлять неожиданные эпитеты. Иногда случайная опечатка или странное сочетание слов приводят к рождению уникального стиля.
Генерация изображений — это захватывающий процесс, в котором вы выступаете режиссёром. Инструментарий огромен, и освоить его может каждый. Главное — чётко формулировать свои желания и не бояться фантазировать. Пусть ваши цифровые автопортреты собирают тысячи лайков, а процесс их создания приносит исключительно удовольствие и творческий драйв.