Создание визуального контента с помощью нейросетей перестало быть забавой для гиков и превратилось в полноценный рабочий инструмент. Сотни, если не тысячи людей ежедневно пытаются получить от искусственного интеллекта тот самый «шедевр», который рисует их воображение, но натыкаются на пластиковые лица или анатомические странности. Почему так происходит? Дело чаще всего не в глупости машины, а в неумении человека правильно сформулировать задачу. Ведь ChatGPT, использующий движок DALL-E 3, понимает нас довольно хорошо, но требует особой лексики. Процесс этот не сложный, но кропотливый, и чтобы результат не разочаровал, стоит разобраться в самой механике запроса. А начать стоит с понимания того, как именно «мыслит» этот цифровой художник.
Сложно ли договориться с нейросетью?
Многие считают, что для генерации качественного изображения нужно знать сложный код или технические параметры. На самом деле всё обстоит несколько иначе. ChatGPT отличается от того же Midjourney тем, что он понимает естественный язык, диалог. Ему не нужны сухие перечисления тегов через запятую, хотя и они могут сработать. Ему нужен контекст. Львиная доля успеха зависит от того, насколько красочно и точно вы опишете сцену.
Впрочем, пускать всё на самотёк тоже не стоит. Если написать просто «красивая девушка», нейросеть выдаст усреднённый, скучный и довольно шаблонный результат. А вот если добавить деталей, указать освещение и настроение, картинка оживет. Главное — избегать двусмысленности.
Анатомия идеального запроса
Из чего же состоит хороший промт? Скелет запроса всегда один. Сначала мы определяем объект. Кто или что находится в центре внимания? Далее следует действие или состояние. Что этот объект делает? Сидит, бежит, спит или левитирует? Ну и, наконец, окружение и стиль.
К примеру, довольно часто новички забывают про освещение. А ведь именно свет формирует объём и атмосферу. Попробуйте добавить фразы вроде «мягкий кинематографический свет» или «жёсткие тени», и результат изменится кардинально. Ещё один важный нюанс — это ракурс. Снизу, сверху, крупный план или панорама — всё это нужно прописывать.
К слову, ChatGPT отлично понимает фотографическую терминологию. Упоминание конкретной модели камеры или объектива (например, «снято на 35mm» или «эффект боке») творит чудеса. И всё же, не перегружайте запрос лишними словами, которые не несут визуальной информации.
Портретная съёмка: работа с деталями
Люди всегда были и остаются самым сложным объектом для генерации. Глаза, пальцы, текстура кожи — здесь всплывают ошибки чаще всего. Чтобы получить фотореалистичный портрет, нужно буквально разложить по полочкам каждую черту лица.
Хотите студийное качество? Тогда запрос должен звучать примерно так:
«Фотореалистичный портрет пожилого рыбака с глубокими морщинами, смотрящего вдаль. Снято крупным планом на объектив 85mm f/1.8. Естественное освещение, пасмурная погода, на фоне размытое штормовое море. Высокая детализация текстуры кожи, видны капли воды на бороде. Цветокоррекция в холодных тонах».
Заметьте, здесь нет абстракций. Только конкретика. Результат впечатляет.
А вот другой пример, если нужна женская эстетика для глянца:
«Модная студийная фотография молодой девушки с веснушками и рыжими кудрявыми волосами. Освещение в стиле Рембрандта, тёмный фон. Одета в изумрудное шёлковое платье. Взгляд направлен прямо в камеру. Чёткий фокус на глазах, мягкое боке на заднем плане. Стиль обложки Vogue».
Такой подход позволяет избежать эффекта «пластиковой куклы». Кожа будет иметь поры, а волосы — естественный беспорядок. Ведь идеальная симметрия в природе встречается довольно редко.
Предметная съёмка
Для владельцев интернет-магазинов или маркетологов ChatGPT может стать настоящим спасательным кругом. Снять товар в студии — это дорого и долго. Сгенерировать — дело пары минут. Это же правило касается и создания рекламных креативов.
Однако здесь есть свои подводные камни. Нейросеть не умеет генерировать реальный бренд или конкретный флакон духов с точностью до миллиметра (пока что). Но она может создать идеальную атмосферу.
Попробуйте такой вариант для рекламы косметики:
«Профессиональное рекламное фото стеклянного флакона с золотой жидкостью, стоящего на чёрном полированном камне посреди воды. Вокруг флакона легкий туман и брызги воды. Освещение контровое, подчеркивающее грани стекла. Высокое разрешение, макросъёмка, глубина резкости минимальная».
Или, например, для рекламы еды:
«Аппетитный бургер с сочной котлетой, стекающим сыром и свежими овощами на деревянной доске. Темный деревенский фон. Тёплый уютный свет, пар поднимается от мяса. Снято сверху под углом 45 градусов. Фуд-фотография высокого качества».
Такие изображения отлично подходят для постов в соцсетях или оформления меню. Бьёт по бюджету такая генерация? Вовсе нет. А выглядит внушительно.
Пейзажи и архитектура
Где фантазии есть разгуляться, так это в создании миров. Здесь можно смешивать несочетаемое. Архитекторы и дизайнеры часто используют нейросети для поиска вдохновения, ведь «галлюцинации» ИИ иногда подкидывают гениальные идеи.
Кладезь вдохновения — это смешение стилей. Попробуйте объединить футуризм и природу.
Вот пример промта для эпичного пейзажа:
«Футуристический город, встроенный в гигантские скалы, поросшие мхом и лианами. Стеклянные небоскрёбы органической формы светятся мягким неоновым светом. Закат, золотой час, небо окрашено в фиолетовые и оранжевые тона. Вид с высоты птичьего полёта. Кинематографичная композиция, высокая детализация».
А если хочется чего-то более приземленного, но атмосферного:
«Уютный деревянный домик в заснеженном лесу ночью. Свет горит в окнах, из трубы идёт дым. Вокруг высокие ели, покрытые снегом. Лунный свет создает длинные тени на сугробах. Ощущение тишины и уединения. Стиль рождественской открытки, фотореализм».
Здесь ключевую роль играют слова-маркеры настроения: «уютный», «тишина», «уединение». ChatGPT считывает эти эмоциональные коды и подстраивает цветовую гамму под них.
Как выбрать стиль?
Иногда фотореализм надоедает. Хочется чего-то рисованного, мультяшного или абстрактного. И тут ChatGPT проявляет себя во всей красе. Вы можете попросить его имитировать технику масла, акварели или даже 3D-рендера.
Для любителей киберпанка подойдет такой запрос:
«Уличная фотография в стиле киберпанк. Девушка-андроид с механической рукой стоит под дождем на неоновой улице Токио. Отражения вывесок в лужах. Цвета: голубой, маджента и чёрный. Зернистость плёнки, эффект хроматической аберрации. Атмосфера нуара».
А если нужно что-то нежное, в стиле иллюстрации:
«Милая иллюстрация акварелью. Маленький лисёнок спит, свернувшись клубком, на большой тыкве. Осенние листья кружатся вокруг. Пастельные мягкие тона, белый фон, эффект мокрой бумаги. Детская книжная иллюстрация».
Интересно, что при указании стиля «детская иллюстрация» нейросеть автоматически делает персонажей более округлыми и миловидными. Это удобный нюанс.
Чёрно-белое фото
Особый интерес вызывает монохромная фотография. Она требует работы со светом и тенью, так как цвет больше не отвлекает зрителя. Чтобы получить глубокое, драматичное изображение, нужно сделать акцент на контрасте.
Пример промта для чёрно-белого портрета:
«Драматичный чёрно-белый портрет мужчины в шляпе, курящего сигару. Стиль нуар 1940-х годов. Жёсткий свет падает через жалюзи, создавая полосы тени на лице. Высокий контраст, зернистость плёнки Kodak Tri-X 400. Дым от сигары красиво завивается в воздухе».
Упоминание конкретной плёнки (Kodak Tri-X) — это отличный хак. DALL-E знает характеристики популярных плёнок и пытается имитировать их зерно и тональность. Результат получается очень винтажным и стильным.
Вредно ли использовать готовые шаблоны?
Многие ищут в сети «волшебные таблетки» — готовые промты, которые достаточно просто скопировать. Стоит ли так делать? С одной стороны, это экономит время. С другой — вы лишаете себя уникальности. Лучший вариант — брать готовый шаблон и докручивать его под себя. Менять локацию, время суток, героев.
Кстати, ChatGPT обладает кратковременной памятью в рамках диалога. Если вам понравилась картинка, но хочется изменить одну деталь (например, цвет платья), не нужно переписывать весь промт заново. Достаточно написать: «Оставь всё как есть, только сделай платье красным». И он поймёт. Это невероятно удобно при доработке результата.
Чего стоит избегать?
Ошибки в промтинге — дело обычное. Самая распространенная — это отрицания. Фразы вроде «без очков» или «не красная машина» часто игнорируются или работают с точностью до наоборот. Нейросеть «слышит» слово «очки» и рисует их. Лучше формулировать запрос позитивно. Вместо «не тёмный» пишите «светлый», вместо «без людей» — «пустынный».
Ещё один момент — слишком длинные и запутанные предложения. Если вы напишете роман на три страницы, ИИ потеряет нить повествования. Важные детали «размажутся». Держите фокус на главном.
Ну и, наконец, избегайте противоречивых требований. Нельзя одновременно попросить «солнечный полдень» и «звёздное небо» (если только это не сюрреализм). Логика должна присутствовать.
Работа с камерой и настройками
Искушённый фотограф знает, что настройки камеры определяют характер снимка. ChatGPT тоже это знает. Вы можете управлять глубиной резкости, выдержкой и углом обзора.
Хотите заморозить движение? Добавьте в промт:
«Спортивная фотография бегуна на спринтерской дистанции. Момент отталкивания от колодок. Короткая выдержка 1/4000 секунды, все детали чёткие, мышцы напряжены. Размытый стадион на фоне. Динамика и энергия».
А если нужна макросъёмка насекомых:
«Экстремальное макро глаза стрекозы. Видна фасеточная структура глаза и мельчайшие капли росы. Яркие радужные цвета. Глубина резкости очень малая, фокус только на глазу. Естественный мягкий свет».
Такие технические уточнения превращают обычную картинку в профессиональный шот. Само собой, камера у нейросети виртуальная, но физику света она имитирует добротно.
Итеративный подход
Редко когда идеальный кадр получается с первой попытки. Это нормально. Работа с промтами — это всегда поиск. Сгенерировали — посмотрели — поправили.
Допустим, вы создаете интерьер.
Запрос 1: «Гостиная в скандинавском стиле». Результат может быть скучным.
Запрос 2: «Просторная гостиная в скандинавском стиле с большими окнами в пол. Солнечный свет заливает комнату. На полу светлый паркет, серый диван с вязаным пледом. Много зелёных растений в горшках. Уютная атмосфера гигге».
Уже лучше. Но можно добавить жизни.
Запрос 3: «…На диване спит рыжий кот. На журнальном столике стоит чашка горячего кофе и открытая книга».
Именно детали делают изображение «живым». Не бойтесь экспериментировать и добавлять элементы, которые рассказывают историю.
Сюрреализм и абстракция
Иногда стоит отойти от реальности и позволить нейросети творить безумие. Промты для сюрреализма обычно самые короткие, но ёмкие.
Попробуйте такое:
«Голова человека, сделанная из облаков, парящая над океаном на закате. Сюрреализм в стиле Рене Магритта. Мечтательная атмосфера».
Или:
«Шахматная доска, где фигуры — это маленькие живые города. Средневековые замки против футуристических небоскрёбов. Высокая детализация, макросъёмка».
Подобные изображения отлично подходят для обложек музыкальных альбомов или книг. Они приковывают внимание и заставляют разглядывать детали.
Практика — залог успеха
Можно бесконечно читать теории и копировать чужие запросы, но настоящее понимание приходит только с опытом. Пробуйте разные стили, смешивайте эпохи, играйте со светом. Искусственный интеллект — это лишь кисть в ваших руках, а художником остаётесь вы. Не бойтесь ошибаться, ведь каждая неудачная генерация приближает вас к пониманию логики машины. Пусть ваши промты будут смелыми, а результаты превосходят самые смелые ожидания. Удачи в творческих поисках!