Промты для chatgpt для изображения (с примерами готовых промтов)

Создание визуального шедевра всего за пару секунд с помощью обычного текста — не напоминает ли это сюжет из научно-фантастического романа прошлого века? Миллионы пользователей уже окунулись в этот дивный новый мир, где единственным ограничением становится собственная фантазия, а навык рисования руками уходит на второй план, уступая место умению формулировать мысли. Кажется, что достаточно просто написать «красивый закат», и нейросеть выдаст картину уровня Айвазовского, но на практике результат нередко разочаровывает, напоминая скорее детские каракули или сюрреалистичный кошмар. Дело вовсе не в том, что искусственный интеллект глуп или не умеет рисовать. Всё упирается в коммуникацию. Ведь нейросеть — это исполнительный, но невероятно буквальный художник, который не понимает намёков, если они не выражены правильными словами. И чтобы вместо цифрового мусора получать глянцевые обложки или концепт-арты, нужно овладеть искусством промт-инжиниринга.

Как это работает на самом деле?

Многие обыватели ошибочно полагают, что ChatGPT сам рисует картинки. На самом деле, под капотом чат-бота скрывается мощная модель DALL-E 3 (в платных версиях), которая и творит чудеса генерации. Уникальность этой связки заключается в том, что ChatGPT выступает в роли умного посредника. Вы пишете короткий и сбивчивый запрос, а он, словно заботливый переводчик, расширяет его, добавляет детали и скармливает художнику уже развёрнутое описание. Это, конечно, удобно. Однако здесь же кроются и подводные камни. Иногда бот настолько увлекается «улучшайзингом», что уходит от первоначальной идеи слишком далеко. Поэтому контроль над промтом всё-таки стоит держать в своих руках, чётко прописывая инструкции. Сложно ли это? Довольно просто, если понять логику машины.

Анатомия идеального запроса

С чего начинается построение качественного промта? Разумеется, с фундамента, которым служит главный объект. Без чёткого указания «кто» или «что» должно быть на изображении, нейросеть начнёт галлюцинировать. Но сухого названия предмета недостаточно. Тут в игру вступает контекст. Представьте разницу между «кот» и «пушистый рыжий кот в очках авиаторах, сидящий в кабине старого самолёта». Вторая формулировка сразу задаёт сцену. Далее следует описание среды или фона. Где происходит действие? В лесу, в космосе или в неоновом киберпанковом городе? Ну и, наконец, стиль. Это та самая «вишенка на торте», которая определяет, будет ли картинка похожа на фотографию, масляную живопись или 3D-рендер.

Фотореализм и работа с деталями

Если ваша цель — получить изображение, неотличимое от реального снимка, лексикон придётся подбирать скрупулёзно. Одной фразы «как фото» нейросети часто бывает мало. Ей нужны технические маркеры, которые ассоциируются у неё с высококлассной фотографией. К слову, отлично работают упоминания конкретных моделей камер или типов плёнки.

Попробуйте использовать следующую конструкцию для портрета. Введите запрос:

«A hyper-realistic portrait of an elderly fisherman with a weathered face and deep blue eyes, wearing a yellow raincoat, stormy ocean background, dramatic lighting, shot on 35mm lens, high detail, 8k resolution»

(Гиперреалистичный портрет пожилого рыбака с обветренным лицом и глубокими синими глазами, в жёлтом дождевике, фон штормового океана, драматичное освещение, снято на 35-миллиметровый объектив, высокая детализация, разрешение 8k).

Обратите внимание на уточнения в скобках (точнее, на технические параметры в конце английского текста). Слова «weathered face» (обветренное лицо) дают текстуру кожи, а «dramatic lighting» (драматичное освещение) создаёт объём. Без этих нюансов лицо могло бы получиться пластиковым и неестественным. А упоминание 35mm lens добавляет то самое размытие фона (боке), которое так ценится в портретной съёмке.

Сказочные миры и иллюстрация

Но что, если душа просит не суровой реальности, а чего-то волшебного? Здесь правила меняются. Стоит отказаться от технических терминов фотографов и обратиться к языку художников. В ход идут названия техник, материалов и даже имена известных живописцев (хотя DALL-E 3 иногда капризничает с копированием стилей живых художников из-за авторских прав, но направления он понимает отлично).

Вот пример добротного промта для создания уютной иллюстрации:

«Whimsical illustration of a tiny library inside a hollow oak tree, miniature books, warm glowing lanterns, cute forest animals reading, watercolor style, soft pastel colors, dreamy atmosphere, detailed texture»

(Причудливая иллюстрация крошечной библиотеки внутри полого дуба, миниатюрные книги, тёплые светящиеся фонари, милые лесные звери за чтением, акварельный стиль, мягкие пастельные тона, мечтательная атмосфера, детальная текстура).

Здесь ключевую роль играют прилагательные «whimsical» (причудливый) и «dreamy» (мечтательный). Они задают настроение. А словосочетание «watercolor style» (акварельный стиль) диктует технике исполнения имитацию водяных красок с характерными разводами. Полученное изображение наверняка вызовет умиление и подойдёт для детской книги.

Цифровое искусство и киберпанк

Тяготеет ли современный пользователь к футуризму? Безусловно. Стиль киберпанк или Sci-Fi остаётся одним из самых востребованных. Чтобы получить тот самый неоновый лоск и ощущение высоких технологий, нужно использовать специфический словарь.

Рассмотрим вариант промта для футуристического пейзажа:

«Futuristic cyberpunk city street at night, raining, neon signs with hieroglyphs, reflections in puddles, a cyborg girl with glowing mechanical arm walking away, cinematic composition, Unreal Engine 5 render, ray tracing, cyberpunk color palette»

(Футуристическая улица киберпанк-города ночью, дождь, неоновые вывески с иероглифами, отражения в лужах, девушка-киборг со светящейся механической рукой уходит вдаль, кинематографичная композиция, рендер Unreal Engine 5, трассировка лучей, киберпанк-палитра).

Упоминание «Unreal Engine 5» и «ray tracing» — это своего рода чит-код. Нейросеть обучена на миллионах изображений из игровых движков, поэтому эти слова заставляют её генерировать картинку с идеальным освещением и чёткостью, свойственной современной компьютерной графике. А детали про дождь и отражения добавляют сцене жизни и глубины.

Логотипы и векторная графика

ChatGPT способен стать неплохим помощником и для дизайнера. Создать логотип или иконку для сайта? Задача вполне выполнимая, если знать, как попросить. Главная ошибка здесь — перегруженность деталями. Логотип должен быть простым и читаемым.

Попробуйте такой запрос для минималистичного лого:

«Minimalist vector logo of a fox head, flat design, white background, simple geometric shapes, orange and black colors, professional sleek design»

(Минималистичный векторный логотип головы лисы, плоский дизайн, белый фон, простые геометрические фигуры, оранжевый и чёрный цвета, профессиональный гладкий дизайн).

Слова «vector» (вектор) и «flat design» (плоский дизайн) дают понять системе, что нам не нужны тени, градиенты и реализм. Мы хотим получить чистое изображение, которое легко перевести в кривые. Белый фон (white background) также критически важен, чтобы потом было проще вырезать объект в графическом редакторе.

Сложно ли управлять светом?

Свет — это, пожалуй, самый недооценённый инструмент в промт-инжиниринге. Именно он превращает скучную картинку в произведение искусства. Просто добавив описание источника освещения, можно кардинально изменить восприятие сцены.

Сравните два подхода. Первый — без уточнения света. Второй — с добавлением фразы «golden hour lighting» (освещение золотого часа). Во втором случае все объекты окрасятся в тёплые, мягкие тона заходящего солнца, тени станут длинными и бархатистыми.

Ещё один интересный приём — «volumetric lighting» (объёмное освещение). Это те самые красивые лучи света, пробивающиеся сквозь пыль, туман или листву. Добавьте это в промт