Ни один творческий процесс сегодня не обходится без участия нейросетей, однако страх чистого листа по-прежнему парализует даже опытных креаторов. Кажется, что идея вертится на языке, но сформулировать её так, чтобы бездушная машина выдала шедевр, — задача не из лёгких. Ведь между человеческим воображением и алгоритмами генерации изображений (будь то Midjourney, Stable Diffusion или DALL-E) лежит пропасть недопонимания. Устав от бесконечных попыток подобрать нужные слова и получая вместо фотореалистичного портрета пластиковые лица, многие бросают затею. Но спасательный круг существует, и имя ему — всё тот же искусственный интеллект, только текстовый. А начать стоит с правильной настройки вашего диалога с чат-ботом, который выступит идеальным переводчиком с человеческого на машинный.
Стоит ли использовать посредника?
Казалось бы, зачем усложнять цепочку, добавляя в неё ещё одно звено? Скептики могут возразить, что проще написать запрос самостоятельно. Однако здесь кроется нюанс. Дело в том, что ChatGPT владеет базой знаний о фотографии, которая обычному обывателю и не снилась. Он знает, как свет падает при диафрагме f/1.8, чем плёнка Kodak Portra 400 отличается от Fujifilm и какой эффект даёт тилт-шифт объектив. Перекладывая техническую часть описания на плечи текстовой нейросети, вы освобождаете голову для чистого творчества. К тому же, бот умеет структурировать «кашу» из мыслей в чёткую последовательность токенов, которую графические нейросети понимают лучше всего. Это экономит время. И нервы.
Анатомия правильного запроса к ChatGPT
Чтобы получить добротный результат, нельзя просто сказать боту: «Придумай картинку». Нужно задать ему роль. Один из самых эффективных методов — превратить чат в профессионального промпт-инженера. Начать диалог следует с установки контекста, где вы объясняете, что от него требуется генерация подробных описаний на английском языке (так как большинство генераторов работают именно с ним) с указанием технических параметров. Львиная доля успеха зависит от того, насколько точно вы опишете атмосферу. Попросите бота действовать как фотограф с тридцатилетним стажем, который одержим детализацией и светом. Пусть он использует профессиональный сленг.
Далее следует обозначить структуру ответа. Попросите его разбивать промт на логические блоки: объект, окружение, освещение, стиль, параметры камеры. К слову, довольно часто помогает просьба давать не один, а сразу пять вариантов одного и того же сюжета, но в разных стилях — от киберпанка до ретро-эстетики 50-х годов. Такой подход позволяет натыкаться на неожиданные визуальные решения, о которых вы даже не грезили.
Портретная съёмка
Самый востребованный жанр — это, безусловно, люди. Но просто написать «красивая девушка» — значит получить усреднённый, скучный результат. Здесь ChatGPT может сотворить настоящие чудеса, если вы попросите его добавить «изюминку». Попробуйте скормить ему такой запрос: «Напиши промт для генерации фотореалистичного портрета пожилого рыбака, в глазах которого читается мудрость и усталость, стиль National Geographic». Бот, скорее всего, выдаст конструкцию, насыщенную деталями о морщинах, текстуре кожи и жёстком солнечном свете.
Вот пример того, как может выглядеть готовый ответ бота, адаптированный под генераторы:
Hyper-realistic portrait of an old weather-beaten fisherman, deep wrinkles, piercing blue eyes looking at the horizon, wearing a yellow raincoat, stormy sea background, dramatic lighting, shot on Sony A7R IV, 85mm lens, f/1.8, sharp focus, cinematic texture, 8k.
Обратите внимание на технические детали. Диафрагма 1.8 обеспечивает то самое размытие фона (боке), которое так ценится в портретах. А упоминание конкретной камеры добавляет изображению цифровой резкости.
Если же хочется чего-то более студийного, стоит попросить ChatGPT сгенерировать описание фэшн-съёмки. Тут в ход пойдут уже другие термины. Промт может звучать так:
High fashion photography, female model with avant-garde makeup, geometrical pose, neon studio lighting, cyberpunk vibe, futuristic clothing made of transparent plastic, shot on Hasselblad, detailed skin texture, volumetric light.
Бот здесь солирует, подбирая правильные слова вроде «volumetric light» (объёмный свет), что кардинально меняет восприятие картинки.
Пейзажи и архитектура
С природой дело обстоит сложнее. Грандиозный вид легко испортить плохой композицией. Здесь на помощь приходит знание художественных стилей и времени суток. Золотой час, сумерки, рассветный туман — всё это инструменты, которыми ChatGPT жонглирует виртуозно. Попросите его описать «заброшенный маяк на скале во время шторма, как если бы это снимал оператор фильма ужасов». Результат вас впечатлит.
Готовый вариант промта для такой сцены может выглядеть внушительно:
Cinematic shot of an abandoned lighthouse on a jagged cliff, crashing waves, dark stormy clouds, lightning bolt in the distance, ominous atmosphere, cold color palette, wide angle lens 24mm, long exposure effect on water, 4k resolution, Unreal Engine 5 render style.
Нюанс с «длинной выдержкой» (long exposure) здесь ключевой — нейросеть поймёт, что воду нужно размыть, превратив её в туманную субстанцию.
Для городской архитектуры отлично подходят запросы, имитирующие плёночную фотографию. Винтаж сейчас в моде. Попросите бота создать описание улочки Парижа, но так, будто снимок сделан в 1980 году. Промт будет примерно таким:
Street photography of rainy Paris, vintage cars, reflection in puddles, people with umbrellas, shot on Kodak Portra 400, grain effect, warm retro tones, candid moment, soft focus, 35mm lens.
Зернистость и мягкий фокус — это те самые элементы, которые убивают «цифровой пластик» и делают кадр живым.
Макросъёмка и детали
Иногда нужно показать не весь объект, а лишь его часть. Текстуру ткани, каплю росы или радужку глаза. Это довольно сложная задача для генераторов, так как они любят додумывать лишнее. Но если правильно настроить ChatGPT, он создаст инструкцию, которая заставит нейросеть сфокусироваться. Главное — указать масштаб.
Пример запроса для бота: «Создай промт для экстремального макроснимка глаза рептилии». На выходе вы получите нечто подобное:
Extreme macro shot of a chameleon eye, detailed scales texture, vibrant colors changing from green to purple, sharp focus on the iris, depth of field, natural lighting, biological documentary style, 100mm macro lens.
Объектив 100mm здесь указан не случайно — это классика макросъёмки, и нейросети знают, как это должно выглядеть оптически.
Технические параметры: шпаргалка для запроса
Разумеется, чтобы ChatGPT выдавал такие результаты, ему нужно дать «словарь». Можно прямо в первом сообщении загрузить в него список терминов, которые вы хотите видеть в промтах. Попросите его использовать названия конкретных камер: Canon EOS R5 для резкости, Leica M10 для уличной эстетики или Polaroid для ретро-эффекта. Также стоит упомянуть типы освещения: Cinematic lighting (кинематографичный свет), Natural light (естественный), Studio softbox (мягкий студийный).
Не стоит забывать и про соотношение сторон. Хотя это обычно настраивается параметрами самого генератора (например, --ar 16:9 в Midjourney), упоминание формата «wide cinematic shot» в тексте промта помогает нейросети правильнее выстроить композицию кадра внутри этого формата. Тем более, что бот может сам подсказать, какой формат лучше подходит под конкретный сюжет. Ведь вертикальный кадр лучше передаёт величие небоскрёбов, а горизонтальный — бескрайность полей.
Вредно ли использовать имена художников?
Вопрос этики и авторского права остаётся открытым, но с технической точки зрения стилизация «под кого-то» работает безотказно. Многие считают, что это плагиат, но на самом деле это обучение на стилях. Если вы хотите получить картинку в стиле «Бегущего по лезвию», достаточно упомянуть «Blade Runner style» или имя оператора Роджера Дикинса. ChatGPT отлично знает визуальный почерк знаменитых творцов.
Попробуйте такой заход: «Опиши футуристический город в стиле Сида Мида». Бот выдаст кладезь визуальных маркеров:
Neon signs, flying cars, brutalist architecture, massive scale, fog, industrial smoke, cyan and magenta lighting.
Имя художника здесь служит якорем, который удерживает нейросеть в рамках определённой палитры и геометрии. Это мощный инструмент, и отказываться от него глупо, если цель — качественный результат.
Как избежать ошибок?
Однако даже у такого мощного тандема есть свои подводные камни. Главная ошибка — перегруженность. Если попросить ChatGPT включить в описание «всё лучшее сразу», генератор запутается. Слишком длинный промт часто работает хуже, чем короткий и ёмкий. Нельзя не упомянуть и проблему противоречий. Если в одном предложении вы требуете «солнечный день» и «нуарную атмосферу», нейросеть выдаст галлюцинацию.
Поэтому, получая ответ от чата, всегда пробегайтесь по нему глазами. Уберите лишние эпитеты. Оставьте суть. Бот тяготеет к красивым литературным оборотам, которые для машины-генератора — просто белый шум. Фразы вроде «картина, которая заставляет задуматься о вечном» лучше безжалостно удалять. Оставляйте только визуал: цвет, свет, форма, текстура.
Абстракция и сюрреализм
Отдельно стоит упомянуть работу с чем-то несуществующим. Грезят сюрреализмом многие, но получить качественного «Дали» непросто. Здесь нужно просить ChatGPT использовать метафоры, но переводить их в визуальные образы. Запрос может звучать так: «Опиши концепцию утекающего времени, используя плавящиеся часы и пустынный ландшафт».
Готовый промт:
Surreal composition of melting clocks draped over dead trees, barren desert landscape, dreamlike atmosphere, distorted perspective, Salvador Dali style, oil painting texture, vivid colors, long shadows, mysterious mood.
Слово «texture» (текстура) здесь играет решающую роль, превращая фотореализм в имитацию живописи. А ведь именно этого мы и добиваемся в данном жанре.
Еда и предметная съёмка
Фуд-фотография — это отдельный вид искусства, где важно вызвать аппетит. Обыватель напишет «вкусный бургер». Профи через ChatGPT сделает иначе. Попросите описать «сочный бургер с глянцевой булочкой, стекающим сыром и капельками конденсата на стакане колы рядом». Антураж имеет значение.
Пример промта, который заставит потечь слюнки:
Commercial food photography of a gourmet gourmet burger, shiny brioche bun, melting cheddar cheese, steam rising, fresh lettuce, water droplets on the ingredients, dark rustic wooden background, dramatic side lighting, 8k, highly detailed, delicious masterpiece.
Тут каждое слово работает на вкусовые рецепторы. «Steam rising» (поднимающийся пар) добавляет динамики и свежести. Это серьёзное вложение токенов в итоговое качество картинки.
Стилизация под материалы
Интересный приём — имитация материалов. Можно попросить сделать всё изображение так, будто оно вырезано из бумаги, связано из шерсти или сделано из дыма. ChatGPT знает свойства этих материалов. Запрос: «Сделай промт для портрета кота, сделанного из клубов разноцветного дыма».
Результат:
Portrait of a cat made entirely of swirling colorful smoke, translucent form, ethereal look, glowing eyes, black background, pink and blue gradients, mystical atmosphere, abstract art, volumetric rendering, 8k.
Слово «translucent» (полупрозрачный) подскажет генератору, как работать со слоями. Выглядит впечатляюще.
Заключительные настройки
Напоследок, не забывайте про «Negative Prompts» — то, чего на картинке быть не должно. ChatGPT может сгенерировать и этот список. Обычно туда вписывают: blurry, low quality, ugly, deformed hands, extra fingers, watermark, text. Это своего рода фильтр, отсекающий брак. Попросите бота всегда добавлять этот блок в конце ответа. Это надёжно. Потому что проверено. Временем.
Экспериментируйте с ролями, меняйте стили, смешивайте несовместимое. И пусть каждый ваш запрос станет отличным решением для творческих задач.