Ни одна современная технология не вызывала столько споров и одновременного восторга, как генеративные нейросети, способные рисовать по текстовому описанию. Казалось бы, что может быть проще? Вводишь пару слов, нажимаешь кнопку — и шедевр готов. Однако на практике обыватель довольно часто сталкивается с суровой реальностью: вместо эпичного полотна на экране появляется нечто размытое, с лишними пальцами или вовсе не то, что задумывалось. Проблема здесь кроется не в отсутствии таланта у машины, а в неумении человека правильно сформулировать запрос. Ведь нейросеть — это джинн, который исполняет желания слишком буквально, не понимая контекста и намёков. Но чтобы не ошибиться и получить результат, от которого захватывает дух, нужно освоить особый язык — язык промтов.
С чего начинается создание запроса?
Многие ошибочно полагают, что краткость — сестра таланта и в общении с ИИ. На самом деле, нейросети любят подробности. Скупой запрос «кот в космосе» выдаст вам совершенно стандартную, скучную картинку. А вот если расписать детали, результат изменится кардинально. Структура идеального промта всегда строится по схеме: Объект + Действие + Окружение + Технические детали + Стиль. Сложно ли это запомнить? Вовсе нет, если представить, что вы описываете сцену слепому художнику. Важно указать не только «кто», но и «как» он выглядит, во что одет и какой свет падает на его лицо.
Фотореализм: Портреты
Если ваша цель — создать изображение, которое невозможно отличить от снимка, сделанного профессиональной камерой, придется углубиться в фотографическую терминологию. Простого слова photo здесь будет недостаточно. Нейросети обучались на миллионах снимков, и они прекрасно знают, чем отличается кадр с дешёвой «мыльницы» от работы мастера. Чтобы добавить коже текстуру, а взгляду — глубину, стоит использовать такие маркеры, как highly detailed skin, pore details или sharp focus. К слову, упоминание конкретной модели камеры или плёнки творит чудеса.
Попробуйте, например, такой вариант для создания мужского портрета. Введите запрос:
Close-up portrait of an elderly fisherman with a weathered face and a white beard, wearing a yellow raincoat, rainy weather, water droplets on face, intense gaze, cinematic lighting, shot on Sony A7R IV, 85mm lens, f/1.8, extremely detailed, photorealistic, 8k
Здесь каждый элемент играет свою роль. Объектив 85mm дает красивое размытие фона (боке), диафрагма f/1.8 фокусирует внимание на глазах, а упоминание камеры Sony A7R IV подсказывает алгоритму, что нужно выдать максимальную резкость и детализацию.
Женские портреты требуют иного подхода. Здесь мы часто тяготеем к мягкому свету и эстетике глянцевых журналов. Хороший результат даст следующая конструкция:
Portrait of a beautiful young woman with red curly hair, green eyes, freckles, soft morning light, window reflection, natural makeup, candid shot, Kodak Portra 400 film style, grainy texture, sentimental atmosphere
Плёнка Kodak Portra известна своей приятной передачей оттенков кожи, и нейросеть попытается сымитировать именно этот тёплый, ламповый эффект.
Освещение и атмосфера
Свет — это, пожалуй, самый важный инструмент в арсенале «нейрохудожника». Без правильного указания освещения картинка получится плоской и невыразительной. И тут перед нами открывается настоящий кладезь возможностей. Хотите драмы? Используйте volumetric lighting (объёмный свет) или god rays (лучи, пробивающиеся сквозь облака или листву). Нужно что-то загадочное? Подойдёт foggy atmosphere или bioluminescent light.
Для создания эпичной фэнтезийной сцены попробуйте ввести:
Epic warrior standing on a mountain peak, holding a glowing sword, stormy sky, lightning bolts, dark fantasy style, dramatic volumetric lighting, cinematic composition, gloom, intricate details, Unreal Engine 5 render
Упоминание игрового движка Unreal Engine 5 — это довольно популярный хак. Он сигнализирует системе, что нужно использовать 3D-эстетику с проработанными тенями и физически корректным светом.
А если душа просит уюта и тепла, сценарий меняется. Представьте себе интерьер кофейни. Промт будет выглядеть так:
Cozy coffee shop interior, rainy day outside the window, warm yellow lighting, steam rising from a cup of coffee on a wooden table, bokeh background, lo-fi aesthetic, peaceful atmosphere, hyperrealistic
Свет здесь солирует, создавая настроение покоя и умиротворения.
Стилизация под искусство
Иногда фотореализм — это не то, что нужно. Хочется чего-то более творческого, нарисованного. В этом случае стоит обратиться к именам великих художников или конкретным художественным направлениям. Но есть нюанс: смешивание несочетаемых стилей может привести к визуальной каше. Лучше выбрать одно направление и усилить его подходящими прилагательными.
Любителям киберпанка и научной фантастики подойдет следующий набор:
Futuristic cyberpunk city street at night, neon signs in Japanese, flying cars, rain reflecting neon lights, cyborg girl walking, bright vibrant colors, synthwave style, highly detailed digital art, trending on ArtStation
Фраза trending on ArtStation работает как знак качества, заставляя ИИ подтягивать стилистику лучших работ с этой платформы.
Для тех же, кто грезит классической живописью, рецепт будет иным. Попробуйте сымитировать масло:
Oil painting of a majestic sailing ship in a storm, giant waves, dark heavy clouds, dramatic seascape, style of Ivan Aivazovsky and William Turner, thick brushstrokes, textured canvas, masterpiece
Упоминание Айвазовского и Тернера задаст верный вектор — буйство стихии и сложную работу со светом и цветом воды.
Технические параметры
Нельзя не упомянуть и о сугубо технических аспектах, которые часто упускают новички. Речь идет о соотношении сторон и версии алгоритма (если вы используете Midjourney или Stable Diffusion). Обычно эти параметры дописываются в самом конце через дефис. Например, –ar 16:9 сделает картинку широкоформатной, кинематографичной. А –ar 9:16 идеально подойдет для сторис в социальных сетях. Игнорирование этого момента часто приводит к тому, что композиция кадра обрезается самым неудачным образом.
Впрочем, существуют и специфические модификаторы качества. Такие слова, как octane render, ray tracing или 8k resolution, не увеличивают реальное разрешение файла (оно ограничено настройками генератора), но существенно влияют на проработку мелких деталей. Текстуры становятся чётче, отражения — реалистичнее. Это довольно простое действие, но оно значительно повышает визуальную ценность результата.
Отрицательные промты
Бывает так, что нейросеть настойчиво добавляет в кадр то, чего там быть не должно. Лишние люди, странные подписи, размытость. В Stable Diffusion для этого есть специальное поле Negative Prompt, а в Midjourney используется параметр –no. Это своего рода спасательный круг для вашего изображения.
Что стоит исключать? В первую очередь — дефекты анатомии. Стандартный набор для «чистки» картинки выглядит так:
ugly, deformed, disfigured, extra fingers, bad anatomy, missing limbs, blur, watermark, text, signature, low quality, pixelated
Добавление этого блока в запрос практически гарантированно избавляет от монструозных мутаций и делает изображение чистым, пригодным для использования. Ведь никому не хочется тратить время на фотошоп, убирая третью ногу у модели.
Архитектура и дизайн
Отдельная и весьма популярная сфера применения ИИ — генерация идей для интерьера или экстерьера зданий. Дизайнеры и архитекторы довольно часто используют нейросети для создания мудбордов. Здесь важна точность в описании материалов и стилей. Абстрактные понятия вроде «красивый дом» не сработают. Нужно чётко указать: бетон, стекло, дерево, минимализм или барокко.
Вот пример рабочего промта для современного загородного дома:
Modern minimalist villa in the forest, floor-to-ceiling glass windows, concrete and wood facade, warm interior lighting, twilight, architectural photography, wide angle shot, photorealistic, architectural digest style
Ссылка на журнал Architectural Digest — это отличный маркер, который задает высокий стандарт композиции и освещения, характерный для профессиональной интерьерной съемки.
А если нужно придумать дизайн гостиной? Попробуйте:
Luxury living room interior, scandinavian style, beige and white color palette, cozy fireplace, panoramic window with mountain view, expensive furniture, soft natural light, highly detailed, interior design render
Результат порадует глаз гармонией цветов и правильно расставленными акцентами.
Предметная съёмка и еда
Маркетологи и владельцы интернет-магазинов тоже не остаются в стороне. Сгенерировать аппетитное фото бургера или стильный флакон духов гораздо быстрее и дешевле, чем организовывать реальную фотосессию. Тем более, что ИИ не требует гонораров и не съедает реквизит. Главное здесь — передать текстуру и «вкус» изображения.
Для фуд-фотографии используйте макро-съёмку и слова, вызывающие аппетит. Например:
Delicious juicy double cheeseburger with melting cheese and bacon, fresh lettuce, sesame bun, steam rising, professional food photography, macro shot, studio lighting, black background, commercial look, 4k
Чёрный фон часто используется для контраста, чтобы подчеркнуть яркость ингредиентов. А упоминание commercial look делает картинку глянцевой, готовой для рекламы.
С косметикой или техникой ситуация похожая. Здесь важна чистота линий и блики. Пример для парфюма:
Elegant perfume bottle made of blue glass with gold cap, standing on a mirror surface, surrounded by white flowers and water splashes, soft pastel background, product photography, studio light, sharp focus, luxury aesthetic
Такое описание позволит получить изображение, которое не стыдно поставить на баннер.
Как избежать ошибок?
Казалось бы, чем больше слов, тем лучше. Но это палка о двух концах. Не стоит перегружать промт противоречивыми командами. Если вы напишете «sunny day» и тут же добавите «night atmosphere», нейросеть сойдет с ума и выдаст нечто сюрреалистичное. Также лучше отказаться от слишком длинных предложений с сложной грамматикой. ИИ лучше понимает набор тегов и коротких фраз, разделенных запятыми, чем литературное описание в стиле Льва Толстого.
Ещё один подводный камень — вес слов. В начале промта слова имеют больший вес для алгоритма, чем в конце. Поэтому самое важное (объект съемки) всегда ставьте вперед. Если вы начнете с описания фона, то рискуете получить отлично прорисованный лес, в котором где-то на задворках потерялся главный герой. Расставляйте приоритеты грамотно.
И всё же, универсального рецепта не существует. Нейросети постоянно обновляются, и то, что работало вчера, сегодня может давать иной результат. Однако базовые принципы — структура, свет, стиль и технические параметры — остаются неизменными. Это фундамент, на котором строится любое цифровое искусство. Экспериментируйте, меняйте слова местами, добавляйте неожиданные эпитеты. Ведь именно в процессе перебора вариантов часто рождаются настоящие шедевры. Удачи в творческих поисках, и пусть ваши промты всегда попадают точно в цель!