Промт для фото с животными (с примерами готовых промтов)

Создать реалистичное изображение животного с помощью нейросети — это, пожалуй, одна из самых увлекательных, но и коварных задач для современного цифрового художника. Ведь если пейзажи и абстракции искусственный интеллект «щёлкает» довольно просто, то анатомия живых существ, их мимика и, что самое сложное, текстура шерсти часто становятся камнем преткновения. Интернет переполнен картинками котов с пятью лапами или собак, чьи глаза смотрят в разные вселенные, что вызывает у зрителя лишь усмешку. Обыватель часто думает, что достаточно написать «красивый котик», и шедевр готов. Увы. Машина не понимает красоты в человеческом смысле, она понимает математику слов, веса токенов и стилистические привязки. Именно поэтому грамотно составленный запрос, или промт, становится тем самым мостиком, который отделяет цифровую мазню от произведения, способного обмануть даже опытный глаз фотографа. Но чтобы не ошибиться, нужно разобраться в лингвистических настройках генерации досконально.

Сложно ли работать с шерстью?

Казалось бы, что может быть проще? Но текстура меха — это настоящий кошмар для алгоритмов. Часто вместо мягкого подшёрстка мы получаем нечто, напоминающее пластилин или размытое мыло. Дело в том, что нейросети нужно прямое указание на детализацию. Простого слова «fur» (шерсть) здесь явно недостаточно. Стоит использовать двойные прилагательные и технические термины. Хорошо работают связки вроде «highly detailed fur» (высокодетализированная шерсть) или «intricate texture» (сложная текстура). А если ещё вспомнить про освещение, то результат может кардинально измениться. Свет должен играть на волосках. Поэтому в промт имеет смысл добавлять «rim light» (контровой свет) или «volumetric lighting» (объёмное освещение). Это оживляет картинку. Ведь именно свет превращает плоскую модель в живое существо.

Домашние питомцы: Коты и собаки

Начинать эксперименты логичнее всего с тех, кого мы видим каждый день. Кошки — это вообще отдельная каста в мире нейросетей. Их генерируют миллионами. Но как сделать так, чтобы ваш кот не выглядел как пластиковая игрушка? Тут на помощь приходит конкретика породы и окружения. Попробуйте ввести такой запрос:

«Close-up portrait of a fluffy Maine Coon cat, intense amber eyes, sitting on a vintage velvet armchair, cinematic lighting, 8k resolution, highly detailed, photorealistic»

Здесь каждое слово имеет вес. «Close-up» задает композицию, «amber eyes» дает цветовой акцент, а «vintage velvet armchair» создает антураж. Нейросеть цепляется за слово «velvet» (бархат) и часто переносит эту мягкость текстуры и на саму кошку. Это интересный нюанс.

С собаками ситуация схожая, но есть свои подводные камни. Особенно часто алгоритмы путаются в висячих ушах и хвостах. Чтобы получить добротный результат, стоит указать динамику или эмоцию. Статичная собака часто выглядит чучелом. А вот бегущая — уже живой. Пример хорошего промта может выглядеть так:

«Golden Retriever catching a tennis ball in a park, motion blur, sunny day, happy expression, dynamic pose, bokeh background, Canon EOS R5, 85mm lens»

Обратите внимание на техническую часть в конце. Упоминание конкретной камеры и объектива (85mm lens) дает нейросети команду размыть фон (боке) и сфокусироваться на объекте. Это довольно простой трюк, который творит чудеса.

Дикая природа

Здесь ставки повышаются. Львы, тигры, волки — это мощь и грация, которые нужно передать через экран. И если с домашними питомцами мы часто ищем уют, то здесь нам нужен эпик. Драма. Натурализм. Главное достояние снимков дикой природы — это атмосфера. Окружение не должно быть пустым. Львиная доля успеха зависит от описания среды обитания. Не стоит писать просто «forest». Лучше — «dense misty forest» (густой туманный лес) или «savanna at sunset» (саванна на закате).

Рассмотрим конкретный пример для создания величественного образа. Допустим, нам нужен волк. Промт может быть следующим:

«Majestic grey wolf howling at the moon, snowy mountain peak, night sky with aurora borealis, mystical atmosphere, cold tones, hyperrealistic, sharp focus, National Geographic style»

Упоминание «National Geographic style» — это своего рода чит-код. Нейросеть сразу подтягивает веса, связанные с профессиональной документальной фотографией: высокую контрастность, естественные цвета и глубокую проработку деталей.

Экзотика и макросъёмка

А что, если хочется чего-то совсем необычного? Например, макрофотографию насекомого или рептилии. Это же настоящий кладезь для визуальных экспериментов. Чешуя, фасеточные глаза, капли росы — всё это выглядит впечатляюще, если подать правильно. Тут главное — не скупиться на слова, описывающие текстуру. «Iridescent scales» (радужная чешуя), «translucent wings» (полупрозрачные крылья) — такие уточнения обязательны.

Представим, что мы хотим получить детальный снимок хамелеона. Запрос может звучать так:

«Macro shot of a colorful chameleon on a tropical branch, extreme close-up of the eye, vibrant green and blue scales, water droplets, shallow depth of field, macro photography, f/2.8»

Диафрагма f/2.8 здесь указана не для красного словца. Она подсказывает алгоритму, что глубина резкости должна быть минимальной, а фокус — бритвенно-резким только на глазу. К слову, именно такие технические параметры часто игнорируются новичками, а зря. Они придают изображению тот самый «фотографический» лоск.

Стилизация и художественные приёмы

Не всегда же нам нужен суровый реализм. Иногда душа просит творчества, сказки или киберпанка. Животные в одежде, животные-киборги или стилизация под масляную живопись — поле для фантазии безгранично. Однако смешивать стили нужно с умом. Если просто написать «cat in space», получится каша. Нужно задать направление.

Возьмем популярный стиль стимпанк. Сова в очках-гогглах? Почему бы и нет. Промт:

«Steampunk owl wearing brass goggles and leather gear, mechanical wings, clockwork background, intricate brass details, cinematic lighting, conceptual art, by Greg Rutkowski»

Имя художника (в данном случае Грега Рутковски, чей стиль нейросети знают наизусть) помогает закрепить художественную манеру. Конечно, сейчас многие платформы стараются уходить от имен конкретных авторов, но стилистические маркеры вроде «oil painting» (масляная живопись) или «watercolor sketch» (акварельный набросок) работают безотказно.

Ошибки

Главный враг качественной генерации — перегруженность запроса противоречивыми данными. Не стоит пытаться впихнуть в один промт «день» и «ночь», «реализм» и «мультяшность» одновременно (если только это не сюрреализм). Также частая ошибка — отсутствие негативного промта. Это тот фильтр, который отсекает всё лишнее. В поле Negative Prompt имеет смысл всегда вписывать:

«deformed paws, extra limbs, bad anatomy, blurry, low quality, watermark, text»

Это своего рода страховка. Ведь без нее нейросеть может решить, что пять лап для собаки — это отличная эволюционная находка. Зрелище удручающее.

Освещение

Свет солирует в фотографии. Без правильного света даже самая детальная модель будет выглядеть плоско. В промтах для животных есть свои фавориты по освещению. «Golden hour» (золотой час) дает тёплое, мягкое свечение, идеально подходящее для шерсти. «Studio lighting» (студийный свет) делает картинку чистой, с четкими тенями, что хорошо для портретов на однотонном фоне. А «Cinematic lighting» (кинематографичное освещение) добавляет драму, контраст и часто использует сине-оранжевую схему (teal and orange).

Попробуйте такой вариант:

«Portrait of a black panther in the jungle, dramatic rim lighting, dark atmosphere, glowing yellow eyes, shadows and contrast, Ray Tracing, Unreal Engine 5 render»

Упоминание движков (Unreal Engine) заставляет генератор стремиться к компьютерной графике высочайшего уровня, где свет просчитывается физически корректно. Это мощный инструмент.

Ракурсы и композиция

От того, как мы «поставим камеру», зависит восприятие. «Eye level» (на уровне глаз) создает эффект присутствия и контакта. «Low angle» (нижний ракурс) делает животное величественным, огромным. «Top view» (вид сверху) часто используется для милых, умилительных кадров. Нельзя не упомянуть и про широкоугольные объективы. Промт:

«Wide angle shot of a curious cow sniffing the camera lens, distorted nose, funny expression, farm background»

Этот запрос создаст забавный, искаженный эффект, который часто используют в мемах. Это вызывает улыбку.

Ещё один интересный приём — «Over the shoulder shot» (съёмка из-за плеча). Хотя у животных плеч в человеческом понимании нет, нейросеть понимает этот паттерн как вид со спины или сбоку, смотрящий вдаль. Например:

«Back view of a cat sitting on a roof looking at the night city, cyberpunk city lights, neon signs, raining, atmospheric perspective»

Здесь мы создаем историю, настроение одиночества или созерцания.

Детализация

Иногда дьявол кроется в мелочах. Чтобы шерсть не выглядела сплошным ковром, используйте слова, описывающие состояние. «Wet fur» (мокрая шерсть), «dirty paws» (грязные лапы), «wind blowing through fur» (ветер в шерсти). Эти маркеры добавляют жизни. Животное в студии и животное после дождя — это два разных мира.

Пример для «грязного» реализма:

«Stray dog running through puddles in the rain, splashing water, wet matted fur, dynamic action, reflection in water, gloomy urban street, desaturated colors»

Такой запрос создаст эмоционально сильную, возможно, даже грустную картину. Но она будет выглядеть настоящей. Ведь идеальная чистота в природе встречается довольно редко.

О чём стоит помнить?

Работа с промтами — это не просто перебор слов. Это постоянный поиск баланса. С одной стороны, хочется напихать в запрос всё самое лучшее: и 8k, и HDR, и «best quality». С другой — перегруженный промт нейросеть может просто проигнорировать, выдав усредненный результат. Лучше двигаться от общего к частному. Сначала — кто на картинке (субъект). Потом — где он (окружение). Затем — как он выглядит (детали и стиль). И в конце — технические параметры (свет, камера). Такая структура помогает разложить по полочкам «мысли» нейросети.

Важный нюанс касается версий моделей. То, что работало в Midjourney v4, может давать иной результат в v6 или в Stable Diffusion. Поэтому универсального «золотого» промта не существует. Есть лишь скелет, на который вы наращиваете мясо своих идей. Тем более что алгоритмы обновляются быстрее, чем мы успеваем к ним привыкнуть.

Впрочем, не стоит бояться экспериментов. Иногда опечатка в слове или неожиданное смешение стилей рождает настоящий шедевр. Нейросеть — это инструмент, но дирижёр — всё-таки человек. Пробуйте менять ракурсы, играйте со светом, добавляйте неожиданные аксессуары своим героям. И пусть каждый ваш сгенерированный зверь будет обладать своим уникальным характером, а не просто набором пикселей. Удачи в творческих поисках, и пусть ваши виртуальные питомцы всегда радуют глаз!