Египетская цивилизация всегда вызывала трепет своим отношением к кошачьим, возводя их в ранг божеств, и, судя по современному интернету, человечество недалеко ушло от древних культов. Лента социальных сетей переполнена пушистыми созданиями, видеоролики с ними набирают миллионы просмотров, а мемная культура без котов попросту бы рухнула. Казалось бы, создать изображение котика через нейросеть — задача элементарная, ведь материала для обучения у ИИ было предостаточно (миллиарды картинок). Однако спектр объектов не ограничивается банальным «кот на диване», и чтобы получить действительно качественную, художественную или фотореалистичную генерацию, стоит разобраться в анатомии правильного запроса.
Как выбрать породу и окрас?
С чего начинается выбор? С определения главного героя, разумеется. Обыватель часто пишет просто «cat», надеясь на удачу. Но нейросеть — инструмент довольно буквальный, и без уточнений она выдаст вам нечто усреднённое, серое и скучное. Львиная доля успеха зависит от конкретики. Стоит сразу указать породу, ведь именно она задаёт геометрию морды, текстуру шерсти и размер ушей. Если вы хотите величественного гиганта, вписывайте «Maine Coon» (мейн-кун), если же тяготеет душа к чему-то экзотическому, подойдёт «Sphynx» (сфинкс) или «British Shorthair» (британская короткошёрстная). К слову, цвет тоже играет не последнюю роль. Не ограничивайтесь простыми «black» или «white». Используйте более сложные определения: «calico» (трёхцветный), «tabby» (полосатый), «tortoiseshell» (черепаховый) или даже «siamese point coloration». Это придаст изображению глубину. А если ещё вспомнить про цвет глаз, например, «heterochromia» (разные глаза), то результат гарантированно прикует внимание.
Стилистика изображения: Выбор направления
Определившись с объектом, нужно задать правила игры визуальной. Реалистичный эксперт скажет вам прямо: смешивать стили можно, но осторожно. Один из самых популярных запросов — это, конечно же, фотореализм. Чтобы добиться эффекта живой фотографии, используйте связки вроде «hyperrealistic», «highly detailed», «4k», «8k resolution». Дополняет образ упоминание конкретной фототехники, но об этом чуть позже. Противоположный полюс — это стилизация. Тут поле для экспериментов поистине грандиозное. Вы можете отправить своего кота в мир киберпанка («cyberpunk style», «neon lights»), превратить его в персонажа мультфильма Pixar («3D render», «Disney style», «cute», «fluffy») или же сделать героем старинной японской гравюры («ukiyo-e style»). Интересный нюанс заключается в имитации традиционных техник рисования. Фразы «oil painting» (масляная живопись), «watercolor sketch» (акварельный набросок) или «pencil drawing» (карандашный рисунок) творят чудеса. Зрелище удручающее, когда пользователь пытается получить акварель, не указывая тип бумаги, так что добавьте «on textured paper» для достоверности.
Освещение
Свет — это кисть фотографа, пусть и виртуального. Без правильного света даже самый добротный промпт превратится в плоскую картинку. Бросается в глаза разница между «flat lighting» (плоское освещение) и «volumetric lighting» (объёмный свет). Для создания уютной, домашней атмосферы идеально подходит «warm lighting» или «golden hour» (золотой час), когда солнце окрашивает шерсть в тёплые тона. Если же задача стоит сделать что-то драматичное, нуарное, то тут выручит «rim lighting» (контровой свет), который подсветит лишь контур силуэта, оставив морду в полутени. Часто используют и «cinematic lighting» — это универсальный спасательный круг для тех, кто хочет картинку как в кино. Тем более, что нейросети отлично понимают этот термин. А вот «softbox lighting» даст мягкие тени, как в профессиональной студии. Главное — угадать с настроением.
Чем занять кота в кадре?
Статичная поза — это, конечно, классика, но динамика всегда выигрывает. Глагол тут солирует. Не стоит забывать, что кошки — хищники, акробаты и лежебоки одновременно. Попробуйте описать действие. «Chasing a butterfly» (гоняется за бабочкой) создаст ощущение движения и игривости. «Sleeping curled up» (спит, свернувшись калачиком) вызовет умиление и чувство покоя. А если вы хотите экшена, используйте «jumping mid-air» (прыжок в воздухе) или «stalking prey» (выслеживает добычу). Ну и, наконец, можно поиграть с антропоморфизмом. Коты в одежде, читающие газеты или пьющие кофе, — это отдельный жанр. В таком случае нужно скрупулёзно описать не только действие, но и одежду: «wearing a tiny suit», «reading a newspaper», «holding a cup of coffee». Антураж тут крайне важен.
Технические параметры: Камера и объектив
Для многих этот раздел кажется дебрями, но на самом деле всё довольно просто. Указание фокусного расстояния и типа объектива меняет восприятие сцены кардинально. Хотите крупный план мордочки с размытым фоном? Пишите «macro lens», «close-up», «depth of field» или «bokeh». Это выделит глаза и усы, сделав фон мягким и ненавязчивым. Для панорамных снимков, где кот — лишь часть пейзажа, подойдёт «wide angle lens» (широкоугольный объектив). Можно даже указать конкретную модель камеры, например, «shot on Sony A7R IV» или «Fujifilm simulation», что добавит специфическую цветокоррекцию и зернистость. Это же правило касается и ракурсов. «Low angle shot» (съёмка с нижнего ракурса) сделает кота огромным и величественным, а «top-down view» (вид сверху) подчеркнёт его беззащитность или смешную позу.
Готовые решения: Реализм и уют
Перейдём к конкретике. Допустим, вам нужен максимально живой, пушистый кот в уютной обстановке. Такой запрос потребует детального описания текстур и света. Конструкция может выглядеть так:
A fluffy Maine Coon cat sitting on a wooden windowsill, rainy day outside the window, raindrops on glass, cozy atmosphere, warm indoor lighting, hyperrealistic, highly detailed fur texture, 8k, shot on 85mm lens.
Здесь мы задали и объект, и атмосферу, и технические детали. Результат порадует глаз детализацией шерстинок и настроением дождливого дня. Или вот другой вариант, более солнечный:
Cute British Shorthair kitten playing with a ball of red yarn, sunbeams coming through the window, dust particles in the air, playful mood, sharp focus on eyes, bokeh background, photorealistic.
Тут акцент смещён на игру света и пылинок, что добавляет живости.
Готовые решения: Фэнтези и креатив
А если хочется уйти от реальности? Погрузимся в мир фантазий. Представьте кота-воина. Промпт для такого героя будет включать элементы одежды и окружения:
Warrior cat wearing intricate silver armor, holding a small sword, epic fantasy background, magical forest, glowing mushrooms, cinematic lighting, heroic pose, digital art, ArtStation style, detailed concept art.
Заметьте, мы добавили «ArtStation style» — это мощный маркер для получения качественного арта. Другой пример — киберпанк, который сейчас на пике популярности. Запрос будет звучать так:
Cyberpunk cat with robotic eye, neon city background, rain, reflections in puddles, blue and pink neon lights, futuristic collar, futuristic city street, high tech, detailed fur combined with metal parts, realistic render.
Смешение органики и механики всегда выглядит впечатляюще.
Готовые решения: Стилизация под искусство
Иногда нужно создать что-то, что можно повесить на стену в рамке. Имитация живописи — отличный выход. Попробуем создать портрет в стиле Ван Гога. Промпт будет коротким, но ёмким:
Portrait of a ginger cat, Starry Night style by Vincent van Gogh, thick brush strokes, oil painting, swirling sky background, vibrant colors, expressive technique.
Нейросеть прекрасно знает стиль великого голландца. А вот вариант для любителей нежной акварели:
Sleeping cat on a pile of old books, watercolor illustration, soft pastel colors, wet-on-wet technique, artistic drips, white background, minimalist style, dreamy atmosphere.
К слову, упоминание «wet-on-wet» (мокрым по мокрому) даёт те самые красивые расплывы краски.
Сложно ли исправлять ошибки?
Разумеется, с первого раза шедевр получается не всегда. Бывает, что у кота вырастает пятая лапа или хвост начинает жить своей жизнью. Это подводные камни генерации. Часто проблема кроется в перегруженности промпта. Не стоит перебарщивать с количеством деталей. Если вы напишете слишком много противоречивых требований, нейросеть запутается. Также помогает использование «negative prompt» (негативный промпт), куда вписывают то, чего быть не должно: «deformed paws», «extra tails», «missing limbs», «blurry», «low quality». Это своего рода фильтр, отсекающий брак. Ну и, конечно же, вариативность. Сгенерируйте 10 вариантов одного и того же запроса — один из них точно будет удачным. Ведь даже профессиональные фотографы делают сотни кадров ради одного снимка.
Костюмированные портреты: Антропоморфизм
Отдельный пласт творчества — это коты в человеческих образах. Это всегда вызывает улыбку и работает безотказно. Но тут важна детализация одежды. Просто «кот в одежде» даст странный результат. Попробуйте конкретизировать эпоху и стиль. Например, викторианский джентльмен:
Portrait of a sophisticated cat wearing a Victorian suit, monocle, top hat, vintage library background, sepia tone, antique photo style, daguerreotype.
Такой запрос переносит зрителя в XIX век. Или же современный хипстер:
Cool cat wearing sunglasses and a hoodie, sitting in a coffee shop, holding a latte, urban style, street photography, graffiti in background.
Изюминка таких изображений — в контрасте между звериной натурой и человеческими атрибутами. Да и разглядывать детали костюма на пушистом теле — занятие увлекательное.
Эмоциональная окраска
Лицо, а точнее морда, — зеркало души, даже если эта душа цифровая. Эмоции задают тон всему изображению. Нейросети научились неплохо имитировать мимику. Используйте слова «angry» (злой), «surprised» (удивлённый), «curious» (любопытный), «sad» (грустный) или «grumpy» (ворчливый). Знаменитый Grumpy Cat доказал, что недовольная морда может стать мировым брендом. Попробуйте скомбинировать эмоцию с ситуацией. Например:
Shocked cat looking at a cucumber, wide eyes, open mouth, kitchen floor background, funny scene, dynamic angle.
Такой сюжетный поворот сразу создаёт историю. А история всегда интереснее простого портрета. Тем более, что зритель любит додумывать происходящее.
Абстракция и сюрреализм
Для тех, кто готов к экспериментам, открыт путь в сюрреализм. Здесь логика отступает на второй план. Можно создать кота, состоящего из облаков или дыма. Запрос может звучать так: «Silhouette of a cat made of smoke, dark background, mystic atmosphere, swirling shapes, abstract art, ethereal, ghostly». Или же кот-космос: «Double exposure of a cat silhouette and a galaxy, stars, nebula inside the cat shape, deep space background, cosmic colors, purple and blue tones». Техника «double exposure» (двойная экспозиция) позволяет совмещать два изображения в одном, создавая глубокие, философские образы. Это серьёзное вложение креатива, которое не сильно ударит по кошельку, если вы используете бесплатные генерации, но результат будет выглядеть на миллион.
Стоит ли использовать имена художников?
Вопрос спорный и этический, но с технической точки зрения — безусловно эффективный. Добавление имени известного художника мгновенно меняет стилистику. Если вы напишете «by Picasso», готовьтесь к кубизму и ломаным линиям. «By Greg Rutkowski» — этот польский художник стал настоящим мемом в мире AI, так как его стиль (эпическое фэнтези) идеально подходит для нейросетей. Его имя добавляют, чтобы получить живописный, детализированный и драматичный арт. Однако спектр имён огромен: от «by Makoto Shinkai» (для потрясающих аниме-фонов и неба) до «by HR Giger» (если вы хотите жуткого биомеханического кота-чужого). Главное — понимать, какой визуальный язык присущ автору. Но не стоит забывать, что нейросеть лишь имитирует стиль, а не копирует его досконально.
Влияние соотношения сторон
Казалось бы, мелочь, но формат кадра (aspect ratio) влияет на композицию. Для Midjourney, например, параметр «–ar 16:9» создаёт кинематографичную картинку, идеально подходящую для пейзажей с котами. А вертикальный формат «–ar 9:16» лучше всего подходит для портретов в полный рост или для экранов смартфонов. Квадрат «–ar 1:1» — классика для социальных сетей. При смене формата нейросеть перестраивает объекты. В широком кадре коту придётся добавить окружение, иначе будет много пустого места. В узком вертикальном кадре кот займёт всё пространство. Учитывайте это при написании промпта. Ведь гармоничная композиция — это половина успеха.
Практическое применение
Где же можно использовать эти генерации? Да где угодно. От создания уникальных открыток и принтов на футболки до иллюстраций для детских книг и блогов. Многие владельцы бизнеса используют AI-котов для рекламы зоотоваров, ведь это дешевле и быстрее, чем организовывать реальную фотосессию с капризным животным. К тому же, вы можете создать идеального маскота (талисман) для своего бренда, который никогда не постареет и не потребует гонорара в виде элитного корма. Возможности ограничены лишь вашей фантазией. А начать стоит с малого — просто откройте генератор и опишите кота своей мечты.
Создание собственного уникального стиля
Со временем вы натыкаетесь на определённые комбинации слов, которые выдают стабильно классный результат. Это и есть ваш авторский стиль промпт-инжиниринга. Записывайте удачные связки, экспериментируйте с порядком слов. Иной раз перестановка одного прилагательного в начало предложения меняет акценты на изображении. Это не сложный, но кропотливый процесс поиска идеальной формулы. И всё же, самое главное — получать удовольствие от процесса. Ведь создание чего-то нового из пустоты — это всегда магия. Пусть ваш цифровой питомец станет отличным решением для творческого самовыражения и, безусловно, порадует глаз.