Промт для создания селфи (с примерами готовых промтов)

Миллионы людей ежедневно загружают в социальные сети свои автопортреты, пытаясь поймать тот самый идеальный ракурс, свет и эмоцию, но далеко не всегда камера смартфона способна передать задуманное. В эру цифровых технологий на помощь приходит искусственный интеллект, который, казалось бы, может нарисовать всё что угодно, однако на практике новички часто получают пластиковые лица с пугающим количеством пальцев или странной мимикой. Генерировать реалистичные селфи — это настоящее искусство, требующее не просто набора слов, а понимания фотографии, оптики и даже психологии восприятия. Ведь машине нужно объяснить не только то, кого рисовать, но и как именно «держать камеру». Удивительно, но чтобы получить живой кадр, который сложно отличить от реального снимка, нужно научиться говорить с нейросетью на языке профессионального фотографа.

С чего начинается выбор?

С определения главного героя и атмосферы. Казалось бы, достаточно написать «селфи красивой девушки», и дело в шляпе. Но нет. Результат будет усреднённым, скучным и откровенно искусственным. Нейросеть работает как огромная библиотека образов, и если вы не дадите ей конкретику, она выдаст вам «среднюю температуру по больнице». Сперва стоит задать возраст, пол, этническую принадлежность и даже настроение. Это фундамент. Например, уточнение «25-летняя женщина с веснушками» уже даст куда более живой результат, чем абстрактная «леди». Эмоция здесь играет первую скрипку. Искренняя улыбка, задумчивый взгляд или даже усталость делают портрет достоверным.

Важно также помнить про окружение (антураж). Снимается ли человек в уютной спальне, в шумном баре или на вершине горы? Фон задаёт контекст. И тут кроется нюанс: если вы не опишете фон, ИИ часто делает его размытым и невнятным пятном. А ведь именно детали на заднем плане — случайный прохожий, светящаяся вывеска или бардак на столе — заставляют мозг верить в реальность происходящего. К слову, довольно часто новички забывают указать действие. Человек не просто смотрит в камеру. Он может поправлять волосы, пить кофе или щуриться от солнца.

Техническая часть вопроса

Как объяснить машине, что кадр должен выглядеть как фото с телефона? Нужно использовать терминологию, свойственную мобильной фотографии или профессиональной оптике. Фразы вроде «shot on iPhone 14 Pro» или «GoPro footage» творят чудеса. Они переключают алгоритм в режим имитации конкретного сенсора. Если же вы грезите о более художественном снимке, стоит упомянуть плёночные характеристики. Слова «film grain» (зернистость плёнки), «Kodak Portra 400» или «Polaroid style» добавляют ту самую «грязную» эстетику, которой так не хватает стерильным цифровым генерациям.

Особый интерес вызывает работа с фокусным расстоянием. Селфи обычно снимают на широкий угол. Поэтому указание «wide angle», «fisheye» или конкретных цифр вроде «15mm» или «24mm» помогает избежать эффекта телеобъектива, когда лицо кажется плоским. Искажения, свойственные широкому углу, делают кадр интимным, приближают зрителя к герою. Да и самому ИИ так проще понять, что камера находится на расстоянии вытянутой руки.

Свет имеет значение

Освещение — это душа фотографии. Плоский студийный свет убивает реализм наповал. Для селфи идеально подходит «golden hour» (золотой час), когда солнце низкое и мягкое. Или же «morning sunlight», пробивающийся сквозь шторы. Не стоит забывать и про искусственные источники. «Neon lights» подойдут для киберпанк-образов, а «ring light» создаст характерные блики в глазах, свойственные блогерам. Сложно ли настроить свет словами? Довольно просто, если знать правильные маркеры. «Hard shadows» (жёсткие тени) добавят драмы, а «soft lighting» (мягкое освещение) скроет недостатки кожи.

Кстати, про кожу. Это самый большой камень преткновения. ИИ обожает делать кожу фарфоровой, без единой поры. Чтобы этого избежать, нужно принудительно вводить текстурные промты. «Skin texture», «pores», «moles» (родинки), «imperfections» (несовершенства) — эти слова спасательный круг для реализма. Ведь именно мелкие дефекты делают нас людьми. Гладкое лицо вызывает эффект «зловещей долины», от которого зрителю становится не по себе.

Примеры готовых решений: Реализм

Перейдём к практике. Допустим, нам нужно получить максимально естественное фото девушки, сделанное дома. Конструкция промта будет строиться наслоением деталей. Начать нужно с главного объекта, затем добавить действия, освещение и технические параметры. Хороший, добротный вариант может выглядеть так:

«Candid selfie of a smiling 20-year-old Scandinavian girl, messy bun hairstyle, wearing oversized grey hoodie, holding a mug of coffee, sitting on a windowsill, morning sunlight hitting face, natural skin texture, visible pores, slight freckles, cluttered cozy bedroom background, shot on iPhone 13, realistic lighting, high detail, 4k».

Здесь мы видим чёткую структуру: кто (девушка), где (подоконник), что делает (держит кружку), свет (утренний), детали (веснушки, поры) и техническая база (iPhone).

А если нужно мужское селфи? Тут логика та же, но можно добавить больше жёсткости в свет и текстуры. Пример:

«Smartphone selfie of a tired 35-year-old mechanic man, grease on cheek, looking directly at camera, wearing blue work jumpsuit, workshop background with tools, dim fluorescent lighting, hard shadows, sweaty skin texture, beard stubble, shot on Samsung Galaxy S21, raw photo, hyperrealistic».

В этом случае «жир на щеке» и «тусклый флуоресцентный свет» создают тот самый антураж, которому веришь. Это не глянцевая картинка, а суровая реальность.

Примеры готовых решений: Креатив и стилизация

Иногда хочется чего-то необычного, выходящего за рамки бытового реализма. Допустим, мы хотим стилизовать фото под старую плёнку 90-х. Это сейчас в тренде. Промт будет опираться на ностальгические маркеры.

«Flash photography selfie of a group of friends at a night party, laughing, red eyes effect, motion blur, vintage style, disposable camera aesthetic, film grain, harsh flash lighting, dark club background, 1990s vibe, chaotic composition».

Обратите внимание на «red eyes effect» и «motion blur» (размытие в движении). Эти дефекты, которые фотографы обычно удаляют, здесь работают на атмосферу и достоверность момента.

Для любителей футуризма и необычных локаций подойдёт такой вариант:

«Close-up selfie of a cyberpunk girl with pink neon hair, wearing futuristic visor glasses, reflection of neon city lights in glasses, raining night street background, wet skin, bokeh lights, chromatic aberration, cinematic lighting, purple and blue color palette, highly detailed, 8k resolution».

Здесь уже вступают в игру «хроматическая аберрация» и цветовая палитра. Это не попытка обмануть зрителя реальностью, а создание художественного образа.

Групповые снимки: сложности и решения

Сделать селфи одного человека — задача не из лёгких, но групповое фото — это настоящий вызов для нейросети. Главная проблема здесь в том, что ИИ часто путает лица или сливает тела. Чтобы минимизировать риски, стоит указывать количество людей (хотя это не всегда срабатывает идеально) и их взаимодействие.

Примерный промт для пары:

«Romantic selfie of a young couple, hugging, cheek to cheek, hiking in the mountains, snowy peaks in background, wind blowing hair, happy expressions, bright daylight, lens flare, wide angle lens, GoPro Hero 10 footage, sharp focus on faces».

Ключевым моментом здесь является «cheek to cheek» (щека к щеке). Это сближает объекты композиционно, не давая нейросети «разбросать» их по кадру или добавить кого-то лишнего между ними.

Чего делать не стоит?

Многие считают, что чем длиннее промт, тем лучше результат, но на самом деле это заблуждение. Чрезмерное количество деталей сбивает алгоритм с толку. Когда вы просите одновременно «дождь», «солнце», «ночь» и «радугу», машина выдает сюрреалистичную кашу. Не стоит перебарщивать и с эпитетами красоты. Слова «gorgeous», «stunning», «beautiful» слишком абстрактны. Лучше заменить их на конкретные черты: «symmetrical face», «high cheekbones» (высокие скулы) или «bright blue eyes».

Откажитесь от противоречивых команд. Если вы пишете «candid» (случайный кадр) и тут же добавляете «professional studio lighting» (профессиональный студийный свет), результат будет выглядеть неестественно. Конфликт стилей — враг хорошего промта. Ну и, конечно же, избегайте сложных отрицательных конструкций внутри основного запроса. Нейросети плохо понимают частицу «не». Лучше использовать поле Negative Prompt (если оно есть) для отсечения лишнего, например: «cartoon, illustration, 3d render, plastic skin, blur».

Стиль гранж в цифровом портрете

Отдельно стоит упомянуть стилистику, которая набирает популярность — «гранж» или «эстетика несовершенства». Это антипод гламуру. Здесь мы намеренно просим ИИ добавить грязь, шум и небрежность. Такой подход парадоксальным образом делает генерации наиболее похожими на реальные фото из жизни. Ведь в жизни мы редко выглядим как модели с обложки.

Промт для такого стиля может звучать так:

«Mirror selfie of a teenager in a messy bathroom, dirty mirror reflection, toothpaste spots on mirror, wearing vintage t-shirt, flash reflection, grainy photo, low quality, amateur photography style, candid moment, unposed».

«Dirty mirror» (грязное зеркало) и «low quality» (низкое качество) — это те самые изюминки, которые заставляют зрителя думать: «Да это же точно снято на старую нокию в общаге». Львиная доля успеха таких генераций лежит именно в смелости испортить качество картинки.

Психология восприятия: взгляд

Глаза на селфи решают всё. Если взгляд направлен «в никуда», магия рушится. В промте обязательно стоит прописывать направление взгляда. «Looking at viewer» или «looking into the lens» — стандарт, но попробуйте «looking away» или «looking at the phone screen». Это добавляет динамики. К тому же, в селфи через зеркало человек обычно смотрит не на себя, а в телефон. Указание «looking at the phone in the mirror» поможет достичь максимальной правдоподобности.

Махинации с руками

Руки — ахиллесова пята нейросетей. Пальцы часто превращаются в спагетти или множатся. Самый простой способ избежать этого — убрать руки из кадра или занять их чем-то. Если вы просите селфи, где человек держит телефон, будьте готовы к тому, что сам аппарат может стать частью руки. Поэтому лучше использовать промты, где телефон не виден (как бы за кадром), или указывать чёткое действие: «holding a coffee cup with both hands». Это упрощает задачу для алгоритма, так как форма чашки ему понятна лучше, чем хитросплетение пальцев на тонком смартфоне.

Текстуры и детализация

Чтобы картинка не «била по глазам» своей искусственностью, нужно уделить внимание материалам. Ткань одежды, волосы, фон — всё должно иметь фактуру. Слова «knitted wool» (вязаная шерсть), «denim texture», «silk» помогают ИИ правильно прорисовать свет и тени на одежде. Для волос подойдут уточнения «frizzy hair» (пушащиеся волосы) или «windblown» (растрёпанные ветром). Идеальная укладка волосок к волоску часто выдаёт компьютерную графику. А вот лёгкий хаос на голове — признак жизни.

Сложно ли составить свой идеальный промт?

Да, это требует времени и экспериментов. Приходится действовать методом проб и ошибок, перебирая десятки вариантов, меняя одно слово и наблюдая, как кардинально меняется результат. Но процесс этот увлекательный. Вы словно режиссёр, который управляет светом, актёрами и камерой силой мысли. Тем более, что готовые шаблоны всегда можно адаптировать под себя, меняя локации, возраст героев или время суток.

Главное — не бояться добавлять странные, на первый взгляд, детали. Мусорный бак на заднем плане, пятно на футболке или неудачный свет могут сделать ваше сгенерированное селфи шедевром реализма. Экспериментируйте с ракурсами, играйте с плёночными фильтрами и помните, что самые интересные кадры рождаются на стыке технологий и человеческой фантазии. Удачных генераций, и пусть ваши виртуальные селфи собирают не меньше лайков, чем реальные!