Промты для сора 2 (с примерами готовых промтов)

Видеоконтент сегодня переживает настоящую революцию, сравнимую разве что с появлением звука в кино в начале прошлого века. Ещё совсем недавно мы удивлялись неуклюжим, дёрганым анимациям, которые выдавали нейросети первого поколения, а уже сейчас границы реальности буквально стираются на глазах. Многих обывателей пугает, а творческих людей — вдохновляет тот факт, что отличить сгенерированный ролик от снятого на профессиональную камеру становится довольно сложно. Однако за всей этой магией скрывается не просто «кнопка шедевр», а сложная лингвистическая работа, требующая понимания режиссуры, освещения и физики объектов. И всё же, владение инструментом без правильных инструкций бесполезно. Но чтобы не ошибиться и получить результат голливудского уровня, нужно детально разобраться в логике составления запросов для новой версии модели.

Начать нужно с базы.

Сложно ли взаимодействовать с обновлённой моделью? На первый взгляд интерфейс кажется дружелюбным, но дьявол, как известно, кроется в деталях. Sora 2 (условное название следующего витка эволюции модели) тяготеет к максимальной детализации. Если раньше можно было написать «кот сидит на диване», и система выдавала нечто среднее, то теперь такой лаконизм сыграет злую шутку. К слову, модель теперь гораздо глубже понимает физические свойства материалов. Ей важно знать, из чего сделан диван — это потёртая кожа, мягкий велюр или грубая рогожка? Ведь именно текстура определяет, как на поверхность ляжет свет. Поэтому фундамент любого промта строится на трёх китах: субъект, действие и окружение. Игнорировать это правило не стоит.

Кинематографичность: Технические параметры

А как заставить искусственный интеллект думать, как оператор? Секрет кроется в использовании профессиональной терминологии. Простого слова «красиво» машине недостаточно. Ей нужны цифры и названия объективов. Львиная доля успеха зависит от указания типа съёмки. Хотите эпичности? Используйте «wide angle shot» (широкоугольный снимок) или «drone shot» (съёмка с дрона). Нужно передать интимность момента или детали? Здесь на помощь придет «macro shot» (макросъёмка) или «extreme close-up».

Важнейшую роль играет и плёнка. Указание «35mm film stock» мгновенно добавит изображению то самое зерно и глубину, по которым мы так скучаем в цифровую эру. А если добавить «Kodak Portra 400», то цвета станут мягкими, пастельными, с естественными скинтонами. Разумеется, не стоит забывать и о характеристиках камеры. Фразы вроде «shot on ARRI Alexa» или «IMAX quality» служат для нейросети мощным триггером, повышающим чёткость и динамический диапазон картинки. Это работает безотказно.

Свет и атмосфера

Светом управлять учиться придётся. Без этого картинка останется плоской, как дешёвый сериал. Профессионалы знают, что освещение задаёт настроение всей сцене. Например, для драматичных портретов идеально подходит «Rembrandt lighting» (рембрандтовское освещение) — тот самый треугольник света на щёке, который придаёт лицу объём и загадочность. А вот для создания ощущения утра или вечера лучше использовать «Golden hour» (золотой час). Солнце в этом случае находится низко, заливая всё тёплым золотистым светом.

Но есть и более сложные схемы. Для создания таинственной, немного пугающей атмосферы стоит прописать «Volumetric lighting» или «God rays». Это те самые лучи, пробивающиеся сквозь туман или пыль. Выглядит впечатляюще. Впрочем, если ваша цель — киберпанк или неон, то «Neon lighting» в сочетании с «wet pavement» (мокрый асфальт) сотворят настоящие чудеса с отражениями. Кстати, именно работа с отражениями в новой версии модели вышла на качественно новый уровень.

Динамика и движение

Статичная картинка — это полдела, но как вдохнуть в неё жизнь? Sora 2 отлично понимает глаголы движения, но и здесь есть свои нюансы. Не скупитесь на описание характера движения. Фраза «runs fast» (бежит быстро) слишком примитивна. Попробуйте заменить её на «sprints aggressively» (агрессивно спринтует) или «stumbles while running» (спотыкается на бегу). Это добавит реализма.

Отдельно стоит упомянуть управление временем. Эффект «Slow motion» (замедленная съёмка) позволяет рассмотреть детали быстрых процессов, будь то взрыв или падение капли воды. А вот «Timelapse» (таймлапс) идеально подойдёт для демонстрации течения времени — как распускается цветок или как облака проносятся над городом. И всё же, с динамикой нужно быть осторожным. Слишком сложные траектории могут сбить модель с толку, и вместо плавного пролёта камеры вы получите дёрганую нарезку. Главное — соблюдать баланс.

Примеры промтов: Городская среда

Представим, что нам нужно создать атмосферное видео ночного мегаполиса будущего. Задача не из лёгких. Обыватель напишет: «Город будущего, дождь, неон». Результат будет средним. Профессиональный же промт, учитывающий всё вышесказанное, будет выглядеть иначе. Он должен быть насыщен деталями, как слоёный пирог.

Вот пример добротного запроса для такой сцены:

Prompt: «Hyper-realistic video of a futuristic Tokyo street at night, heavy rain falling on asphalt, creating puddles with neon reflections. A mysterious figure in a translucent raincoat walks away from the camera. Shot on 35mm lens, f/1.8 aperture for shallow depth of field, bokeh effect on background lights. Cyberpunk atmosphere, volumetric fog, blue and pink neon lighting schema. High contrast, cinematic color grading.»

Разберём этот пример. Мы задали локацию и время (Токио, ночь), погоду (сильный дождь), действие (фигура уходит), технические параметры (35мм, диафрагма 1.8 для размытия фона) и атмосферу (киберпанк, объёмный туман). Именно сочетание этих факторов даёт тот самый «вау-эффект».

Примеры промтов: Природа и документалистика

А что, если мы хотим окунуться в мир дикой природы? Здесь важна текстура и естественность. Искусственный интеллект часто «вылизывает» картинку, делая её слишком глянцевой. Чтобы этого избежать, нужно добавить немного «грязи» и несовершенств.

Рассмотрим вариант создания ролика о лесе:

Prompt: «Cinematic drone shot flying low over a dense ancient forest in the morning mist. Sunbeams breaking through the canopy of giant pine trees (God rays). Moss-covered rocks and ferns on the ground. Highly detailed textures of bark and leaves. 8k resolution, photorealistic style, raw footage aesthetic, slow smooth camera movement forward.»

Тут мы использовали «raw footage aesthetic» (эстетика сырого материала), чтобы убрать излишнюю цифровую обработку. Упоминание мха, папоротников и текстуры коры помогает модели понять, на чём сфокусировать вычислительные мощности. Это же правило касается и съёмки животных. Шерсть, блеск глаз, микро-движения ушей — всё это нужно прописывать.

Примеры промтов: Фэнтези и анимация

Sora 2 — это настоящий кладезь возможностей для мультипликаторов и концепт-артистов. Она умеет имитировать стили известных студий. Хотите что-то в духе Pixar? Не проблема. Грезят о мрачном аниме 90-х? Пожалуйста. Главное — чётко обозначить референс.

Для создания магической сцены подойдёт следующий текст:

Prompt: «A cute small dragon with crystalline scales sleeping on a pile of gold coins in a dark cave. The dragon glows with a soft internal blue light. Pixar animation style, 3D render, Octane render, vibrant colors, expressive facial features. The camera slowly zooms in on the dragon’s face. Magical atmosphere, sparkles floating in the air.»

Здесь ключевыми маркерами выступают «Pixar animation style» и «Octane render». Последнее — это название движка рендеринга, которое для нейросети является синонимом качественного, сочного 3D-изображения. А уточнение про «soft internal blue light» (мягкий внутренний голубой свет) помогает правильно выстроить тени в пещере.

Ошибки новичков

Всплывут ли ошибки при первых попытках? Безусловно. Самая распространённая — это перегруженность промта противоречивыми командами. Нельзя одновременно требовать «sunny day» (солнечный день) и «noir atmosphere» (нуарная атмосфера). Модель просто «сойдёт с ума» и выдаст галлюцинацию. Также не стоит забывать о так называемых «негативных промтах» (хотя в Sora они часто вшиты, но понимание логики важно). Лучше отказаться от слов, которые могут быть истолкованы двояко.

Ещё один нюанс — длина запроса. Существует миф, что чем длиннее текст, тем лучше. Это не совсем так. Огромные «стены текста» модель может просто обрезать или потерять фокус на середине. Лучше разбивать описание на логические блоки, разделённые запятыми. Конкретика всегда бьёт абстракцию. Вместо «huge building» (огромное здание) напишите «100-story skyscraper» (100-этажный небоскрёб). Разница будет колоссальной.

Стилизация и художественные приёмы

Иногда хочется чего-то необычного, выходящего за рамки реальности. Сюрреализм, абстракция, стилизация под старое кино — всё это подвластно алгоритмам. Попробуйте использовать названия художественных направлений. «Impressionism style» превратит видео в ожившее полотно Моне, а «Vaporwave aesthetic» перенесёт зрителя в ностальгические 80-е с пальмами и глитчем.

Интересный результат даёт смешение несовместимого. Например:

Prompt: «Historical footage of knights fighting in a medieval battle, but they are wearing modern sneakers. Vintage 16mm film look, scratched film texture, black and white, shaky handheld camera movement.»

Такой промт создаёт когнитивный диссонанс, который приковывает внимание. Эффект «shaky handheld camera» (трясущаяся ручная камера) добавляет документальности происходящему, заставляя зрителя поверить в реальность даже самого абсурдного сюжета. Это мощный инструмент сторителлинга.

Как работать с персонажами?

Люди в кадре — это всегда сложно. ИИ всё ещё учится рисовать руки и мимику, но прогресс очевиден. Чтобы персонаж выглядел живым, описывайте не только внешность, но и эмоции. Не просто «женщина улыбается», а «woman with a mysterious subtle smile» (женщина с загадочной лёгкой улыбкой). Обязательно указывайте возраст, этническую принадлежность, одежду.

Пример портретного видео:

Prompt: «Close-up portrait of an elderly fisherman with a weathered face and a gray beard, looking at the stormy sea. Raindrops running down his face. Intense emotional expression of hope and fear. Cinematic lighting, dramatic shadows, high detail on skin texture. 85mm lens.»

Фокусное расстояние 85mm здесь указано не случайно. Именно оно считается классическим портретным, так как не искажает пропорции лица и красиво размывает фон. Нейросеть эти нюансы прекрасно считывает.

Вместо заключения

Мир генеративного видео огромен и пока ещё до конца не изведан. Здесь нет жёстких законов, есть лишь рекомендации, рождённые методом проб и ошибок. Тем более, что обновления выходят с завидной регулярностью, меняя правила игры. Не бойтесь экспериментировать, смешивать стили и требовать от машины невозможного. Ведь именно в поиске нестандартных решений рождаются настоящие цифровые шедевры. Ваш идеальный промт — это тот, который понятен вам и интересен алгоритму. Пусть каждый ваш запрос становится началом удивительной визуальной истории, которая запомнится надолго.