Как написать правильный промт в Алису (Яндекс) для генерации текста и картинок

В сети представлено невероятное множество инструментов на базе искусственного интеллекта, и львиная доля из них грешит одной и той же проблемой – они не всегда понимают, чего от них хочет пользователь. Получить предсказуемый, качественный и релевантный результат с первого раза удаётся далеко не всем, даже опытным специалистам. Всё дело в том, что нейросети, включая YandexGPT и YandexART, встроённые в Алису, требуют скрупулёзного подхода к составлению запросов. Но чтобы не ошибиться, нужно разложить по полочкам механику их работы с текстом и изображениями.

Все топовые нейросети в одном месте

Как заставить YandexGPT писать в нужной манере?

Задача не из лёгких. Самая распространённая ошибка – это попытка описать задачу в двух-трёх общих фразах. Запросы вроде «напиши статью про маркетинг» обречены на провал, ведь результат будет обобщённым, сухим и безликим. Секрет кроется в задании роли. Нужно представить, что нейросеть – это актёр, которому необходимо вжиться в образ, и ваша задача – предоставить ему максимально подробное сценарное задание. Сложно ли это? Да, но результат того стоит. Вместо примитивного запроса стоит использовать сложную конструкцию, которая задаёт контекст, роль, цель и ограничения.

Разумеется, такой подход требует времени. Придётся потратить несколько минут на формулировку, но это серьёзное вложение в итоговое качество. К слову, не стоит бояться длинных промтов. Чем больше деталей вы дадите нейросети, тем точнее она попадёт в цель. Вот добротный пример промта, который заставит Алису генерировать текст от лица конкретного специалиста:

«Представь, что ты – опытный SEO-специалист с 10-летним стажем, который ведёт свой экспертный блог. Твоя аудитория – начинающие предприниматели. Напиши пост для блога на тему «Почему малому бизнесу не стоит игнорировать SEO в 2024 году». Используй простой, понятный язык, избегай сложных терминов или объясняй их на примерах. Твоя цель – не напугать, а убедить, что SEO – это доступный и эффективный инструмент. Структура текста: вступление с проблемой, три основных аргумента «за», заключение с мотивирующим призывом. Тон – дружелюбный, но авторитетный. Объём – около 3000 символов».

Тонкости текстуальных запросов: детали решают всё

Выбор роли – это лишь первый шаг. Следующий важный критерий – детализация стиля и формата. Нейросеть способна имитировать практически любую манеру письма, но ей нужно на это прямо указать. В запросе этому стоит уделить особое внимание. Нужно отметить, что модель хорошо понимает такие параметры, как тон (Tone of Voice). Можно попросить её написать текст в «официальном», «юмористическом», «саркастическом» или «научно-популярном» тоне. А если ещё вспомнить про формат, то возможности становятся почти безграничными. Просите сгенерировать «письмо другу», «коммерческое предложение», «сценарий для короткого ролика» или «пост для Telegram-канала».

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

Отдельно стоит упомянуть о негативных инструкциях. Это мощный инструмент, который помогает отсечь всё лишнее. Если вы не хотите видеть в тексте клише или канцеляризмы, так и напишите: «Пиши без штампов, избегай фраз «динамично развивающаяся компания», «индивидуальный подход» и подобных». Это же правило касается и структуры. Не хотите видеть списки? Укажите: «Излагай мысли связным текстом, не используй маркированные или нумерованные перечисления». Такой щепетильный подход творит чудеса и выводит качество генерации на совершенно иной уровень. К примеру:

«Напиши описание для карточки товара «кофемашина Nespresso Vertuo». Аудитория – занятые городские жители (25-40 лет), ценящие комфорт и качество. Подчеркни скорость приготовления, разнообразие капсул и стильный дизайн. Тон – восторженный, премиальный. Избегай технических характеристик, делай упор на эмоции и опыт использования. Не используй банальные эпитеты вроде «уникальный» или «лучший»».

А что насчёт картинок?

С генерацией изображений через YandexART дело обстоит немного иначе, но общие постулаты сохраняются. Здесь точность и детализация играют ещё более внушительную роль. Буквально десятилетие назад создание фотореалистичного изображения требовало часов работы дизайнера, но сейчас достаточно правильно сформулировать мысль. Многие считают, что для этого нужно быть художником, но на самом деле всё сводится к пониманию простой формулы. Любой успешный промт для генерации картинки состоит из нескольких блоков: объект, действие или состояние, детализация окружения и, конечно же, стиль.

Кстати, для работы с изображениями довольно часто используют английский язык, поскольку львиная доля моделей обучалась на англоязычных данных. Алиса понимает и русский, но на английском результат может получиться более точным и разнообразным. Процесс не сложный, но кропотливый. Например, простой запрос «кот» выдаст стандартное изображение кота. А вот следующий промт – это уже целая история, которая приковывает внимание:

«рыжий кот в очках профессора читает книгу в старинной библиотеке, сидя в кресле у камина, мягкий тёплый свет»

Объект и его окружение

Основа основ. С чего начинается выбор? С определения главного героя вашей будущей картины. Это может быть что угодно: от конкретного человека до мифического существа или неодушевлённого предмета. Само собой, чем детальнее вы его опишете, тем лучше. Не просто «девушка», а «young woman with long curly red hair and freckles». Не просто «машина», а «red retro sports car from the 1960s». После описания объекта стоит добавить действие и антураж. Что он делает? Где находится? Это придаёт изображению динамику и глубину.

В представлении многих обывателей нейросеть сама додумает детали. Отчасти это так, но зачем полагаться на случайность? Пропишите фон. Это может быть:

«on a neon-lit street of a cyberpunk city at night» или «in a sunny meadow full of wildflowers»

Чем колоритнее и самобытнее описание, тем интереснее получится итоговый арт. Подобные махинации позволяют управлять настроением картинки. Зрелище, когда нейросеть с точностью до мелочей воплощает твой замысел, заслуживает истинного уважения.

Каким должен быть стиль?

Стиль – это изюминка, которая превращает набор объектов в произведение искусства. Выбор здесь грандиозный. Первый и самый популярный вариант – фотореализм. Для его достижения в промт добавляют такие маркеры, как «photorealistic», «hyperdetailed», «8K», «shot on Canon EOS 5D Mark IV with 50mm f/1.8 lens». Это заставляет модель имитировать снимок, сделанный на профессиональную фотокамеру. Выглядит впечатляюще.

Далее следует цифровое искусство. Здесь можно указать стиль конкретного художника («in the style of Greg Rutkowski» или «art by Alphonse Mucha») либо общее направление («fantasy art», «concept art», «steampunk», «synthwave»). Кроме того, можно задать технические параметры, которые напрямую влияют на визуальное восприятие. К таким относятся, например, «Unreal Engine 5», «Octane Render», «cinematic lighting». Подобные уточнения дают нейросети понять, какой тип графики вы хотите получить – как в видеоигре или как в голливудском фильме. Не стоит перебарщивать, смешивая сразу пять разных художников. Лучше выбрать одного-двух, чей стиль вам действительно импонирует.

Все топовые нейросети в одном месте

Неочевидные фишки для работы с YandexART

Есть и свои подводные камни, а точнее – полезные команды. К примеру, управление ракурсом. Добавив в промт «close-up shot» (крупный план), «full-body shot» (в полный рост) или «drone shot» (вид с дрона), вы можете контролировать композицию кадра. Это же правило касается и освещения – «dramatic lighting» создаст контрастную и напряжённую атмосферу, а «soft morning light» сделает картинку нежной и спокойной.

Ну и, конечно же, негативные промты. Это спасательный круг в ситуациях, когда модель упорно добавляет на изображение что-то лишнее. Команда «—no» позволяет исключить нежелательные элементы. Довольно часто её используют для удаления текста, водяных знаков или деформаций. Пример:

«A cute fluffy cat, cinematic lighting, hyperdetailed —no text, —no watermark, —no ugly, —no deformed hands»

Также стоит помнить про соотношение сторон, которое задаётся командой «—ar» (например, «—ar 16:9» для горизонтального изображения или «—ar 9:16» для вертикального).

Эксперименты с комбинациями этих элементов – ключ к созданию настоящих шедевров. Не бойтесь пробовать, менять детали и оттачивать формулировки. Удачи в ваших творческих поисках.