Промт для нейронки (с примерами готовых промтов)

Знакомо ли вам то чувство лёгкого разочарования, когда расхваленный искусственный интеллект выдает в ответ на запрос нечто среднее между бредом сумасшедшего и сухой энциклопедической справкой? В сети представлено множество восторженных отзывов о том, как нейросети пишут дипломы и создают шедевры живописи, но на практике первая попытка часто оборачивается провалом. И дело здесь вовсе не в «глупости» алгоритма, как может показаться на первый взгляд. Проблема кроется в коммуникационном барьере между человеком и машиной, ведь ИИ, при всей своей мощи, лишён способности читать мысли и понимать контекст без прямых указаний. А значит, чтобы получить добротный результат, нужно освоить искусство составления запросов.

Что такое промт?

Технически промт — это входные данные, текстовая инструкция, которую пользователь «скармливает» модели для получения ответа. Однако воспринимать его стоит глубже. Это своего рода техническое задание, переведённое на понятный машине язык. Если вы скажете дизайнеру «сделай красиво», результат вас вряд ли обрадует. То же самое происходит и с нейросетью. Промт служит тем самым мостиком, который соединяет ваше абстрактное желание с конкретными возможностями вычислительных мощностей. Это не просто набор слов. Это код, программирующий поведение модели в конкретном диалоге. И от того, насколько точно вы подберёте ключи, зависит львиная доля успеха.

Из чего состоит идеальный запрос?

Сложно ли составить работающую инструкцию? Довольно просто, если знать базовую формулу. Скелет любого качественного промта держится на трёх китах, и игнорировать хотя бы один из них не стоит. Первым делом нужно задать роль. Нейросеть — это актёр, способный сыграть кого угодно: от школьного учителя физики до циничного стендап-комика. Без указания роли (Persona) ответы будут усреднёнными и пресными. Далее следует чёткая задача. Глаголы действия здесь работают лучше всего: напиши, проанализируй, составь, нарисуй. Ну и, наконец, контекст и ограничения. Именно здесь отсекается всё лишнее. Вы должны объяснить машине, для кого создаётся контент, в каком стиле он должен быть выдержан и какой объём допустим.

Примеры для работы с текстом

Допустим, перед вами стоит задача написать пост для социальных сетей о пользе утренней зарядки. Обыватель напишет: «Напиши пост про зарядку». И получит скучный набор банальностей про здоровье. Опытный же промпт-инженер (довольно новая, но востребованная профессия) поступит иначе.

Звучать запрос будет примерно так.

«Действуй как опытный фитнес-тренер с отличным чувством юмора. Твоя целевая аудитория — офисные работники, которые ненавидят рано вставать. Напиши короткий, мотивирующий пост для Telegram о том, почему 5 минут зарядки лучше, чем литр кофе. Избегай клише вроде «в здоровом теле здоровый дух». Используй сленг, понятный миллениалам, и добавь в конце призыв к действию. Объём — не более 1000 знаков».

Разница будет колоссальной. В первом случае вы получите сухую лекцию, во втором — живой текст, который захочется дочитать. Кстати, этот же принцип работает и для более сложных задач, например, деловой переписки. Вместо «ответь клиенту на жалобу», стоит написать:

«Ты — менеджер по работе с ключевыми клиентами в люксовом сегменте. Нам пришла жалоба на задержку доставки. Напиши вежливый, эмпатичный ответ, признай ошибку, но не теряй достоинства компании. Предложи скидку в 10% на следующий заказ в качестве извинения. Тон должен быть официальным, но тёплым».

Генерация изображений: Midjourney и Stable Diffusion

С визуальным контентом дела обстоят несколько сложнее. Здесь машине нужно объяснить не смысл, а картинку, которую вы видите в голове. И если текстовые модели ещё могут «додумать» за вас, то графические понимают всё буквально. Главное — описывать объект, стиль, освещение и композицию.

Простой пример запроса для генерации портрета мог бы выглядеть так.

«Фотореалистичный портрет пожилого рыбака, крупный план. Лицо в глубоких морщинах, обветренная кожа, взгляд устремлён вдаль. Освещение — золотой час (закат), мягкий тёплый свет падает сбоку. Фон — размытое штормовое море. Стиль — кинематографичный, высокая детализация, 8k, снято на 35mm объектив».

Без уточнения про объектив и свет нейросеть могла бы нарисовать просто мультяшного деда с удочкой.

А вот для любителей фантастики подойдёт другой вариант.

«Киберпанк-город будущего, вид с высоты птичьего полёта. Неоновые вывески с иероглифами отражаются в мокром асфальте. Летающие автомобили в потоке трафика. Цветовая палитра — фиолетовый и бирюзовый (cyan and magenta). Атмосфера нуара, дождь, туман. Стиль — как в фильме «Бегущий по лезвию 2049», гиперреализм».

Заметьте, здесь мы используем референсы к известным произведениям — это отличный способ задать нужный антураж.

Почему нейросеть «галлюцинирует»?

Бывает ли так, что даже с хорошим промтом результат оставляет желать лучшего? Безусловно. И часто виной тому перегруженность запроса. Если вы попытаетесь впихнуть в одно предложение требование написать научную диссертацию в стихах, используя сленг 19-го века, модель просто «сойдёт с ума». Противоречивые инструкции — главный враг качества. Не стоит просить быть «кратким, но очень подробным» одновременно. Лучше разбить задачу на итерации. Сначала попросите составить план, затем — написать введение, и так далее. Пошаговая генерация (Chain of Thought) творит чудеса там, где одномоментный наскок терпит неудачу.

Хитрости и неочевидные приёмы

Существует несколько неочевидных техник, которые позволяют выжать из нейронки максимум. Одна из них — просьба задать вопросы. Добавьте в конец своего промта фразу: «Если тебе не хватает информации для идеального выполнения задачи, задай мне наводящие вопросы перед тем, как начать». Это перевернёт игру. Модель сама подскажет, какие нюансы вы упустили.

Другой интересный приём — использование «few-shot prompting». Суть его в том, чтобы дать модели примеры того, как нужно делать. Не просто «придумай слоганы», а «вот три примера удачных слоганов моего бренда, придумай ещё пять в таком же стиле». Наличие референсов (образцов) резко повышает точность попадания в тональность.

Также не стоит забывать про параметр «температуры» (хотя в чат-интерфейсах он скрыт, его можно эмулировать словами). Если вам нужен креатив и безумие, добавьте в промт слова «будь непредсказуемым», «используй нестандартные метафоры», «сделай сюрреалистично». Если же нужна точность — требуйте «фактологической строгости» и «сухого академического языка».

Английский или русский?

Есть один нюанс, о котором часто забывают. Большинство передовых моделей (тот же GPT-4 или Midjourney) обучались преимущественно на англоязычном контенте. Кладезь знаний на английском несоизмеримо больше. Поэтому, если задача сложная и требует глубокого погружения в специфическую тему, имеет смысл писать промт на английском языке (даже через переводчик), а в конце добавлять: «Output in Russian». Довольно часто это повышает качество логических рассуждений модели. Впрочем, для бытовых задач и копирайтинга современные русифицированные версии справляются на ура.

Стоит ли покупать готовые базы промтов?

В интернете сейчас процветает торговля огромными таблицами с «готовыми промтами на все случаи жизни». Бьёт по бюджету это не сильно, но есть ли в этом смысл? С одной стороны, это может послужить источником вдохновения. Подсмотреть структуру, найти интересные прилагательные для генерации картинок — почему бы и нет. С другой стороны, чужой промт — это чужое видение. Слепое копирование редко даёт тот самый, нужный именно вам результат.

Гораздо эффективнее создать собственную «библиотеку», заточенную под ваши нужды. Начните с сохранения удачных формулировок. Заметили, что фраза «объясни так, будто мне 5 лет» отлично помогает разобраться в квантовой физике? Сохраните её. Увидели, что добавление «стиль Wes Anderson» делает картинку симметричной и пастельной? В копилку. Со временем у вас наберётся внушительный арсенал, который будет работать лучше любой покупной базы.

Ошибки, которые убивают результат

Чего точно делать не стоит, так это общаться с нейросетью как с поисковиком. Запросы вроде «рецепт борща» дадут вам рецепт, но он будет усреднённым. А вот:

«Я хочу удивить тёщу, которая считает, что я не умею готовить; дай рецепт изысканного борща с необычным ингредиентом (например, черносливом) и распиши пошагово, чтобы я не облажался»

…это уже заявка на успех.

Ещё одна распространённая ошибка — отсутствие итераций. Получив первый ответ, многие машут рукой: «Ай, ерунда какая-то». Но работа с нейросетью — это диалог. Напишите ей: «В целом неплохо, но второй абзац слишком затянут, а шутка в конце неуместна. Перепиши, сделав акцент на выгоде для клиента». Правки — это нормальный рабочий процесс, а не признак некомпетентности машины.

Роль отрицательных промтов (Negative Prompts)

В генерации изображений существует понятие негативного промта — того, чего на картинке быть не должно. Это спасательный круг для тех, кто устал от артефактов. Обычно туда вписывают: «много пальцев», «размытость», «водяные знаки», «плохая анатомия», «низкое качество». В текстовых моделях это реализуется через ограничивающие инструкции: «не используй вводные слова», «не пиши вступление, переходи сразу к сути», «не упоминай конкурентов». Умение сказать «нет» так же важно, как и умение сказать «да».

Этическая сторона и авторство

Погружаясь в мир промт-инжиниринга, невольно задумываешься: а кто же автор конечного продукта? Формально, текст или картинку создала машина. Но без вашей идеи, без ваших правок и, главное, без вашего вкуса, этот результат никогда бы не появился на свет. Вы выступаете в роли дирижёра, а нейросеть — лишь оркестр. И хотя инструменты становятся всё мощнее, первая скрипка всё равно остаётся за человеком.

К слову, многие боятся, что ИИ заменит творцов. Однако, глядя на то, как сложно порой составить действительно хороший промт, понимаешь: заменит не ИИ, а человек, умеющий им пользоваться. Это просто новый уровень грамотности, такой же, как умение пользоваться Word или Excel двадцать лет назад.

Эксперименты как путь к мастерству

Нет единого учебника, в котором были бы прописаны все законы общения с искусственным интеллектом. Эта сфера меняется с такой скоростью, что любые жёсткие постулаты устаревают через месяц. Единственный верный путь — эксперимент. Пробуйте разные стили, меняйте местами блоки в промте, играйте с синонимами. Иногда замена одного слова, например, «расскажи» на «поведай», кардинально меняет тональность ответа.

Пробуйте смешивать несовместимое. Попросите нейросеть описать устройство двигателя внутреннего сгорания в стиле хокку. Или нарисовать персонажей «Гарри Поттера» в стилистике советских мультфильмов. Именно в таких, казалось бы, абсурдных задачах и раскрывается истинный потенциал технологии. Вы натыкаетесь на неожиданные решения, которые потом можно адаптировать под рабочие задачи.

В конечном счёте, навык написания промтов — это инвестиция в вашу личную эффективность. Это возможность делегировать рутину и освободить время для того, что действительно важно. И пусть первые попытки будут корявыми, а диалоги с машиной — странными. Со временем вы нащупаете тот самый общий язык, и этот цифровой помощник станет мощнейшим инструментом в ваших руках, который сэкономит сотни часов и миллионы нервных клеток.