Ограничения нейросетей: работает ли промт для порно-оживления фото в Алисе

В сети представлено множество руководств и готовых промтов, обещающих раскрыть весь потенциал генеративных нейросетей. Пользователи по всему миру ежедневно пытаются нащупать границы дозволенного, обойти внутренние фильтры и заставить ИИ создавать то, на что он, по задумке разработчиков, не способен. Поэтому неудивительно, что одним из главных полигонов для таких экспериментов стала генерация контента для взрослых. А начать стоит с разбора того, почему это в принципе стало проблемой.

Почему Алиса (и другие) так боятся NSFW?

Многие обыватели считают, что ограничения на генерацию контента 18+ — это исключительно вопрос морали и этики. На самом деле, львиная доля причин лежит в юридической и коммерческой плоскостях. Задача не из лёгких. Во-первых, любая крупная корпорация, будь то Яндекс, Google или OpenAI, несёт ответственность за продукт, который выпускает на рынок. Репутационные риски. Грандиозный скандал, связанный с использованием их технологий для создания дипфейков или иного противоправного контента, может обрушить акции и отпугнуть инвесторов. Это серьёзное вложение, и никто не хочет его терять.

Во-вторых, существует законодательство. В разных странах оно трактует деликатные темы по-своему, и универсальный продукт должен соответствовать самым строгим нормам, чтобы не нарваться на многомиллионные иски. К тому же, есть проблема с авторскими правами на обучающие данные. Ведь если в датасете для обучения модели были изображения, защищённые авторским правом (а они там точно были), то сгенерированный контент может стать предметом судебного разбирательства. Ну и, конечно же, не стоит забывать о защите несовершеннолетних, что для любой публичной компании — постулат номер один.

Технические барьеры: как это работает?

Чтобы понять, почему заветный промт не срабатывает, нужно немного окунуться в механику работы моделей. Дело в том, что система безопасности у них многоуровневая. Это не просто список запрещённых слов. Первый и самый простой рубеж — это входной фильтр запросов. Он отсекает очевидные маркеры, связанные с насилием, ненавистью и, разумеется, порнографией. Этот фильтр довольно легко обмануть синонимами или эвфемизмами, но дальше всё становится сложнее.

Все топовые нейросети в одной подписке! 🚀

Устали оплачивать десятки сервисов отдельно и постоянно включать VPN? Появилась платформа, которая объединяет более 90 передовых ИИ в одном окне. Пишите тексты с новейшими версиями GPT и Claude, создавайте шедевры в Midjourney и генерируйте видео в Sora и Kling. Тексты, изображения, видео и музыка — всё работает на любых устройствах без «танцев с бубном».

Попробуйте бесплатно прямо сейчас! Переходите по ссылке и получите бонусные токены для старта 👉 https://clck.ru/3RNCRL

Основная защита вшита в саму модель на этапе её обучения и дообучения (fine-tuning). На страже корпоративной этики стоят специально натренированные классификаторы, которые анализируют не только текст промта, но и семантическую суть запроса. То есть, даже если вы подберёте максимально нейтральные слова, но их совокупность будет намекать на запретную тему, система, скорее всего, поднимет красный флаг. К тому же, сами обучающие датасеты проходят скрупулёзную очистку. Из них целенаправленно удаляется львиная доля откровенного контента, чтобы модель исконно не «знала», как его генерировать. Ну и, наконец, есть фильтр на выходе, который анализирует уже готовое изображение перед тем, как показать его пользователю. Получается такой добротный тройной кордон.

Промт-инжиниринг: попытки обхода

И всё же энтузиасты не сдаются. Какие же махинации они придумывают? Первый и самый очевидный пласт попыток — замена «опасных» слов на более мягкие аналоги. Вместо прямолинейных терминов используются запросы вроде:

девушка в бикини на пляже, чувственный взгляд, мокрые волосы, художественный свет

Иногда это даёт некоторый результат, но чаще всего Алиса или другая подобная модель нарисует вполне невинную пляжную сцену. Сгенерировать откровенную сцену в лоб такой запрос не позволит.

Следующий уровень — игра в эвфемизмы и культурные коды. Пользователи пытаются замаскировать запрос под искусство или исторический контекст. Например, промт может выглядеть так:

woman in revealing classical greek chiton, translucent fabric, artistic nude, style of Bouguereau, sfw

Идея в том, чтобы заставить нейросеть думать, что речь идёт о высоком искусстве, где нагота допустима. Иногда это срабатывает, но результат получается довольно непредсказуемым и чаще всего тяготеет к классической живописи, а не к фотографии. Что насчёт так называемого «оживления»? Здесь всё ещё сложнее. Анимационные модели (такие как те, что встроены в некоторые приложения) обычно имеют ещё более жёсткие фильтры, так как видеоконтент контролировать труднее. Заставить статичное фото двигаться в откровенной манере с помощью публичных инструментов практически невозможно.

Более хитрые махинации предполагают использование сложных, многосоставных промтов с указанием конкретных художников, работающих в жанре эротики, но не пересекающих черту порнографии. К слову, это тоже работает через раз. Часто нейросеть просто игнорирует «опасную» часть запроса, сосредотачиваясь на стилистике. Например, в промте:

photorealistic portrait of a woman, alluring gaze, wearing intricate lingerie, style of Helmut Newton, dramatic lighting

модель, скорее всего, ухватится за Хельмута Ньютона и выдаст стильный чёрно-белый снимок, но без излишней откровенности.

Стоит ли игра свеч?

На самом деле, игра в «кошки-мышки» с цензурой крупных моделей — процесс довольно утомительный и редко приносящий желаемый результат. С одной стороны, это подстёгивает изобретательность и заставляет глубже разбираться в механике работы ИИ. С другой — разработчики тоже не сидят на месте. Они постоянно обновляют фильтры, анализируя попытки обхода, и лазейки, которые работали вчера, сегодня уже могут быть закрыты. Нужно отметить, что на каждый хитрый промт со временем находится свой контрприём.

Не стоит тратить часы на подбор синонимов и эвфемизмов в надежде обмануть систему, которая изначально создавалась с мощными механизмами защиты. Это похоже на попытку пробить бетонную стену головой. Возможно, однажды и получится, но затраченные усилия вряд ли будут соразмерны полученному эффекту. Тем более что существуют и другие пути.

Альтернативные площадки: где нет цензуры?

Основная причина жёстких ограничений — централизация и корпоративная ответственность. Однако мир нейросетей не ограничивается продуктами IT-гигантов. Существует целая вселенная open-source моделей, и главный её представитель — Stable Diffusion. Вся суть в том, что вы можете установить эту нейросеть локально, на свой собственный компьютер. А это кардинально меняет дело.

Раз модель работает на вашем железе, вы полностью контролируете процесс. Нет никаких внешних фильтров, никакой корпоративной цензуры. Вы можете скачивать и использовать любые датасеты, дообученные на специфическом контенте (включая NSFW), и генерировать всё, что позволяет ваша фантазия и мощность видеокарты. Именно на таких площадках, как Civitai, энтузиасты делятся моделями и промтами для создания контента для взрослых. Разумеется, это требует определённых технических знаний и довольно мощного компьютера, но результат будет на порядок ближе к тому, чего добиваются пользователи, пытающиеся «взломать» Алису.

В любом случае, скрупулёзный подход к составлению промтов — это навык, который пригодится в любой сфере, даже если вы не собираетесь генерировать ничего провокационного. Удачи в экспериментах.

Почему Алиса (и другие) так боятся NSFW?

Технические барьеры: как это работает?

Все топовые нейросети в одной подписке! 🚀

Промт-инжиниринг: попытки обхода

Стоит ли игра свеч?

Альтернативные площадки: где нет цензуры?

Статьи по теме

Промт для реалистичной кожи (с примерами готовых промтов)

Сколько стоит подписка нано банана про

Нано банана инструкция

Промты для написания дипломной работы