Каждый, кто хоть раз пытался создать шедевр с помощью нейросетей, сталкивался с разочарованием: вместо изящной красавицы на экране появляется существо с шестью пальцами, а величественный пейзаж портит нелепая размытость или внезапно возникшая водяная марка. Казалось бы, запрос составлен идеально, слова подобраны скрупулезно, но результат всё равно оставляет желать лучшего, вызывая лишь недоумение и досаду. Искусственный интеллект, при всей своей мощи, порой ведет себя как капризный ребёнок, который понимает задачу слишком буквально или, наоборот, добавляет отсебятину там, где это совсем не нужно. Многие новички в этот момент опускают руки, считая, что магия генерации им неподвластна, или начинают хаотично перебирать настройки. Однако секрет чистого и качественного изображения кроется не столько в том, что вы просите нарисовать, сколько в том, что вы запрещаете. А значит, стоит детально разобраться с инструментом, который способен превратить цифровой хаос в искусство.
Что такое негативный промт?
По сути, это фильтр, отсекающий всё лишнее. Если обычный запрос говорит нейросети, куда двигаться, то негативный (Negative Prompt) ставит жёсткие барьеры, указывая, куда заходить категорически запрещено. Сложно ли это для понимания? Вовсе нет. Представьте, что вы заказываете скульптору статую и уточняете: «Только не делай её из глины и не приделывай ей третью руку». В мире алгоритмов Stable Diffusion или Midjourney это работает именно так. Нейросеть воспринимает ваши слова как векторы в многомерном пространстве, и негативный промт просто вычитает ненужные векторы из итоговой формулы. Без этого уточнения модель, обученная на миллиардах картинок из интернета, будет тащить в вашу работу весь «цифровой шум», который ей когда-либо попадался: от артефактов сжатия до случайных подписей. Игнорировать это поле — значит добровольно согласиться на «среднюю температуру по больнице», которая довольно часто оказывается удручающей.
Базовый набор «мусора»
Начинать очистку генерации стоит с удаления технических дефектов. Дело в том, что обучающие датасеты — это настоящий кладезь не только шедевров, но и картинок ужасного качества, маленького разрешения или просто неудачных скетчей. Чтобы нейросеть не вздумала подражать этим плохим примерам, опытные пользователи используют проверенный набор стоп-слов. Обычно строка начинается с общих понятий, обозначающих низкое качество. К слову, универсальная формула часто выглядит так:
ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face
Вписывая эти слова, вы словно говорите машине: «Забудь все те плохие картинки, которые ты видела». Это своего рода фундамент, на котором будет строиться всё остальное здание вашей генерации. И этот фундамент должен быть добротным.
Проблема анатомии
Руки, ноги и глаза — это, пожалуй, главная головная боль любого «нейрохудожника». Искусственный интеллект до сих пор с трудом понимает концепцию того, что у человека должно быть ровно пять пальцев, а руки не могут расти из ушей. Бороться с этим сложно, но можно. Для портретов и изображений людей существует отдельная каста негативных токенов, призванных минимизировать риск мутаций. Вам обязательно пригодятся такие слова, как:
mutation, mutated, extra fingers, cast, floating limbs, disconnected limbs, malformed hands, blurry, missing limb, missing bodies, crossed eyes
Разумеется, это не дает стопроцентной гарантии (нейросети всё же непредсказуемы), но вероятность получить монстра снижается в разы. Тем более, что алгоритм начнет старательнее прорисовывать детали, если ему прямо запретить делать их размытыми или деформированными. А если ещё добавить long neck или mutated hands, то результат порадует вас куда больше.
Универсальные решения для реализма
Если ваша цель — фотореализм, то список запретов придется значительно расширить. Ведь нейросеть, предоставленная сама себе, очень любит скатываться в мультипликацию, 3D-рендеры или масляную живопись. Чтобы удержать её в рамках реальности, нужно отсечь всё искусственное. Хорошо работает такая комбинация:
cartoon, 3d, (disfigured), (bad art), (deformed), (poorly drawn), (extra limbs), (close up), b&w, weird colors, blurry, sketch, lackluster, face focus, render, cgi, anime, painting, drawing
Обратите внимание на скобки — они усиливают вес слова, заставляя нейросеть обращать на него особое внимание. Использование скобок — это тонкий нюанс, позволяющий регулировать степень влияния того или иного запрета. Чем больше скобок, тем строже запрет. Но перебарщивать не стоит, иначе картинка может просто рассыпаться на шумы.
Работа с текстом и логотипами
В сети представлено множество изображений с водяными знаками, подписями авторов и рекламными надписями. И нейросеть, в своей наивной простоте, считает это частью композиции. Нередко на идеально сгенерированном пейзаже вдруг всплывают непонятные закорючки в углу. Чтобы этого избежать, в негативный промт обязательно нужно внести блок, отвечающий за текстовый мусор. Выглядит это примерно так:
text, watermark, logo, banner, extra digits, cropped, jpeg artifacts, signature, username, error, sketch, duplicate, ugly, monochrome, horror, geometry, mutation, disgusting
Эти слова действуют как ластик, стирая даже намеки на типографику. К тому же, это спасает от появления странных рамок или эффекта «обрезанной» картинки, когда персонажу срезает половину головы верхней границей кадра. Ведь нет ничего обиднее, чем получить идеальную композицию, испорченную случайным набором букв.
Готовые примеры промтов
Составлять негативный запрос с нуля каждый раз — занятие утомительное и неблагодарное. Гораздо проще иметь под рукой несколько заготовок для разных задач. Для создания классического красивого портрета девушки в стиле цифровой живописи можно использовать такой внушительный блок:
pubic hair, 3d render, cartoon, anime, sketch, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name, nsfw, broken limbs, missing arms, missing legs
Этот набор охватывает сразу все болевые точки: от анатомии до качества файла. Он довольно универсален и подходит для большинства моделей, будь то Stable Diffusion 1.5 или более современные версии XL.
А вот если вы генерируете сложную архитектуру или интерьеры, акценты стоит сместить. Здесь важнее геометрия и четкость линий. Попробуйте такой вариант:
blurry, depth of field, low quality, distortion, curvature, fish eye, lens flare, overexposed, underexposed, dark, gloomy, horror, scary, messy, cluttered, dirt, dust, broken, ruined, rubble
В данном случае мы запрещаем не столько анатомические ошибки (у зданий нет рук), сколько визуальные искажения, характерные для плохой оптики или неудачного освещения. Такой подход позволяет получить чистые, звонкие линии и правильную перспективу. Ну и, конечно же, никто не запрещает комбинировать части разных промтов, создавая свой уникальный «коктейль».
Текстурные инверсии (Embeddings)
Продвинутые пользователи часто идут ещё дальше и используют так называемые “текстурные инверсии” или эмбеддинги. Это специальные маленькие файлы, в которых уже “зашита” информация о том, что такое плохо. Вместо того чтобы писать пятьдесят слов про плохие руки, вы пишете одно слово-триггер, например, EasyNegative или BadDream. Это существенно экономит место в строке запроса и часто дает более стабильный результат. Работает это просто: сообщество энтузиастов уже обучило нейросеть на тысячах примеров того, как “не надо” рисовать, и упаковало это знание в один файл. Использование таких помощников — это настоящий спасательный круг для тех, кто не хочет возиться с огромными полотнами текста. Самые популярные из них: EasyNegative, DeepNegative, bad-hands-5, bad-artist. Впрочем, слепо полагаться только на них не стоит — иногда ручная настройка дает более точный контроль.
Нужно ли писать “Войну и мир”?
Бытует мнение, что чем длиннее негативный промт, тем лучше результат. Многие просто копируют огромные “простыни” текста, найденные на форумах, даже не читая их. Правильно ли это? Скорее нет, чем да. Перегруженный промт может запутать нейросеть, и она начнет игнорировать важные вещи. Лучше действовать точечно. Если вы видите, что картинка получается слишком темной, добавьте dark, shadows, low light. Если цвета слишком ядовитые — впишите saturated, acid colors, neon. Ваш негативный промт должен быть живым инструментом, который меняется в зависимости от задачи, а не застывшим монументом. Ведь лишние токены, которые не относятся к делу, просто создают вычислительный шум.
Стилистические запреты
Иногда задача состоит не в том, чтобы улучшить качество, а в том, чтобы убрать определенный стиль. Например, вы хотите получить чёрно-белый рисунок карандашом, но модель упорно красит его в цвета. В таком случае в негативный промт смело отправляются: color, realistic, photo, 3d, render, bright colors. Или обратная ситуация: вам нужен мрачный готический замок, а нейросеть рисует солнечную лужайку. Тогда пишем: sun, daylight, bright, happy, blue sky, flowers. Это мощнейший рычаг управления атмосферой, о котором часто забывают. Меняя только негативный промт, можно кардинально изменить настроение кадра, не трогая при этом основное описание. Это открывает огромный простор для экспериментов и позволяет тонко настраивать антураж сцены.
Освещение и композиция
Плохой свет способен убить даже самую гениальную задумку. Часто генерации страдают от плоских теней или засвеченных участков. Чтобы придать объём и глубину, стоит исключить плоские решения. Добавьте в список исключений: flat lighting, flat color, boring, simple background, plain background. Это заставит алгоритм искать более интересные световые схемы и прорабатывать задний план. А если вы хотите избежать эффекта, когда лицо персонажа находится слишком далеко или, наоборот, упирается носом в камеру, используйте слова close up, wide shot, long shot (в зависимости от того, что именно вам НЕ нужно). Управление композицией через отрицание — метод неочевидный, но крайне эффективный.
Главное — эксперимент
Поиск идеального негативного промта — это путь проб и ошибок. Не существует волшебной таблетки, которая работала бы одинаково хорошо для всех моделей и всех сюжетов. То, что отлично работает в одной версии Stable Diffusion, может совершенно испортить картинку в другой. Поэтому не бойтесь менять слова местами, удалять лишнее и добавлять свои наблюдения. Создайте свой личный “черный список”, который будет отвечать именно вашим эстетическим требованиям. Ведь нейросеть — это всего лишь инструмент, и только от мастера зависит, какой результат он выдаст. Удачи в укрощении строптивых алгоритмов, и пусть ваши генерации всегда будут чистыми, а персонажи — анатомически правильными!