Мир генеративного искусства с каждым днём становится всё более детализированным, и желание пользователей контролировать каждый пиксель изображения вполне объяснимо. Вопрос создания анатомически корректных тел или изменения гардероба персонажа (вплоть до его полного отсутствия) — одна из самых горячих тем на профильных форумах и в сообществах нейрохудожников. Часто за этим скрывается не столько желание получить «клубничку», сколько стремление освоить сложные техники Inpainting (перерисовки) или добиться реализма, который недоступен обычным фильтрам. Ведь правильно настроить нейросеть на работу с кожей и анатомией — это задача, требующая, пожалуй, скрупулезного подхода и глубокого понимания механики токенов. А начать стоит с разбора того, как именно алгоритм воспринимает запрос на отсутствие одежды.
Как работает нейросеть?
Думает ли искусственный интеллект категориями стыда или приличия? Разумеется, нет. Для модели Stable Diffusion или Midjourney (с оговорками на цензуру) человеческое тело — это просто набор геометрических форм, текстур и светотеневых переходов. Когда вы вводите запрос на «раздевание» или создание обнаженной натуры, система обращается к своему латентному пространству, где хранятся миллионы паттернов, связывающих слова с визуальными образами. Сложность тут заключается в том, что нейросеть довольно часто пытается «прикрыть» наготу, если веса токенов расставлены неверно, или же выдает пластиковые, неестественные тела. Главное — это баланс. С одной стороны, нужно четко дать понять алгоритму, что одежды быть не должно, а с другой — описать то, что должно появиться вместо неё. И здесь на сцену выходят не только сами промты, но и технические настройки.
Инструментарий цифрового художника
Просто написать текст — это лишь полдела. Львиная доля успеха в процессе «раздевания» существующего изображения лежит на функции Inpainting. Это инструмент, позволяющий закрасить маской определенную область (например, футболку) и приказать нейросети перерисовать только её, оставив лицо и фон нетронутыми. К слову, критически важным параметром здесь является Denoising Strength (сила шумоподавления). Если выставить его слишком низким (менее 0.5), нейросеть будет видеть контуры одежды и просто перекрасит ткань в телесный цвет. Зрелище удручающее. Чтобы получить полноценную анатомию, параметр стоит выкручивать до 0.7–1.0. Кроме того, огромную роль играют модели Checkpoints. Стандартные версии часто «заблюривают» пикантные детали, поэтому опытные пользователи тяготеют к специализированным моделям, обученным на анатомии (например, на базе SDXL или Pony Diffusion). Ну и, наконец, нельзя не упомянуть LoRA — небольшие надстройки, которые помогают сети понять конкретные позы или типы фигур.
Из чего состоит правильный запрос?
Формула успеха выглядит довольно просто, но дьявол, как водится, кроется в деталях. Базовая структура промта для генерации или инпейнтинга тела без одежды должна включать в себя блок с прямым указанием, блок описания анатомии и блок технического качества. Первый и самый очевидный шаг — использование токенов nude, naked, no clothes. Однако ограничиваться ими не стоит. Нейросеть лучше понимает контекст, если добавить уточнения вроде full body exposed или bare skin. Далее следует описание самой кожи. Без этого вы рискуете получить манекен. Используйте связки detailed skin texture, hyperrealistic skin, pores, veins, mole. Это добавит живости. И, конечно же, технические теги: 8k, raw photo, masterpiece. Они подтягивают общее качество картинки, делая анатомию более проработанной.
Примеры готовых промтов: Реализм
Для тех, кто стремится к фотографическому качеству, запрос должен быть максимально сухим и техничным. Представьте, что вы настраиваете камеру. Хороший, добротный промт для генерации реалистичной модели может выглядеть следующим образом. В начале строки прописываем объект и действие: photo of a beautiful woman, looking at viewer, standing in bedroom, naked, nude, full body exposure. Затем мгновенно добавляем блок качества: raw photo, dslr, soft lighting, high quality, film grain, Fujifilm XT3. И обязательно заполировываем текстурными токенами: intricate skin detail, goosebumps, realistic anatomy, natural body. Такой подход творит чудеса, особенно если использовать реалистичные чекпоинты вроде Juggernaut или Realistic Vision. Важный нюанс: при инпейнтинге (замене одежды) в поле промта лучше оставлять только описание тела, убирая упоминания лица или фона, чтобы не сбить нейросеть с толку.
Примеры готовых промтов: Аниме и 2.5D
Стилизация требует иного лексикона. Здесь бал правят теги, описывающие художественный стиль, а не параметры фотоаппарата. Если ваша цель — персонаж в стиле аниме, запрос претерпевает изменения. Начинаем с тегов качества, характерных для Danbooru (базы данных, на которой училось большинство аниме-моделей): masterpiece, best quality, highres, 1girl, solo. Далее переходим к сути: nude, nipples, pussy, navel, collarbone. Да, в аниме-моделях (особенно типа Pony V6) требуется называть вещи своими именами, довольно грубо и прямо, иначе сеть может «не понять» намёка. Дополняет образ описание освещения и композиции: cinematic lighting, dynamic angle, blushing, detailed eyes. А вот слова вроде photorealistic здесь могут только навредить, превратив изображение в жутковатый гибрид 2D и 3D.
Negative Prompt: Что исключить?
Зачастую то, чего в кадре быть не должно, важнее того, что вы там хотите видеть. Негативный промт — это ваш спасательный круг. В первую очередь туда отправляется сама одежда. Пишем: clothes, dress, bra, panties, swimsuit, lingerie, bikini. Казалось бы, логично? Но этого мало. Обязательно добавьте censorship, bar_censor, mosaic, так как многие модели обучались на цензурированных картинках и могут по привычке добавить размытие или чёрные полосы. Отдельно стоит упомянуть анатомические ошибки. Стандартный набор bad anatomy, bad hands, missing fingers, extra limbs, mutated должен присутствовать в каждом запросе по умолчанию. Также не забудьте про plastic skin, doll, cartoon (если вы делаете реализм), чтобы кожа не выглядела как винил.
Нюансы работы с Inpainting
Процесс «раздевания» на готовом фото — это, по сути, махинация с пикселями, и она требует терпения. Загрузив фото в Stable Diffusion (вкладка img2img -> Inpainting), вы закрашиваете кистью одежду. Но есть хитрость. В настройках есть параметр Masked content (содержимое маски). Если выбрать Original, нейросеть будет пытаться сделать кожу, похожую по цвету на одежду, которую вы закрасили. Это часто приводит к артефактам. Лучше выбрать вариант Latent Noise или Fill. В этом случае алгоритм генерирует содержимое с нуля, ориентируясь только на ваш промт и окружающие пиксели тела. Это позволяет создать совершенно новую анатомию, которая органично впишется в позу. А если результат всё равно выглядит неестественно, попробуйте добавить в промт описание позы: arms up или lying on back. Это подскажет модели, как должны располагаться мышцы и тени.
Специфический лексикон для улучшения текстуры
Чтобы тело не выглядело плоским, нужно знать «волшебные слова», добавляющие объём. Профессионалы используют такие токены, как subsurface scattering (подповерхностное рассеивание) — это эффект, когда свет немного проникает сквозь кожу, делая её живой, особенно на ушах или пальцах. Ещё один полезный термин — volumetric lighting (объёмный свет). Он создает атмосферу и подчёркивает изгибы тела. Для любителей максимальной детализации подойдет vascular (сосудистый), что добавит едва заметную сетку вен, или skin blemishes (дефекты кожи), ведь идеальная кожа бывает только у кукол. Не стоит забывать и про oiled skin или sweat, если вы хотите добавить блеска и фактурности, но с этими тегами нужно быть осторожным — переборщить довольно просто, и персонаж будет выглядеть так, словно только что вышел из душа, даже если он стоит в библиотеке.
Этический аспект: Стоит ли?
Тема генерации обнаженной натуры всегда ходит по тонкому льду. С одной стороны, художники веками изучали анатомию, и цифровой арт — лишь новый этап этой эволюции. С другой — создание дипфейков реальных людей без их согласия — это табу, которое жёстко осуждается сообществом и блокируется на уровне многих сервисов. И это правильно. Ведь технология должна служить творчеству, а не вредительству.
Поэтому, создавая свои «шедевры», лучше использовать вымышленных персонажей или абстрактные образы. Да и самим моделям (чекпоинтам) проще генерировать усреднённое красивое лицо, чем пытаться натянуть текстуру знаменитости на чужое тело. Результат в случае с реальными людьми часто получается сомнительным и вызывает эффект «зловещей долины».
Подводные камни и ошибки новичков
Самая распространённая ошибка — это «словесный салат». Новички часто копируют гигантские промты из интернета, надеясь, что количество слов перейдет в качество. Но нет. Перегруженный запрос сбивает нейросеть с толку. Если вы написали nude, не нужно добавлять через запятую naked, no clothes, unclothed, without dress. Это синонимы, и они лишь забивают контекстное окно. Лучше потратить эти токены на описание освещения или фона. Ещё один момент — конфликт стилей. Не стоит смешивать anime и photorealistic с высокими весами, если вы не добиваетесь специфического эффекта. Получится ни то ни сё. Ну и, конечно, не забывайте про разрешение. Генерировать тело в полный рост (full body) на квадрате 512×512 — плохая идея. Лицо превратится в кашу. Используйте вертикальные форматы, например, 512×768 или выше, а затем дорабатывайте лицо через Hires.Fix.
Какими бывают настройки сэмплинга?
Выбор сэмплера (алгоритма, который формирует изображение из шума) тоже влияет на то, как будет выглядеть кожа. Для реалистичной анатомии отлично подходят DPM++ 2M Karras или DPM++ SDE Karras. Они дают хорошую детализацию и довольно быстро работают. Старичок Euler a хорош для творческих экспериментов, так как даёт более мягкую, порой мечтательную картинку, но может «мылить» мелкие детали. Количество шагов (Steps) тоже имеет значение. Обычно хватает 20–30 шагов. Ставить 100 и больше — пустая трата времени, качество от этого кардинально не улучшится, а вот время генерации вырастет в разы. Тем более, что на высоких значениях шагов некоторые сэмплеры начинают «пережаривать» картинку, добавляя лишний контраст и артефакты.
Заключение эксперта
Работа с промтами для «раздевания» или создания анатомических этюдов — это отличная тренировка понимания того, как нейросеть «видит» мир. Это процесс, требующий не только знания английских терминов, но и художественного вкуса. Ведь грань между пошлостью и искусством в цифровом мире определяется буквально парой токенов и настройкой света. Экспериментируйте с текстурами, ищите идеальный свет и помните, что лучший результат получается не у тех, кто ищет кнопку «сделать красиво», а у тех, кто понимает логику инструмента. Пусть ваши генерации всегда будут высокого разрешения, а анатомия персонажей радует глаз своей естественностью!