Мир глянца десятилетиями диктовал свои условия, и, к сожалению, алгоритмы нейросетей обучались именно на этой «отполированной» реальности, где бал правят стандарты 90-60-90. Заходя в Midjourney или Stable Diffusion, обыватель часто сталкивается с тем, что искусственный интеллект упорно генерирует исключительно худых моделей, даже если запрос не содержал уточнений по комплекции. Это создает проблему для дизайнеров, художников и брендов, стремящихся к инклюзивности и реализму. Ведь красота человеческого тела не ограничивается размером XS. Однако изменить вектор генерации и получить эстетичное, «живое» изображение модели plus-size вполне реально, если знать правильные рычаги управления. А начать стоит с понимания того, как именно машина воспринимает вес и объемы.
Почему нейросети «худят»?
Сложно ли алгоритму нарисовать пышные формы? Технически — нет, но статистически он тяготеет к усредненному образу из своей базы данных. Львиная доля фотографий в обучающих датасетах (особенно в категории fashion) — это снимки стандартных моделей. Когда вы вводите слово «woman» или «model», нейросеть идет по пути наименьшего сопротивления. Она выдает то, что видела чаще всего. Это не злой умысел, а сухая математика. Поэтому, чтобы переломить этот тренд, нужно использовать довольно специфический лексикон, который «насильно» переключает внимание ИИ на другие пропорции.
Базовая терминология
Фундамент успешного промта закладывается на уровне подбора правильных прилагательных. Английский язык, на котором «думает» большинство генераторов, предлагает довольно широкий спектр терминов, и каждый из них дает свой нюанс. Самым нейтральным и распространённым вариантом считается plus size model. Это словосочетание дает предсказуемый результат, похожий на каталожную съёмку одежды больших размеров. Если же хочется добавить формам женственности и плавности, на помощь приходит слово curvy. Оно акцентирует внимание на изгибах — талии, бёдрах, груди, создавая силуэт «песочные часы».
Более смелым решением станет использование термина voluptuous. Он добавляет образу чувственности и часто используется для создания портретов в стиле пин-ап или будуарной съёмки. Для генерации действительно крупных, мощных фигур стоит попробовать слово heavyset или full-figured. Эти дескрипторы работают грубее, но эффективнее, если нужно уйти от «инстаграмной» полноты к реализму. Ну и, наконец, есть термин thick, который в сленге нейросетей часто обозначает спортивное, плотное телосложение с выраженными бёдрами. Комбинируя эти слова, можно довольно точно настроить «ползунок» веса в воображении нейросети.
Одежда и стиль
Огромную роль в восприятии фигуры играет то, во что модель одета. Не стоит забывать, что нейросеть любит обтягивать формы, если ей не дать других указаний. Для создания элегантного образа лучше указывать ткани и фасоны, которые комплиментарны пышной фигуре. Прекрасно работает wrap dress (платье с запахом), которое создает V-образный вырез и подчёркивает талию. Стоит поэкспериментировать с flowing silk dress (струящееся шёлковое платье) — такая ткань мягко драпируется, не создавая лишнего объёма, но подчёркивая статность.
А вот если цель — показать современный уличный стиль, можно использовать oversized denim jacket (джинсовая куртка оверсайз) в сочетании с leggings. Главное — следить за тем, чтобы одежда не выглядела как мешок. Добавьте в промт perfect fit (идеальная посадка) или tailored (сшитый на заказ), чтобы избежать эффекта неряшливости. Искушённый пользователь знает, что правильная одежда творит чудеса с восприятием веса на картинке.
Свет и ракурс
Свет. Именно он лепит форму. Для моделей plus-size освещение играет даже более важную роль, чем для худых. Жесткий верхний свет может создать некрасивые тени под глазами и на шее, а также подчеркнуть неровности кожи там, где это не нужно. Идеальным выбором станет softbox lighting или cinematic lighting. Мягкий, рассеянный свет сглаживает текстуру кожи и делает переходы светотени на теле плавными, «вкусными».
Ракурс тоже имеет значение. Съёмка снизу (low angle) придаёт фигуре монументальность и величие, делая ноги визуально длиннее. Этот прием часто используют для создания образов супергероинь или влиятельных бизнес-леди. А вот классический портретный ракурс на уровне глаз (eye level) создает ощущение доверительности и близости. К слову, стоит избегать широкого угла (wide angle) при съёмке портретов крупным планом, так как это может исказить пропорции лица, сделав его неестественно широким. Лучше указать фокусное расстояние портретного объектива, например, 85mm или 100mm.
Готовые сценарии: Портрет
Задача не из лёгких. Сделать красивый портрет пышной девушки, чтобы это выглядело дорого и стильно. Попробуем собрать конструкцию, которая гарантированно даст хороший результат. Начнём с описания внешности, добавим свет и детализацию.
Пример промта для фотореалистичного портрета:
Stunning portrait of a gorgeous plus size woman with freckles, curly red hair, natural makeup, soft smile, wearing elegant emerald velvet dress, standing in a library, soft cinematic lighting, depth of field, 85mm lens, hyperrealistic, 8k, highly detailed –ar 2:3
Здесь слово «gorgeous» (великолепная) задаёт позитивный тон, а «velvet» (бархат) добавляет текстуру, которая отлично смотрится на формах. Соотношение сторон 2:3 идеально подходит для вертикальных портретов.
Готовые сценарии: Фэнтези и косплей
Кто сказал, что эльфы или воительницы должны быть тростинками? Фэнтези-арт — это настоящий кладезь возможностей для боди-позитива. Однако тут есть подводные камни: нейросеть часто пытается «натянуть» стандартную броню на нестандартную фигуру, что приводит к искажениям. Секрет успеха кроется в описании самой брони или костюма.
Попробуйте следующий вариант для создания образа воительницы:
Full body shot of a powerful voluptuous viking woman warrior, wearing intricate leather armor and fur cloak, holding a heavy battle axe, standing on a snowy mountain peak, epic atmosphere, dynamic pose, wind blowing hair, stormy sky background, realistic fantasy art style, masterpiece –ar 16:9
Слова «powerful» (мощная) и «voluptuous» (пышная/чувственная) работают в связке, создавая образ сильной, крепко сбитой женщины, а не просто полной дамы в костюме. Широкий формат 16:9 добавляет эпичности.
Готовые сценарии: Лайфстайл
Повседневные сцены часто выглядят наиболее фальшиво, если не добавить в них жизни и правильного контекста. Мы хотим видеть реального человека, а не манекен. Используйте описание действий и эмоций.
Пример для уютного домашнего кадра:
Happy curvy woman sitting in a cozy armchair reading a book, wearing comfortable knitted oversized sweater and woolen socks, holding a cup of hot cocoa, morning sunlight streaming through the window, cozy interior, hygge atmosphere, candid shot, photorealistic –ar 3:2
Здесь ключевым является слово «candid» (искренний, непостановочный), которое заставляет ИИ имитировать случайный кадр, добавляя живости.
Как избежать деформаций?
Проблема с генерацией полных людей часто заключается в том, что нейросеть может «потеряться» в анатомии. Лишние пальцы, странные изгибы конечностей или «поплывшие» лица — частые спутники таких запросов. Дело в том, что алгоритму сложнее просчитать физику мягких тканей. Чтобы минимизировать этот риск, стоит использовать в промте слова, закрепляющие анатомическую правильность: anatomically correct, perfect proportions, beautiful body.
Кроме того, не скупитесь на качественные описания в негативном промте (Negative Prompt). Это то поле, куда вы вписываете всё, чего НЕ хотите видеть. Обязательно добавьте туда: deformed, distorted body, extra limbs, bad anatomy, ugly, obesity, unhealthy look. Хотя мы и генерируем полных людей, важно отсечь болезненную полноту или карикатурные пропорции, если, конечно, это не является вашей художественной целью.
Текстура кожи и реализм
Глянец приучил нас к «пластиковой» коже. Но на полных моделях отсутствие текстуры выглядит особенно неестественно. Целлюлит, растяжки, поры, родинки — всё это делает изображение живым. Ирония в том, что многие пользователи намеренно «вычищают» эти детали, получая в итоге куклу. А ведь именно несовершенства придают шарм.
Попробуйте добавить в промт такие фразы: detailed skin texture, natural skin, slight imperfections. Это даст сигналу нейросети, что не нужно «блюрить» кожу до состояния мыла.
Пример промта с упором на кожу:
Close-up portrait of a beautiful plus size woman, no makeup, natural skin texture, visible pores, hyperrealistic eyes, bathing in sunlight, raw photo style, Fujifilm XT3 style –ar 4:5
Такой запрос создаст очень интимный и честный портрет, который будет выгодно отличаться от тысяч одинаковых «глянцевых» генераций.
Ошибки новичков
Самая распространённая ошибка — это противоречивые запросы. Нельзя одновременно написать slim waist (тонкая талия) и obese (ожирение) и надеяться на адекватный результат. Нейросеть сойдёт с ума и выдаст кентавра. Будьте последовательны. Если вы хотите фигуру «песочные часы», пишите curvy hourglass figure. Если хотите равномерную полноту, используйте plussize.
Ещё один нюанс — перегрузка промта стилями. Если вы укажете одновременно «киберпанк», «ренессанс» и «аниме», результат будет непредсказуемым. Лучше выбрать один доминирующий стиль. К тому же, не стоит забывать про вес слов (в некоторых интерфейсах можно ставить скобки или коэффициенты). Если слово plus size стоит в самом конце огромного промта, его влияние может «размыться». Выносите самые важные характеристики фигуры в самое начало строки.
Работа с референсами
Иногда проще показать, чем описать. Большинство современных нейросетей поддерживают функцию Image-to-Image (генерация на основе картинки). Вы можете загрузить фото реальной модели plus-size и использовать его как основу для генерации. Это самый надёжный способ сохранить пропорции.
В промте при этом всё равно стоит продублировать описание внешности. Это поможет нейросети понять, что именно с исходной картинки нужно сохранить (фигуру), а что можно изменить (одежду, фон, стиль). В Midjourney, например, можно использовать параметр –iw (image weight), чтобы регулировать степень влияния референса. Значение –iw 2 заставит нейросеть максимально придерживаться исходника.
Художественные стили
Интересно, что полные фигуры потрясающе смотрятся в классических художественных стилях. Рубенсовские женщины — это же и есть тот самый body positive эпохи барокко.
Попробуйте стилизовать генерацию под классическую живопись:
Oil painting of a voluptuous woman lying on a velvet sofa, surrounded by fruits and flowers, baroque style, Peter Paul Rubens style, dramatic lighting, rich colors, intricate details, museum quality art –ar 16:9
Результат вас удивит. Мягкость форм, игра света и тени, богатство красок — всё это играет на руку при изображении пышного тела. Также отлично подходят стили Art Nouveau (с его плавными линиями) и Pin-up Art (для игривых ретро-образов).
А вот с аниме-стилистикой стоит быть осторожнее. Японская культура визуально тяготеет к худобе, поэтому промты для аниме придётся усиливать такими словами, как chubby, thick, и, возможно, увеличивать вес этих слов.
Немного о мужских образах
Справедливости ради, стоит упомянуть и мужчин. Запросы для генерации полных мужчин строятся по схожим принципам, но лексика немного отличается. Слова big guy, heavy lifter, bear type man дают хорошие результаты.
Пример для мужского портрета:
Portrait of a handsome big bearded man lumberjack, wearing flannel shirt, smiling, forest background, warm sunlight, rugged appearance, masculine, photorealistic, 8k –ar 2:3
Здесь мы уходим от образа «толстяка» к образу «могучего мужчины», что визуально воспринимается гораздо приятнее и эстетичнее.
Заключение
Генерация изображений людей с нестандартной фигурой — это увлекательный процесс, который требует не столько технических знаний, сколько чувства вкуса и меры. Экспериментируя с синонимами, светом и стилями, можно добиться потрясающих результатов, которые будут вызывать восхищение, а не насмешку. И помните, что нейросеть — это всего лишь кисть в ваших руках. Не бойтесь смешивать стили, искать новые эпитеты и нарушать правила. В конечном счёте, именно ваше видение определяет результат. Пусть ваши генерации будут яркими, живыми и разнообразными, ведь красота действительно не имеет единого шаблона.