Готовый промт для создания персонажа: детальная генерация героя

В сети полно однотипных пластиковых лиц, сгенерированных нейросетями по первому попавшемуся запросу. Обыватель часто думает, что достаточно вбить пару слов, и машина сама выдаст шедевр, но на деле результат обычно удручает своей безликостью и неестественностью. Плохой исходник — это далеко не всегда вина вычислительного алгоритма, ведь чаще всего корень зла кроется в скудном словаре самого автора. Буквально пару лет назад мы искренне радовались кривым абстракциям с лишними пальцами, но сейчас требования цифровой индустрии колоссально возросли, требуя фотографической точности, сложнейшей композиции и глубокой проработки мельчайших текстур. Поэтому перед началом серьёзной работы стоит вооружиться проверенными текстовыми конструкциями, которые гарантированно направят искусственный интеллект в нужное русло.

Все топовые нейросети в одном месте

Базовая архитектура

Прядь волос, небрежно выбившаяся из-под тяжёлого капюшона. Порой именно с такой незначительной детали начинается грандиозный изысканный концепт. С чего начинается построение рабочего запроса? Исключительно с определения субъекта и его физического воплощения. Разумеется, на первом этапе мы задаём расу, пол и возраст, прописывая что-то вроде:

«35-year-old elven warrior»

Далее следует детализация внешности, где в ход идут выражения наподобие:

«intricate leather armor, worn-out fabric, dirt on cheeks»

К слову, именно на этом этапе оседает львиная доля ошибок новичков, пытающихся описать всё и сразу. Отдельно стоит упомянуть позу и базовую эмоцию, задающие ту самую динамику кадру. Ну и, наконец, финальным аккордом выступает окружение, прописанное через творительный падеж: фоном, окутанным густым лондонским туманом, подсвеченным холодным лунным светом, пробивающимся сквозь ветви. Дело в том, что алгоритм считывает токены последовательно, всегда отдавая приоритет самому началу текстовой строки.

Все топовые нейросети в одной подписке! 🚀

Устали оплачивать десятки сервисов отдельно и постоянно включать VPN? Появилась платформа, которая объединяет более 90 передовых ИИ в одном окне. Пишите тексты с новейшими версиями GPT и Claude, создавайте шедевры в Midjourney и генерируйте видео в Sora и Kling. Тексты, изображения, видео и музыка — всё работает на любых устройствах без «танцев с бубном».

Попробуйте бесплатно прямо сейчас! Переходите по ссылке и получите бонусные токены для старта 👉 https://clck.ru/3RNCRL

Стоит ли усложнять?

Перегруз. Это частая беда создателей. Ведь многие искренне верят в магическую силу бесконечных описаний. В представлении многих длина текста прямо пропорциональна качеству финальной картинки, однако на самом деле машина просто теряет смысловой фокус. Естественно, громоздкий нечитабельный абзац сильно бьёт по бюджету внимания модели, безжалостно размывая суть. А ведь когда-то, на заре появления ранних версий диффузионных сетей, длиннющие полотна бессмысленного текста действительно спасали ситуацию. Сейчас же архитектура вычислительных систем шагнула далеко вперёд. И всё-таки впадать в тотальный минимализм нет никакого смысла. Безусловно, баланс найти довольно сложно, но вполне реально. В первую очередь стоит задуматься над весовыми коэффициентами, грамотно выделяя изюминку вашего героя. Если в образе солирует необычный цвет глаз или специфический шрам, логичнее усилить этот токен через скобки или цифры (например):

«glowing emerald eyes:1.4»

К тому же, не стоит забывать про мощнейший инструмент негативного промта.

Настройки камеры и рендер: тонкости света

На виртуальную съёмочную площадку рекой льётся свет. Именно грамотное освещение делает плоскую картинку по-настоящему живой, объёмной и пугающе реалистичной. К первой группе токенов здесь относятся классические студийные настройки:

«volumetric lighting, rim light, cinematic studio lighting»

Во-вторых, нужно обязательно задать физический тип объектива и марку плёнки, используя фразы вроде:

«shot on 35mm lens, f/1.8, Kodak Portra 400»

Ну, а последним в списке идёт движок рендера, где умы цифровых творцов до сих пор приковывает внимание бессмертный «Octane render» или сверхреалистичный «Unreal Engine 5». Конечно, для неподготовленного человека звучит это всё как шаманское заклинание, однако итоговый результат определённо заслуживает истинного уважения. Впрочем, ложка дёгтя кроется в том, что разные версии нейросетей совершенно по-разному трактуют эти технические термины. Тем более, что в Stable Diffusion эти параметры работают с хирургической точностью, тогда как другие коммерческие боты могут их просто проигнорировать. Да и вычислительное время на рендер таких тяжеловесных запросов может оказаться внушительным, так что процесс генерации иногда становится серьёзным вложением в износ вашей домашней видеокарты.

Творения в Midjourney: портреты

Ожидание чуда. Новички часто думают, что шедевры рождаются по щелчку пальцев. Однако дьявол всегда кроется в нюансах. Само собой, сухая теория без практических примеров абсолютно мертва. Рассмотрим добротный рабочий вариант для фотореалистичного мужского портрета. В строку запроса вбиваем:

«cinematic portrait of a rugged 40-year-old male detective, sharp jawline, stubble, wearing a worn beige trench coat, smoking a cigarette, dramatic neo-noir lighting, neon reflections in the background, rain drops on face, highly detailed, 8k, shot on Hasselblad H6D-100c —ar 16:9 —style raw»

Выглядит весьма впечатляюще. Подобный текст грамотно разложен по полочкам: от центрального объекта до мельчайших брызг воды. А вот если душа автора тяготеет к стилизованной двухмерной графике, от провала спасёт совершенно другой подход. Для создания колоритного самобытного антуража в духе тёмного фэнтези пишем:

«concept art of a female elven rogue, dark hood, intricate gold embroidery, glowing purple daggers, dynamic pose, dark fantasy setting, masterpiece, trending on ArtStation, illustration by Greg Rutkowski —ar 9:16»

Тем более, обе стороны медали наглядно показывают, как важно изначально задавать правильную стилистическую атмосферу.

Как избежать мыла?

Возникает ли неприятная размытость при генерации сложных сцен? Сплошь и рядом. Не стоит скупиться на жёсткие ограничительные слова, иначе на финальном холсте обязательно всплывут жуткие анатомические артефакты. Сложные махинации с негативным полем позволяют вытянуть резкость и исправить поломанные пропорции. Опытные художники в строке «Negative prompt» прописывают длинную вереницу строгих запретов, безжалостно отсекаемую алгоритмом в процессе генерации. Туда без малейшего сожаления отправляются:

«blurry, out of focus, low res, bad anatomy, extra limbs, mutated, ugly, poorly drawn face»

Нужно отметить, что именно эти незыблемые постулаты спасают анатомию кистей рук, с которой у искусственного интеллекта исторически очень натянутые отношения. Да и самому творцу гораздо спокойнее, когда машина жёстко зажата в рамки цифрового приличия. Нельзя не упомянуть и про внешние нейросетевые апскейлеры, которые дотягивают базовое разрешение до невероятных размеров. Ведь иногда даже самый скрупулёзный текстовый запрос нуждается в качественной финальной постобработке.

Стилизация арта: художники

Штрих настоящего мастера. Выбор референсного творца кардинально меняет всё восприятие сцены. Если хочется получить мрачную биомеханическую эстетику, смело вписываем в конец строки:

«by H.R. Giger»

Далее следует любитель ретро-киберпанка и холодного неонового света, где отлично работает токен:

«by Syd Mead»

Компактное бюджетное решение для создания нежных акварельных текстур — простое добавление:

«by Alphonse Mucha»

Естественно, не стоит перебарщивать со смешением стилей. Ведь если ради эксперимента скрестить Сальвадора Дали и Ивана Шишкина, получится неоднозначный вычурный винегрет, который вряд ли порадует глаз придирчивого эксперта. Сразу бросается в глаза излишняя наляпистость. Дело в том, что веса художников в обучающей базе распределены крайне неравномерно, и чьё-то влияние алгоритм воспринимает гораздо острее. Кстати, иногда надёжный спасательный круг кроется в указании конкретной исторической эпохи или направления живописи. На виртуальном холсте отлично солирует исконно классический:

«Renaissance oil painting»

А для любителей агрессивного ретро подойдёт:

«1980s dark synthwave anime»

Скрытые подводные камни

Капризы алгоритма. Они абсолютно неизбежны. Всегда ли нейросеть послушно выполняет команды автора? Вовсе нет. Бывает, что бомонд цифрового искусства сутками бьётся над одной единственной генерацией, а нужный ракурс так и не появляется. Вся суть в том, что некоторые токены вступают в жестокий скрытый конфликт друг с другом. Например, попытка совместить:

Все топовые нейросети в одном месте

«bright sunny day»

и

«dark gloomy shadows»

в одном коротком предложении просто сломает логику построения теней. К тому же, машина довольно часто игнорирует отрицательные частицы в основном тексте. Вместо конструкции «no glasses» логичнее использовать негативный промт или написать:

«bare face, clear eyes»

И если вы наивно полагаете, что кошелёк станет легче от покупки самой дорогой серверной подписки и проблемы исчезнут, то это опасная иллюзия. Даже на мощнейших платных серверах качество картинки зависит исключительно от вашего умения жонглировать смыслами. Этот творческий подход — настоящий кладезь неисчерпаемых идей. Ну, а если случайно натыкаешься на удачный цифровой код генерации (seed), его обязательно стоит сохранить для последующих экспериментов. Персонаж твёрдо стоит на ногах только тогда, когда базовый код закреплён. Словно малое чадо, нейросеть требует исключительно чётких, непротиворечивых и последовательных инструкций. Ведь только так герою предстоит облачиться в детализированные доспехи, а не в размытое пиксельное месиво, которым обычно пестрят форумы новичков. Этим результатом грезят многие концепт-художники, но достигают его лишь самые упорные практики.

Поиск идеальной комбинации английских слов всегда требует огромного запаса времени, неиссякаемой фантазии и определённой доли технического упрямства. Каждое добавленное прилагательное способно внести свою весомую лепту в композицию, кардинально меняя настроение персонажа и глубину резкости кадра. Ищите нестандартные описательные эпитеты, комбинируйте, казалось бы, совершенно несочетаемые художественные стили и смело удаляйте всё лишнее из строки запроса. Пусть каждый сгенерированный герой обретёт свой неповторимый шарм, а сам процесс создания принесёт истинное удовольствие и запомнится надолго.