Промпт изображения «врач»: как сгенерировать реалистичного медика в Midjourney

Множество однотипных пластиковых изображений людей в белых халатах представлено сегодня в сети, и генеративную природу они выдают с первого взгляда. Добиться абсолютного фотореализма от шестой версии алгоритма, когда дело касается специфической медицинской униформы, бывает довольно сложно. Ведь искусственный интеллект часто скатывается в глянцевую наляпистость, напрочь забывая о естественных изъянах кожи и физике тканей. Гладкие лица, лишённые пор — это не всегда вина самой архитектуры сети, чаще всего корень проблемы кроется в скудном текстовом описании. Но чтобы не ошибиться в составлении запроса, нужно скрупулёзно проработать каждую деталь сцены.

Все топовые нейросети в одном месте

В чём сложность генерации лиц в масках?

Скрытые лица. Это проблема. Ведь алгоритм моментально теряет львиную долю опорных точек при отрисовке эмоций, когда ткань перекрывает половину мимических мышц. Сложно ли добиться реалистичного и глубокого взгляда из-под хирургической шапочки? Да, но результат определённо того стоит. А если ещё вспомнить, как нейросеть тяготеет к слиянию пластиковых дужек фонендоскопа с воротником рубашки, то задача становится по-настоящему нетривиальной. Впрочем, решить эту визуальную головоломку помогает жёсткое указание материалов, усиленное индивидуальными весами токенов. Не стоит забывать про базовую анатомию, иначе на финальном рендере всплывут грубые ошибки (вроде шестипалых рук, вросших в тело проводов или кривых скальпелей). Дело в том, что машину обучали воспринимать инструменты в руках как продолжение тела, поэтому их необходимо сепарировать в тексте. Нужно отметить, что подобные цифровые махинации всегда требуют вдумчивого подхода.

Базовый промпт: хирургическое отделение

Сначала мы прописываем центральный объект, затем формируем окружение, и лишь после этого накладываем технические параметры виртуальной камеры. Один из самых популярных видов запроса — это мрачноватый репортажный кадр прямиком из операционной. Звучит формула примерно так:

A photorealistic portrait of an exhausted male surgeon in his 40s, wearing teal blue scrubs and a medical mask, sitting on a metal bench in a hospital hallway, cinematic lighting, neon fluorescent tubes, shot on 35mm lens, f/1.8, Kodak Portra 400, highly detailed skin texture, raw photo —ar 16:9 —style raw —v 6.0

Выглядит впечатляюще. И здесь солирует именно зернистая плёночная эстетика, умело скрывающая цифровой шум. Кстати, буквально десятилетие назад подобная детализация в компьютерной графике казалась недостижимой фантастикой, но сейчас создание такого добротного концепта занимает пару минут. Разумеется, не нужно скупиться на описание текстур ткани («wrinkled cotton scrubs»), иначе одежда будет напоминать дешёвую резину. А вот если на заднем плане пациент или его чадо должны присутствовать в расфокусе, композиция усложняется многократно.

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

Освещение

Блики от холодного галогенового света медленно скользят по стальной поверхности инструмента. Именно так формируется правильный, вызывающий доверие антураж процедурного кабинета. Освещение — настоящий спасательный круг для абсолютно любой плоской картинки. Конструируя сложную сцену, снабжённую боковым контровым светом, подчёркнутую мягкими тенями от софтбокса, залитую стерильным белым свечением, мы изначально задаём нужный драматический ритм. К тому же, если внедрить в промпт фразу:

harsh overhead surgical light

то кадр немедленно приобретёт внушительный, почти киношный драматизм. Многие обыватели считают, что достаточно написать просто «good lighting», но на самом деле это прямой путь к мыльной графике. Ну и, конечно же, стоит отметить колоссальную важность цветокоррекции, где холодные синие и бирюзовые оттенки вносят свою лепту в общую атмосферу стерильности. Само собой, свет буквально льётся рекой там, где максимально открыта диафрагма, поэтому указание «f/1.2» или «f/1.8» строго обязательно для красивого размытия больничных коридоров.

Стилистика глянца: студийный портрет

Совершенно иной синтаксический подход требуется для создания коммерческих рекламных материалов частных клиник. Здесь уже нужен изысканный, вызывающий эмпатию образ специалиста, к которому тянется весь медицинский бомонд. Строгий корпоративный стиль. Безусловно, в таких случаях лучше отказаться от излишней мрачности зеленоватых ламп и сделать упор на психологическое доверие. Запрос выстраивается по иной логике:

A professional studio portrait of a friendly female pediatrician in a crisp white lab coat over a light blue blouse, wearing a stethoscope around her neck, standing against a neutral light grey background, soft studio lighting, Rembrandt light, shot on medium format camera, Hasselblad X1D, 85mm lens, 8k, ultra detailed —ar 3:4 —v 6.0

Изюминка этой комбинации кроется в указании конкретной, баснословно дорогой среднеформатной аппаратуры. Ведь именно она исторически имеет свойство выдавать невероятно глубокий цвет и потрясающий микроконтраст. Да и самим ретушёрам обычно комфортнее работать с такими кристально чистыми исходниками. Тем более, что в таком мягком свете любой физиологический нюанс внешности выглядит исключительно выигрышно.

Как избежать эффекта пластика?

Блестящие лбы и стеклянные кукольные глаза моментально бросаются в глаза опытному арт-директору. Это обе стороны медали при длительной работе с любыми современными диффузионными моделями. Чтобы человеческая кожа выглядела так, будто перед нами живой организм, в текстовый блок агрессивно внедряются специфические маркеры. Далее в строку следует вписать такие теги, как «skin pores», «subsurface scattering», «micro details», а также «peach fuzz» для имитации пушка на щеках. Случайный зритель вряд ли заметит подобные мелочи на экране смартфона, однако профессионал сразу оценит этот щепетильный подход к генерации. Тем более, включение в хвост параметра «—style raw» в крепкой связке с низким значением стилизации «—stylize 50» творит настоящие чудеса, безжалостно отсекая вычурный креатив нейросети. Не стоит перебарщивать с пост-резкостью («sharp focus»), иначе итоговая картинка просто рассыплется на артефакты. Кроме того, когда главный хирург уверенно стоит на ногах перед виртуальным объективом, критически важна поза, которую легко задают через:

confident posture, arms crossed

Анатомия кадра: крупный план

Сложно ли контролировать мимику персонажа при экстремально сильном приближении объектива? Естественно, это одна из самых изнурительных задач для промпт-инженера. Экстремально крупный план лица, наполовину скрытого под щитком, часто безбожно страдает от «замыливания» текстур. Выручит здесь исключительно точное указание фокусного расстояния макрообъектива. Оптика, снабжённая кольцевой вспышкой, сфокусированная на радужке модели, прописанная как:

macro photography, 100mm lens, ring light reflection in eyes

добавит невероятной живости уставшему взгляду. К тому же, мелкие морщинки вокруг глаз стоит подчеркнуть фразой:

crow’s feet wrinkles, tired eyes

Ведь именно они правдиво транслируют изнеможение после двенадцатичасовой смены. Никакая идеальная симметрия не передаст тот колоссальный опыт, который скрывается за взглядом настоящего профи. И всё же, алгоритм периодически пытается омолодить любого персонажа до состояния студента. Противостоять этому паттерну помогает добавление точного возраста в самом начале запроса, например:

60-year-old experienced chief medical officer

Детализация и реквизит

Внимание зрителя всегда приковывает сложный профессиональный реквизит. Кладезем для создания правдоподобной иллюзии становятся мельчайшие надписи на пластиковом бейдже, правильная геометрическая форма мембраны стетоскопа, корректные заломы на одноразовой шапочке. К слову, стоит отдельно и очень дотошно прописывать цвет латексных перчаток, чтобы случайно не получить неоднозначный результат в виде фиолетовых рук. Запрос:

wearing blue nitrile medical gloves, hands holding a transparent syringe with clear liquid

работает в разы точнее абстрактных фраз. Это напрямую связано с тем, что ИИ отчаянно нуждается в чётких физических границах взаимодействующих объектов. Естественно, с первого же клика грандиозный кадр вряд ли получится сгенерировать. Придётся разложить по полочкам веса токенов, применяя конструкцию:

stethoscope::1.5 white lab coat::1

чтобы заставить сеть нарисовать трубку поверх ткани. Но есть в этой методике и своя ложка дёгтя. Подобный процесс отнимает массу драгоценного времени, да и кошелёк станет легче из-за быстро испаряющихся часов подписки. Нельзя не упомянуть, что иногда пациенты грезят об уютных, залитых солнцем палатах, поэтому в фон смело стоит добавить:

warm sunlight coming from the large window

Абстрактные и колоритные концепты

Иногда контент-план требует резко отойти от строгой классики и с головой окунуться в нечто более самобытное или футуристичное. Буквально пару лет назад качественный сай-фай был огромной редкостью, но сейчас колоритный киберпанк-медик создаётся за считанные секунды. В таком специфическом случае базовые постулаты меняются на:

sci-fi holographic medical interface

а самому персонажу приходится облачиться в тяжёлую:

Все топовые нейросети в одном месте

high-tech tactical medical gear

Ну, а если проекту жизненно необходим исконно винтажный стиль, то ситуацию спасёт запрос:

19th century doctor in a dark Victorian clinic, sepia tone, wet plate photography

Значительная часть аудитории в соцсетях непременно оседает именно на таких необычных, выбивающихся из ленты концептах. Серьёзное вложение сил в подбор нестандартной эпохи всегда окупается повышенным охватом. Бюджетный вариант с банальным промптом:

doctor in hospital

выдаст лишь пресную картинку, на которую ежедневно натыкаешься в бесплатных фотостоках. Ну и, наконец, финальный штрих всегда венчает правильный апскейл готового полотна через сторонние нейросети для восстановления текстуры кожи.

Поиск идеальной текстовой формулы непрерывно требует железного терпения и смелых экспериментов с параметрами стилизации. Каждое небрежно добавленное слово кардинально меняет общую композицию, поэтому так важно вовремя останавливаться и не перегружать строку взаимоисключающими фильтрами. Тщательно выверенный запрос совершенно не сильно ударит по кошельку при грамотном расходе генераций, а сгенерированный с душой материал безусловно станет отличным решением для любого визуального проекта.