Создание виртуальных миров с помощью нейросетей — занятие, которое затягивает не хуже самой увлекательной видеоигры. Ведь кто из нас не мечтал примерить на себя роль архитектора, способного по щелчку пальцев возвести мегаполис будущего или уютную деревушку в духе старой Англии? Визуализация городской среды занимает львиную долю запросов к искусственному интеллекту, будь то Midjourney, Stable Diffusion или DALL-E. Казалось бы, чего проще: вбил слово «город» и получил результат. Однако на практике обыватель часто натыкается на безликие бетонные коробки или хаотичное нагромождение окон и дорог. Но чтобы результат заставил сердце биться чаще, а картинка выглядела как кадр из голливудского блокбастера, нужно подобрать правильные ключи — слова, которые объяснят машине, какую именно атмосферу вы хотите получить.
С чего начинается построение?
С фундамента. В нашем случае — с определения стиля и эпохи. Бессмысленно требовать от алгоритма «красивое здание», не уточнив, о чем именно идет речь. Тяготеет ли ваш замысел к историзму или же устремлен в далекое будущее? Если цель — создать современный, реалистичный мегаполис, стоит использовать уточнения, касающиеся времени суток и погодных условий. Работает это довольно просто. Вы задаете базу, например: «busy city street, modern architecture, skyscrapers» (оживленная городская улица, современная архитектура, небоскрёбы). А вот дальше начинается магия детализации. К слову, именно детали превращают серую массу пикселей в добротный арт. Добавьте в запрос «crowd of people, 4k, photorealistic, cinematic lighting» (толпа людей, 4k, фотореализм, кинематографичное освещение). Результат вас удивит. Изображение сразу приобретёт глубину и объём. Ну и, конечно же, не стоит забывать про технические параметры камеры, но об этом чуть позже.
Неоновый мегаполис: Будущее
Киберпанк давно стал классикой жанра в генеративном искусстве. Этот стиль словно создан для нейросетей: обилие деталей, сложный свет, контрасты. Зрелище, надо признать, зачастую получается грандиозное. Но и здесь есть свои подводные камни. Если просто написать «Cyberpunk city», нейросеть выдаст усредненный набор штампов. А нам нужна изюминка. Попробуйте ввести следующую комбинацию:
«Futuristic cyberpunk city, night time, raining, neon signs reflections on wet asphalt, flying cars, holograms, volumetric lighting, Unreal Engine 5 render»
(Футуристический киберпанк-город, ночь, дождь, отражения неоновых вывесок на мокром асфальте, летающие машины, голограммы, объёмное освещение, рендер на Unreal Engine 5).
Зачем здесь упоминание игрового движка? Дело в том, что ИИ обучался на миллионах изображений, и тег «Unreal Engine 5» ассоциируется у него с высокой детализацией и реалистичным 3D-рендерингом. Это своего рода знак качества. Получившаяся картинка будет обладать той самой «глянцевой» мрачностью, за которую мы и любим этот жанр. Дополняет образ упоминание дождя и отражений — эти элементы добавляют сцене жизни. Ведь сухой асфальт в киберпанке выглядит неестественно, согласитесь? А если хочется добавить масштабности, можно использовать фразу «towering megastructures looking up perspective» (возвышающиеся мегаструктуры, перспектива снизу вверх). Такой ракурс всегда приковывает внимание и заставляет зрителя чувствовать себя маленькой песчинкой в огромном мире.
Улочки старой Европы
Совсем иное настроение требуется для создания исторических или фэнтезийных поселений. Здесь уже не поможет неон. Тут солирует текстура камня, тёплое освещение и растительность. Довольно часто пользователи совершают ошибку, смешивая стили. Не стоит добавлять «modern materials» в запрос про средневековье. Лучше сосредоточиться на тактильных ощущениях. Пример промта для уютного старого городка может звучать так:
«Medieval european town street, cobblestone pavement, vintage gas lamps, cozy atmosphere, sunset, ivy on walls, highly detailed, oil painting style»
(Средневековая европейская городская улица, булыжная мостовая, винтажные газовые фонари, уютная атмосфера, закат, плющ на стенах, высокая детализация, стиль масляной живописи).
Обратите внимание на уточнение стиля — «oil painting». Если его убрать, нейросеть попытается сделать фотореализм, который в контексте средневековья иногда выглядит как декорация дешёвого сериала. Живописный же стиль сглаживает огрехи и добавляет работе художественной ценности. Антураж создают мелочи: вывески таверн, деревянные балки, черепичные крыши. Можно поэкспериментировать и добавить конкретную географическую привязку, например «Architecture of Venice» или «Prague style buildings». Нейросети отлично знают достопримечательности этих мест и перенесут их характерные черты в ваш вымышленный город. Главное — не перегружать запрос лишними сущностями, иначе вместо атмосферной улочки получится наляпистость.
Влияет ли погода на восприятие?
Безусловно. И даже сильнее, чем архитектура. Один и тот же город в солнечный полдень и в туманное утро — это две разные локации. Свет творит чудеса. Солнечный свет делает картинку плоской, если не добавить теней. А вот «golden hour» (золотой час) — любимое время фотографов — работает безотказно и в генерации. Тёплый, мягкий свет, длинные тени. Попробуйте такой вариант:
«New York city street, golden hour, sun rays through skyscrapers, dust particles, cinematic shot, 35mm lens»
(Улица Нью-Йорка, золотой час, солнечные лучи сквозь небоскрёбы, частицы пыли, кинематографичный кадр, 35-мм объектив).
Частицы пыли (dust particles) — неочевидный, но мощный инструмент. Они делают воздух видимым, добавляют объём. А если вы хотите драмы и нуара? Тогда ваш выбор — туман и ночь. Промт может выглядеть следующим образом:
«Gloomy gotham style city, heavy fog, silhouette of gothic cathedral, moonlight, dramatic shadows, noir atmosphere, black and white»
(Мрачный город в стиле Готэма, густой туман, силуэт готического собора, лунный свет, драматичные тени, нуарная атмосфера, чёрно-белое).
Отказ от цвета часто помогает скрыть недостатки генерации и акцентировать внимание на формах. Это спасательный круг для тех случаев, когда нейросеть путается в цветовых сочетаниях.
Постапокалипсис: Красота разрушения
Жанр, который пугает и манит одновременно. Разрушенные города, захваченные природой, выглядят впечатляюще. Но и здесь нужен скрупулёзный подход. Просто написать «destroyed city» недостаточно. Вы получите груду мусора. Нужно добавить жизни в смерть. Звучит парадоксально? Тем не менее, именно контраст зелени и бетона создаёт нужный эффект. Этот стиль часто называют «The Last of Us style». Вот пример промта:
«Post-apocalyptic overgrown city, nature taking over, abandoned skyscrapers covered in vines, rusted cars on the street, moss, soft daylight, concept art, matte painting»
(Постапокалиптический заросший город, природа берёт своё, заброшенные небоскрёбы, покрытые лозами, ржавые машины на улице, мох, мягкий дневной свет, концепт-арт, мэтт-пейнтинг).
Здесь ключевую роль играет словосочетание «nature taking over» (природа берёт своё). Оно задает динамику процесса. Мы видим не просто руины, а победу живого над неживым. А использование термина «matte painting» отсылает к технике создания фонов для кино, что обеспечивает эпичность и масштабность картинки. Выглядит это всегда внушительно. К тому же, в таких сценах нейросети прощаются многие ошибки геометрии — ведь в разрушенном мире нет идеально ровных линий.
Техническая часть: Камера и рендер
Многие пользователи игнорируют параметры “съёмки”, считая их лишними для нарисованной картинки. Это серьезное заблуждение. Нейросеть имитирует работу реальной оптики. Указание фокусного расстояния или типа пленки может кардинально изменить восприятие. Широкий угол (wide angle, 16mm) идеален для панорам городов, чтобы показать масштаб и величие небоскрёбов. А вот для акцента на деталях, например, на витрине магазина или старой двери, лучше подойдёт 85mm или macro.
Пример для панорамного вида:
«Aerial view of a utopian futuristic city, white biomorphic architecture, solar panels, green roofs, blue sky, wide angle lens, high resolution, 8k»
(Вид с воздуха на утопический футуристический город, белая биоморфная архитектура, солнечные панели, зелёные крыши, голубое небо, широкоугольный объектив, высокое разрешение, 8к).
Слово «biomorphic» (биоморфный) отсылает к стилю Захи Хадид — плавные линии, отсутствие острых углов. Это сейчас очень модно. Упоминание «aerial view» (вид с воздуха) поднимает нас над суетой и позволяет оценить планировку.
А если мы хотим создать эффект присутствия? Тогда используем «GoPro footage» или «bodycam view». Это создаёт ощущение, что зритель сам идёт по улице. Например:
«Bodycam footage of a busy asian night market, neon lights, street food steam, crowded, raw style, realistic»
(Запись с нательной камеры на оживлённом азиатском ночном рынке, неоновые огни, пар от уличной еды, людно, сырой стиль, реалистично).
Термин «raw style» (сырой стиль) убирает излишнюю художественную обработку, делая картинку похожей на документальную хронику.
Стоит ли использовать имена художников?
Вопрос неоднозначный. С одной стороны, это самый простой способ задать стиль. Напишите «by Van Gogh», и город закрутится в звёздных вихрях. С другой стороны, этический момент использования чужого стиля всё ещё вызывает споры. Однако для обучения и поиска идей это бесценный кладезь. Смешивание стилей разных авторов может дать совершенно неожиданный, самобытный результат. Попробуйте соединить несоединимое. Например, архитектуру советского брутализма и стиль японских гравюр. Промт может выглядеть так:
«Soviet brutalism concrete massive buildings, cherry blossom trees, Hokusai style waves clouds, pastel colors, flat 2d art»
(Советские бруталистские бетонные массивные здания, деревья сакуры, облака в стиле волн Хокусая, пастельные цвета, плоский 2D арт).
Такая эклектика сейчас на пике популярности. Брутализм сам по себе — стиль тяжёлый, подавляющий. Но в сочетании с нежной пастелью он приобретает новое, романтическое звучание.
Подводные камни
Разумеется, не всё так гладко. Нейросети часто «галлюцинируют». Окна могут сливаться, лестницы вести в никуда, а текст на вывесках превращаться в инопланетную клинопись. С текстом пока всё сложно — лучше избегать промтов, требующих конкретных надписей, или быть готовым править их в фотошопе. Ещё одна проблема — перенасыщение. Если попытаться впихнуть в один запрос и космос, и подводный мир, и средневековый замок, получится каша. Лучше отказаться от идеи «всё и сразу». Лаконичность — сестра таланта, даже в общении с ИИ. Сосредоточьтесь на главном объекте и атмосфере.
Не стоит гнаться и за слишком длинными промтами из интернета, где перечислено сто модификаторов. Половину из них нейросеть просто проигнорирует. Важнее порядок слов. То, что стоит в начале промта, имеет для алгоритма наибольший вес. Поэтому сначала пишем «City», а уже потом «sunset». Если сделать наоборот, вы можете получить красивый закат, где города почти не видно.
Нужно отметить, что идеального промта не существует. Это всегда эксперимент. Меняйте одно слово, переставляйте местами определения, добавляйте странные прилагательные. Иногда случайная опечатка может привести к рождению шедевра. И всё же, понимание базовых принципов построения кадра, света и стиля экономит часы перебора вариантов.
Генерируйте, пробуйте, ошибайтесь. Каждый неудачный кадр приближает вас к тому самому, идеальному городу вашей мечты. Пусть ваши виртуальные миры будут полны жизни и вдохновения. Удачи в творчестве, и пусть ваш персональный мегаполис станет отличным решением для портфолио или просто порадует глаз!