В сети представлено множество галерей с невероятными, захватывающими дух изображениями, созданными искусственным интеллектом, и у новичка, впервые открывшего Discord, возникает вполне закономерное ощущение всемогущества. Кажется, достаточно написать пару слов, и на экране появится шедевр, достойный лучших музеев мира или, как минимум, обложки глянцевого журнала. Однако реальность довольно быстро остужает пыл: вместо «киберпанк-города» получается невнятное месиво, а «портрет девушки» пугает лишними пальцами и стеклянным взглядом. Разочарование наступает мгновенно. Ведь нейросеть — это не телепат, а скорее очень талантливый, но невероятно буквальный исполнитель, который нуждается в точных инструкциях, а не в абстрактных пожеланиях. И чтобы результат перестал напоминать сюрреалистичный кошмар, нужно освоить язык общения с алгоритмом. А начать стоит с понимания самой логики построения запроса.
Анатомия идеального промта
Сложно ли составить грамотный запрос? На первый взгляд — нет, но здесь есть свои подводные камни. Структура промта напоминает слоёный пирог, где каждый ингредиент отвечает за свой вкус и послевкусие. Фундаментом всегда выступает основной объект (Subject). Это то, что вы, собственно, хотите увидеть. Сразу за ним следует описание действия или состояния, ведь статичные фигуры выглядят довольно скучно. Далее в игру вступает окружение (Environment), которое задает контекст. И только потом — стилистика, освещение и технические параметры. Ошибка многих заключается в хаотичном набрасывании слов. Алгоритм же придает больший вес тем токенам, что стоят в начале предложения. Поэтому логика «кто — где — как» работает безотказно. К слову, перегружать описание тоже не стоит: чем больше слов, тем меньше «внимания» нейросеть уделяет каждому из них.
Стилизация: от фотореализма до масла
Один из самых мощных рычагов воздействия на результат — это указание художественного стиля (Media type). Если оставить это поле пустым, Миджорни выдаст нечто усредненно-цифровое, лишённое изюминки. Хотите получить кадр, неотличимый от реального снимка? Тогда в вашем арсенале должны быть такие маркеры, как «cinematic shot», «shot on 35mm», «Kodak Portra 400» или «hyperrealistic». Эти слова буквально переключают режим работы генератора. Изображение становится зернистым, живым, с правильным фокусным расстоянием. А если душа тяготеет к классическому искусству, на помощь придут названия техник: «oil painting» (масляная живопись), «watercolor sketch» (акварельный набросок) или «charcoal drawing» (рисунок углём). Ну и, конечно же, упоминание конкретных художников — от Ван Гога до Грега Рутковски — по-прежнему творит чудеса, мгновенно меняя манеру исполнения.
Рассмотрим пример готового промта для создания кинематографичного портрета:
«Close-up portrait of a cyberpunk girl with neon implants, rain city background, bokeh, cinematic lighting, highly detailed, shot on 35mm lens, realistic texture –ar 16:9 –v 6.0»
Здесь каждое слово работает на результат. «Close-up» фиксирует камеру на лице, «bokeh» размывает фон, создавая глубину, а «neon implants» добавляет тот самый футуристичный антураж.
Работа со светом
Освещение в генерации изображений — это отдельная, глубокая тема. Свет способен как спасти посредственную композицию, так и уничтожить отличную задумку. Игнорировать его — значит полагаться на волю случая. Нейросеть прекрасно понимает профессиональную терминологию фотографов. Мягкое освещение («soft light») идеально подойдёт для женских портретов, сглаживая недостатки кожи. Объёмный свет («volumetric lighting») добавит эпичности пейзажам, наполняя воздух туманом и лучами. А для драматичных, нуарных сцен незаменимым станет резкий свет («hard light») или контровое освещение («rim light»), которое очерчивает силуэт объекта. Довольно интересно экспериментировать и со временем суток: «golden hour» окрасит всё в тёплое золото, а «blue hour» подарит холодную, мистическую загадочность.
Пример для атмосферного пейзажа:
«Majestic ancient temple in the jungle, sunlight breaking through the trees, god rays, volumetric fog, atmospheric, mysterious vibe, 8k resolution, wide angle –ar 3:2»
Обратите внимание на словосочетание «god rays» — это те самые божественные лучи, пробивающиеся сквозь кроны деревьев. Без них картинка выглядела бы плоской и скучной.
Нужны ли технические параметры?
Безусловно. Без них вы теряете контроль над формой. Технические команды (Parameters) всегда пишутся в самом конце запроса через два дефиса. Самый востребованный параметр — это соотношение сторон (–ar). По умолчанию нейросеть генерирует квадрат, но для YouTube или киноформата это не годится. Здесь выручит «–ar 16:9». Для мобильных обоев или сториз в соцсетях идеальным решением станет «–ar 9:16». Ещё один важный инструмент — параметр стилизации (–s или –stylize), значение которого варьируется от 0 до 1000. Низкие значения (например, –s 50) заставляют ИИ строго следовать вашему тексту, буквально до буквы. Высокие же (–s 750) дают алгоритму творческую свободу, позволяя ему «додумывать» красоту, но иногда в ущерб точности запроса. Ну а для любителей экспериментов существует параметр хаоса (–c), который вносит элемент случайности в генерацию.
Портретная съёмка: люди как живые
Создание реалистичных людей — задача не из лёгких. Глаз обывателя моментально считывает фальшь: «пластиковую» кожу, странный блеск в глазах или неестественную позу. Чтобы добиться эффекта присутствия, нужно нагружать промт текстурными уточнениями. Слова «skin texture», «pores», «detailed eyes», «imperfections» (несовершенства) делают лицо живым. Идеальная гладкость свойственна куклам, а живому человеку нужны морщинки, веснушки и поры. Также стоит указывать эмоцию, иначе персонаж будет смотреть в пустоту с выражением глубокой экзистенциальной тоски.
Пример промта для мужского портрета в стиле «National Geographic»:
«Portrait of an old fisherman with a white beard, deep wrinkles, weathering skin, piercing blue eyes looking at camera, stormy sea background, overcast sky, photography, sharp focus, raw style –ar 4:5 –style raw»
Здесь ключевую роль играет параметр «–style raw», который убирает лишнюю художественность и «гламур» миджорни, делая изображение максимально честным и фотореалистичным.
Дизайн интерьеров: пространство и свет
Дизайнеры и архитекторы всё чаще используют нейросети для поиска вдохновения (референсов) или быстрой визуализации идей заказчику. В этой нише важна конкретика материалов и геометрия. Вместо абстрактных слов лучше использовать названия стилей: «minimalism», «scandinavian», «japandi», «industrial loft». Обязательно перечисляйте материалы: «concrete» (бетон), «warm wood» (тёплое дерево), «marble» (мрамор), «glass» (стекло). Это придает объектам физическую весомость. А чтобы комната не выглядела нежилой декорацией, добавьте уютные детали — «plush rug» (плюшевый ковёр), «books on shelves» (книги на полках) или «potted plants» (растения в горшках).
Пример для современной гостиной:
«Interior design of a luxury living room, panoramic windows with ocean view, beige sofa, marble floor, minimalistic style, warm lighting, cozy atmosphere, interior photography, high resolution –ar 16:9»
Такой запрос создаст светлое, наполненное воздухом пространство. Тем более, что сочетание «panoramic windows» и «ocean view» практически всегда дает выигрышную композицию.
Фэнтези и концепт-арт
Где фантазия может разгуляться по-настоящему, так это в создании несуществующих миров. Здесь законы физики уступают место законам композиции и цвета. Чтобы замок парил в воздухе, а дракон выглядел устрашающе, используйте мощные прилагательные-усилители: «epic», «grandiose», «ethereal» (эфирный), «surreal». Цветовая палитра в фэнтези играет решающую роль. Популярная схема «teal and orange» (бирюзовый и оранжевый) создает приятный кинематографичный контраст. А ссылка на популярные платформы, например «trending on ArtStation», подтягивает качество прорисовки до уровня профессиональных концепт-художников.
Пример для волшебного пейзажа:
«Floating island in the sky, waterfalls falling into clouds, giant glowing crystals, fantasy world, magical atmosphere, vibrant colors, digital art, artstation style, detailed masterpiece –ar 16:9»
Слово «masterpiece» здесь не для хвастовства, а работает как технический токен, повышающий общее качество детализации.
Логотипы и векторная графика
Удивительно, но Миджорни способна генерировать не только сложные полотна, но и лаконичную графику для бизнеса. Правда, с текстом у неё до сих пор сложные отношения (буквы превращаются в инопланетные иероглифы), поэтому генерацию надписей лучше оставить фотошопу. Главное требование к логотипам — простота. Используйте слова «vector», «flat design», «minimalist», «simple lines». Очень важно указать фон — лучше всего «white background», чтобы потом объект было легко вырезать.
Пример для логотипа кофейни:
«Minimalist vector logo of a coffee bean, simple lines, flat design, white background, black and gold colors, professional logo design –no shading –no text»
Параметр «–no shading» убирает тени, делая изображение плоским и удобным для векторизации.
Как убрать лишнее?
Бывает так: картинка идеальна, но в кадр упорно лезет посторонний предмет или цвет, который всё портит. Для борьбы с этим существует параметр негативного промта «–no». Всё, что написано после него, нейросеть постарается исключить из уравнения. Это своего рода фильтр. Если вы рисуете пейзаж, но не хотите видеть там людей, просто добавьте «–no people». Если генерируете портрет и хотите избежать очков, пишите «–no glasses».
Пример сложного исключения:
«Cute fluffy kitten playing in the garden, sunny day, detailed fur –no dogs –no water –ar 3:2»
Это гарантирует, что на лужайке будет только котёнок, без непрошеных гостей и луж.
Чего делать не стоит?
В погоне за деталями многие совершают классическую ошибку — пишут целые сочинения с деепричастными оборотами. Нейросеть их просто не поймёт. Не стоит использовать сложные отрицания в основном тексте (частицу «не» алгоритм часто игнорирует, и вместо «не красный» рисует именно красный). Лучше выносить нежелательное в блок «–no». Также нет смысла переплачивать вниманием предлогам и союзам — для ИИ важны существительные и прилагательные. И, наконец, не стоит забывать про версию движка. Если вы используете старые версии (v4, v5), промты должны быть более насыщенными, тогда как современная v6 лучше понимает естественный язык и короткие фразы.
Миджорни — это инструмент, который требует практики, а не магии. Первый блин часто выходит комом, но десятый уже может стать шедевром. Экспериментируйте со стилями, меняйте порядок слов, играйте с параметрами хаоса и стилизации. Ведь именно в процессе перебора вариантов и рождается тот самый уникальный образ, который был у вас в голове. Удачи в творческих поисках, и пусть каждая генерация попадает точно в цель!