В последние годы цифровое пространство буквально взорвалось от наплыва изображений, созданных искусственным интеллектом, и этот визуальный шторм даже не думает утихать. Казалось бы, нажал кнопку — и шедевр готов, однако на практике обыватель довольно часто сталкивается с разочарованием: вместо эпичного полотна на экране появляется нечто сюрреалистичное, с лишними конечностями или странной геометрией. Глядя на работы профессионалов, которые выигрывают конкурсы и украшают обложки журналов, невольно задаёшься вопросом: неужели они используют какую-то другую программу? Ответ прост, но неочевиден: инструмент у всех один, а вот умение общаться с ним — разное. Ведь нейросеть — это не телепат, а исполнительный, но весьма буквальный художник, которому нужно максимально точно объяснить задачу. И чтобы результат не пугал, а завораживал, стоит разобраться в том, как правильно составить тот самый магический запрос.
Что такое промт?
Технически, промт — это текстовое описание того, что вы хотите увидеть на итоговой картинке. Но воспринимать его как обычное предложение не совсем верно. Это скорее код, набор триггеров, каждый из которых активирует определённые ассоциативные связи в «мозгу» нейросети. Словно заклинание, где важен каждый слог. Львиная доля успеха зависит от порядка слов. Дело в том, что алгоритмы (будь то Midjourney, Stable Diffusion или DALL-E) уделяют максимальное внимание началу фразы, постепенно снижая приоритет к её концу. Поэтому, если вы напишете «Красивый закат над морем, где плывет корабль», нейросеть сфокусируется на закате. А если фраза будет звучать как «Корабль на фоне морского заката», главным героем изображения станет судно.
Анатомия идеального запроса
Сложно ли составить работающую формулу? Вовсе нет. Существует проверенный скелет, на который можно нанизывать любые творческие идеи. В основе всего лежит объект. Это существительное, отвечающее на вопрос «Кто?» или «Что?». Четкость здесь — залог успеха. Не просто «женщина», а «женщина-воин» или «старуха-ведьма». Далее следует действие или состояние. Что объект делает? Стоит, бежит, спит или левитирует. Без глагола картинка может получиться статичной и скучной. Третий важный элемент — окружение. Где всё происходит? В лесу, в космосе, в киберпанк-городе. Ну и, наконец, стилистика и технические параметры. Именно они превращают обычную фотку в произведение искусства.
Как выбрать стиль?
Стилевое разнообразие — это настоящий кладезь возможностей для экспериментов. Ведь один и тот же сюжет, поданный под разным соусом, воспринимается совершенно иначе. Первый и самый популярный вариант — фотореализм. Чтобы его добиться, в промт стоит добавить такие маркеры, как «photorealistic», «hyperrealistic», «8k», «unreal engine 5». Это даёт сигнал системе проработать текстуру кожи, блики в глазах и мельчайшие пылинки в воздухе. Зрелище, надо сказать, впечатляющее.
Если же душа тяготеет к классическому искусству, можно обратиться к именам великих мастеров. Фраза «by Van Gogh» закрутит небо в знаменитые вихри, а «by Salvador Dali» добавит текучие часы и сюрреалистичный антураж. Тем более, что нейросети отлично знают почерк сотен художников. Любителям современной эстетики подойдёт «cyberpunk», «vaporwave» или «steampunk». А для создания нежных иллюстраций отлично сработает «watercolor» (акварель) или «oil painting» (масло). Главное — не смешивать противоположные стили в одну кучу, иначе результат выйдет довольно странным и «грязным».
Свет и освещение
Освещение творит чудеса, полностью меняя настроение кадра. Игнорировать этот пункт — значит лишать работу глубины. Самый простой, но эффективный вариант — «cinematic lighting» (кинематографичное освещение). Он придаёт изображению драматизм и объём. Для тёплых, уютных сцен идеально подходит «golden hour» (золотой час) — время перед закатом, когда свет становится мягким и оранжевым. А если хочется таинственности, стоит использовать «volumetric lighting» (объёмный свет), который создаёт красивые лучи, пробивающиеся сквозь туман или листву. Также довольно интересно выглядит «rim lighting» (контровой свет), подсвечивающий контуры объекта и отделяющий его от фона. Не стоит забывать и про такие нюансы, как «soft light» для портретов или «neon light» для футуристических сцен.
Примеры готовых промтов: Портрет
Теория — это хорошо, но без практики она мертва. Давайте разберём конкретные примеры, которые можно использовать как базу. Допустим, нам нужен качественный, добротный портрет девушки в футуристическом стиле. Начинаем с главного героя, добавляем детали внешности и окружение. Промт может выглядеть так: «Portrait of a cyberpunk girl with neon glowing cybernetic implants, standing in a rainy futuristic city street at night». Но этого мало. Чтобы картинка заиграла, добавляем стилистику и технические параметры. Итоговый вариант:
Portrait of a cyberpunk girl with neon glowing cybernetic implants, standing in a rainy futuristic city street at night, intricate details, hyperrealistic, cinematic lighting, 8k resolution, by Greg Rutkowski, artstation trends
Здесь упоминание Грега Рутковски (популярного цифрового художника) добавляет живописности, а «artstation trends» подтягивает качество до уровня топовых работ.
Примеры: Пейзаж и окружение
Теперь попробуем создать что-то масштабное. Например, фэнтезийный замок. Простой запрос «castle in mountains» даст скучный результат. Насытим его деталями. «Majestic ancient stone castle on top of a snowy mountain peak, surrounded by swirling clouds». Добавляем атмосферу: «epic fantasy atmosphere, dramatic lighting, sunset». И, конечно, технические “специи”: «matte painting, highly detailed, photorealistic, wide angle shot». В итоге полный промт соберётся в такую конструкцию:
Majestic ancient stone castle on top of a snowy mountain peak, surrounded by swirling clouds, epic fantasy atmosphere, dramatic lighting, sunset, matte painting, highly detailed, photorealistic, wide angle shot, 8k, unreal engine 5 render
Такой запрос создаст внушительный, грандиозный вид, достойный заставки к дорогому фильму.
Абстракция и сюрреализм
А если хочется чего-то совсем необычного? Нейросети обожают абстракцию. Здесь можно дать волю фантазии и сочетать несочетаемое. Попробуем визуализировать «время». Звучит сложно, но интересно. Промт: «Concept art of time flowing like a river made of clocks and gears, surrealism, dreamlike atmosphere». Добавим стилистики Дали и немного мрачности: «melting clocks, gears turning into water, dark fantasy style, mysterious fog, intricate details, oil painting style». Получится загадочное, философское изображение. Кстати, для абстракций отлично работают слова «fractal», «mandala», «psychedelic», «fluid». Они заставляют ИИ генерировать сложные геометрические узоры и переливы цветов.
Отрицательные промты (Negative Prompts)
Иногда проще сказать, чего на картине быть не должно, чем описывать желаемое. Для этого существуют отрицательные промты. В Midjourney они вводятся через параметр –no, а в Stable Diffusion есть отдельное поле. Что туда обычно пишут? В первую очередь, дефекты.
Ugly, deformed, noisy, blurry, distorted, out of focus, bad anatomy, extra limbs, poorly drawn face, poorly drawn hands, missing fingers
Это своего рода «спасательный круг», который отсекает большую часть брака. Также можно исключать нежелательные объекты. Например, если вы генерируете лес, но не хотите видеть там людей, смело пишите «people, humans» в негативный промт. Это значительно чистит результат и экономит время на генерации.
Важность правильных пропорций
Ещё один нюанс, о котором новички часто забывают, — соотношение сторон. По умолчанию большинство нейросетей выдают квадратные картинки (1:1). Но для пейзажа лучше подходит широкий формат, а для портрета — вертикальный. В Midjourney это регулируется параметром –ar (aspect ratio). Например, –ar 16:9 сделает кинематографичный широкий кадр, идеальный для обоев на рабочий стол. А –ar 9:16 создаст вертикальное изображение для сторис или экрана смартфона. Игнорирование этого параметра может обрезать красивые детали по краям, испортив всю композицию.
Работа с весом слов
Бывает так, что нейросеть упорно игнорирует важную деталь запроса. Вы просите «девушку в красной шляпе», а шляпа получается синей или её вообще нет. В таком случае помогает расстановка акцентов, или весов. В разных нейросетях синтаксис отличается, но суть одна: мы указываем машине, какое слово важнее. В Midjourney это делается через двоеточие и цифру (например, red hat::2), а в Stable Diffusion — через скобки (например, (red hat:1.2)). Увеличение веса заставляет алгоритм сфокусироваться на конкретном элементе. Однако не стоит перебарщивать. Слишком большой вес может исказить остальные части изображения или превратить картинку в шумящее месиво. Баланс здесь — вещь тонкая и деликатная.
Русский или английский?
Многие отечественные сервисы (например, Kandinsky или Шедеврум) отлично понимают «великий и могучий». Однако мировые гиганты вроде Midjourney или Stable Diffusion обучались преимущественно на англоязычном контенте. И хотя они могут понять запрос на русском, точность интерпретации будет ниже. Тонкие оттенки смысла могут потеряться при машинном переводе внутри системы. Поэтому, если цель — максимальное качество, стоит использовать английский язык. Тем более, что для этого не нужно быть лингвистом: онлайн-переводчики (DeepL или Google) справляются с этой задачей довольно сносно. Главное — проверять, чтобы перевод не исказил смысл художественных терминов.
Распространенные ошибки
Казалось бы, всё просто, но ошибки всплывают с завидной регулярностью. Одна из самых частых — «словесный салат». Это попытка запихнуть в один промт все красивые слова, которые вы когда-либо видели. «Epic, cinematic, cute, dark, bright, horror, flowers». Такой набор противоречивых инструкций вводит нейросеть в ступор. Результат обычно получается невнятным. Лучше выбрать одно направление и придерживаться его. Вторая ошибка — слишком длинные предложения. ИИ начинает «забывать» начало фразы, пока дочитывает конец. Краткость — сестра таланта, даже в общении с машиной. Ну и, конечно же, отсутствие конкретики. Запрос «красивая картинка» даст вам среднестатистическое «ничто», красивое, но абсолютно бездушное.
Секрет уникальности
И всё же, почему у одних получаются шедевры, а у других — копии копий? Секрет кроется в насмотренности и смелости. Не бойтесь смешивать несмешиваемое. «Cyberpunk ancient Rome» (Киберпанк Древний Рим) или «Samurai fighting a dragon in space» (Самурай сражается с драконом в космосе). Используйте необычные материалы: «made of crystal», «made of smoke», «origami style». Указывайте эмоции: «angry», «serene», «melancholic». Нейросеть — это лишь зеркало вашей фантазии. Она не придумает идею за вас, но может блестяще её визуализировать. А если результат пока не идеален, не стоит опускать руки. Добавьте деталей, поменяйте стилистику, поиграйте со светом.
Путь к мастерству
Создание изображений через промты — это новый вид творчества, где кистью служат слова. Этот процесс не сложный, но кропотливый. Приходится перебирать десятки вариантов, менять синонимы, искать те самые «золотые» сочетания. Но когда на экране наконец появляется именно то, что вы представляли в голове, ощущение сравнимо с настоящим волшебством. Этот добротный современный инструмент открывает двери в миры, которые раньше существовали только в воображении. Экспериментируйте, вдохновляйтесь чужими работами, но ищите свой уникальный голос. Ведь ваша идеальная картина уже ждёт, когда вы подберёте к ней правильные слова.