Ещё пару лет назад самостоятельно проиллюстрировать книгу мог только тот, кто владел карандашом или кистью на профессиональном уровне, — либо тот, чей кошелёк позволял нанять художника за внушительный гонорар. Авторы малотиражных изданий и начинающие писатели грезили о выразительных обложках и атмосферных картинках внутри глав, но бюджет безжалостно расставлял приоритеты. И вот появился Midjourney — нейросеть, генерирующая изображения по текстовому запросу, — и расклад сил на рынке книжной иллюстрации изменился радикально. Но чтобы результат действительно приковывал внимание читателя, а не выглядел как набор случайных красивых картинок, стоит разобраться в нюансах работы с этим довольно своенравным инструментом.
Что такое Midjourney и почему именно он?
Midjourney — генеративная нейросеть, работающая через Discord-бот. Пользователь вводит текстовое описание (промт), а алгоритм за считанные секунды выдаёт четыре варианта изображения, из которых можно выбрать лучший и масштабировать его до печатного разрешения. Казалось бы, конкурентов хватает: DALL·E, Stable Diffusion, Leonardo AI. Однако именно Midjourney к середине 2025 года завоевал репутацию инструмента с наиболее «художественным» почерком. Дело в том, что нейросеть тяготеет к живописной стилизации, хорошо понимает отсылки к конкретным жанрам и эпохам, а готовые картинки выглядят не как стоковые фотографии, а ближе к рукотворным иллюстрациям. Ну и, конечно же, подписка не слишком бьёт по бюджету: базовый тариф стартует от десяти долларов в месяц.
С чего начинается работа над иллюстрациями?
Концепция. Без неё вся затея рассыпается. Прежде чем открывать Discord, стоит задуматься о визуальном языке будущей книги: какой стиль подойдёт жанру, какие сцены нуждаются в иллюстрировании, сколько вообще картинок нужно. Для детской сказки логичен яркий акварельный стиль, для мрачного фэнтези — тёмная живопись маслом с текстурой холста, а для научно-популярного издания — лаконичная инфографика с элементами плоского дизайна. К слову, многие авторы совершают ошибку на самом старте: бросаются генерировать иллюстрации без единого наброска в блокноте, без списка сцен и без понимания палитры. А потом удивляются, что тридцать картинок выглядят так, будто их рисовали тридцать разных художников.
Нужно отметить, что техническое задание для нейросети мало чем отличается от брифа для живого иллюстратора. В идеале перед глазами должен лежать документ, в котором прописана цветовая гамма, указаны референсные работы (картины, кадры из фильмов, обложки других книг), а также чётко описана каждая сцена — кто в ней участвует, какое освещение, какой эмоциональный посыл. Это кропотливо. Ведь без такого каркаса добиться стилистического единства практически невозможно.
Нереальный визуал и кинематографичное видео в пару кликов 🎬
Нужен крутой концепт-арт, реалистичная анимация или профессиональный апскейл? Теперь у вас есть единый доступ к лучшим визуальным нейросетям планеты: Midjourney, Runway, Kling и Sora. Улучшайте качество готовых роликов до максимума с помощью встроенных ИИ-инструментов. Никаких сложных настроек, мощного ПК или зарубежных карт. Всё работает прямо в браузере или в Telegram-боте!
Откройте новые горизонты для творчества. Жмите на ссылку, регистрируйтесь и создавайте шедевры 👉 https://clck.ru/3RNCRL
Промт — главный инструмент автора
Львиная доля успеха в Midjourney зависит от промта. Это тот самый текстовый запрос, который определяет, что именно нейросеть нарисует. Многие считают, что достаточно написать «красивый замок на холме», но на самом деле результат такой формулировки окажется довольно посредственным — слишком общим и безликим. Хороший промт строится по принципу слоёного пирога: сначала описывается объект или сцена, затем стиль исполнения, после — освещение и настроение, ну, а завершают всё технические параметры.
Вот как это выглядит на практике. Допустим, нужна иллюстрация к главе, где главная героиня впервые входит в заброшенную библиотеку. Скудный промт звучал бы так: «girl in old library». А промт, способный выдать нечто действительно атмосферное, выглядит иначе: «a young woman in a long dark coat stepping into a vast abandoned library, dust particles in golden light beams from broken stained glass windows, shelves overgrown with ivy, watercolor illustration style inspired by Alan Lee, muted earthy palette, soft diffused lighting, aspect ratio 3:4». Разница колоссальная. Каждое добавленное слово — как мазок кисти, направляющий нейросеть в нужную сторону. Не стоит лениться: чем детальнее запрос, тем точнее результат.
Совет из практики: всегда указывайте имя реального художника или направление живописи, стилю которого должна соответствовать иллюстрация. Midjourney прекрасно «знает» таких мастеров, как Альфонс Муха, Артур Рэкхем, Хаяо Миядзаки, Мёбиус. Ссылка на конкретного автора творит чудеса с визуальной подачей.
Как добиться единого стиля для всей книги?
Задача не из лёгких. Midjourney при каждом запросе генерирует изображение «с чистого листа», и две иллюстрации, созданные по разным промтам, запросто могут выглядеть так, словно их рисовали в разных вселенных. Именно стилистическая целостность — тот подводный камень, о который спотыкается большинство начинающих. Но решение существует, и оно довольно простое по сути, хотя требует скрупулёзного подхода.
Во-первых, стоит сформировать так называемый «якорный промт» — набор слов и фраз, описывающих стиль, который будет повторяться в каждом запросе без исключения. Например: «watercolor book illustration, soft edges, muted palette of sage green, dusty rose and warm ochre, hand-drawn feel, slight paper texture, style of Beatrix Potter». Этот фрагмент копируется и вставляется в начало или конец каждого нового промта. Во-вторых, нельзя не упомянуть параметр —sref (style reference), появившийся в пятой версии Midjourney. С его помощью нейросети можно «скормить» ссылку на уже сгенерированную картинку, и она будет ориентироваться на её стиль. Это настоящий спасательный круг для тех, кому нужно тридцать–сорок иллюстраций в одной манере. Ну и, наконец, параметр —cref (character reference) помогает сохранять внешность персонажей от картинки к картинке — ведь именно «плавающие» лица героев чаще всего выдают нейросетевое происхождение иллюстраций.
Работа с персонажами: лица, позы, одежда
С персонажами дело обстоит сложнее всего. Да и сами авторы признают: заставить Midjourney нарисовать одного и того же героя в десяти разных сценах — это почти искусство. Нейросеть не хранит «память» о предыдущих генерациях, поэтому каждый новый запрос для неё — чистая страница. Тем не менее пара приёмов существенно облегчает жизнь.
Первый приём — создание так называемого «паспорта персонажа». Нужно сгенерировать одно эталонное изображение героя крупным планом, с чёткими чертами лица, и затем использовать его как —cref во всех последующих промтах. Вес этого параметра регулируется от 0 до 100, и для книжных иллюстраций оптимальным оказывается значение около 80–90. Слишком высокий вес (100) иногда приводит к ригидности позы — герой словно застывает в одном выражении. А слишком низкий (ниже 50) позволяет нейросети «забывать» лицо. Второй приём — максимально подробное описание внешности в каждом промте, даже если это кажется избыточным. Цвет волос, форма стрижки, характерная деталь одежды (скажем, красный шарф или кожаный наруч) — всё это помогает «закрепить» образ. Впрочем, стоит быть реалистом: стопроцентного совпадения добиться пока невозможно, и мелкие расхождения всё-таки будут всплывать. Но для книжной иллюстрации, в отличие от комикса, идеальная портретная повторяемость не так критична.
Какие параметры Midjourney действительно важны?
Разбираться во всех командах нейросети — дело долгое, да и половина из них для книжных целей попросту не пригодится. Однако несколько параметров игнорировать точно не стоит. Первый — —ar (aspect ratio), задающий соотношение сторон. Для полностраничной иллюстрации в вертикальном формате подходит 3:4 или 2:3, для горизонтальных разворотов — 16:9 или 3:2, а для квадратных виньеток — 1:1. Второй важный параметр — —s (stylize). Чем выше его значение (от 0 до 1000), тем «художественнее» и свободнее интерпретация. Для реалистичных сцен стоит держать его на уровне 100–250, а для стилизованных сказочных картинок — поднимать до 500–750. Отдельно стоит упомянуть —chaos, который влияет на разброс вариантов внутри одной генерации: при значении 0 все четыре картинки будут довольно похожи, а при 80–100 — радикально отличаться друг от друга. Для поиска идей на ранних этапах высокий хаос — кладезь неожиданных решений.
Доработка и постпродакшн
Ни одна картинка из Midjourney не идёт в печать «как есть». Это правило, которое стоит принять сразу. Нейросеть может выдать изумительную композицию и восхитительную палитру, но при ближайшем рассмотрении обнаруживаются типичные артефакты: лишний палец на руке, размытый текст на вывеске, странная геометрия архитектурных элементов, кривоватая симметрия лица. Всё это нуждается в ручной доработке.
Самый доступный добротный инструмент для такой правки — Photoshop с его генеративной заливкой (Generative Fill). Проблемные участки выделяются лассо, и алгоритм Adobe сам «дорисовывает» их, ориентируясь на окружение. Кроме того, GIMP или даже Canva справляются с базовой коррекцией цвета и кадрированием. К тому же не стоит забывать про апскейлинг: стандартное разрешение картинки из Midjourney (примерно 1024×1024 пикселей) для печати недостаточно. Нужно минимум 300 dpi при физическом размере иллюстрации. Здесь на помощь приходят сервисы вроде Topaz Gigapixel AI или встроенный апскейлер Midjourney (кнопки U1–U4 с последующим «Upscale Subtle» или «Upscale Creative»). Вся суть в том, что без этого этапа картинки в печати окажутся мыльными и зернистыми — зрелище удручающее для любого, кто вложил силы в текст.
Нюансы подготовки к печати
Формат файла. Казалось бы, мелочь, но именно на ней многие спотыкаются. Для цифровых книг (ePub, PDF для экрана) достаточно RGB-пространства и формата PNG или JPEG с качеством не ниже 90 %. А вот для офсетной печати изображение нужно перевести в цветовое пространство CMYK, потому что типография работает именно с ним. И тут бросается в глаза неприятный нюанс: яркие неоновые оттенки, которые так эффектно выглядят на мониторе, при конвертации в CMYK блёкнут. Иногда — до неузнаваемости. Поэтому ещё на этапе промта стоит избегать слишком кислотных палитр, если книга пойдёт в типографию.
Ещё один щепетильный момент — вылеты (bleed). Если иллюстрация занимает всю страницу «от края до края», файл должен быть на 3–5 миллиметров больше обрезного формата с каждой стороны. Иначе после подрезки по краям останутся белые полоски. Да и расположение важных деталей (лиц, текста, логотипов) лучше держать подальше от границ — в так называемой «безопасной зоне», отступающей от края минимум на 10 миллиметров.
Стоит ли беспокоиться об авторских правах?
Тема неоднозначная. И довольно горячая. На момент середины 2025 года правовой статус изображений, созданных нейросетью, всё ещё находится в серой зоне во многих юрисдикциях. В США Бюро авторских прав неоднократно отказывало в регистрации копирайта на чисто ИИ-сгенерированные работы, аргументируя это отсутствием «человеческого авторства». Однако если автор существенно доработал картинку — изменил композицию, дорисовал элементы вручную, совместил несколько генераций в коллаж, — шансы на правовую защиту возрастают. В России судебная практика по этому вопросу пока только формируется.
С практической стороны, пользователи платных тарифов Midjourney (а бесплатной версии с 2023 года фактически нет) получают коммерческие права на сгенерированные изображения. Это прописано в Terms of Service. Но «коммерческие права от Midjourney» и «авторское право по закону страны» — две разные вещи. Тем более что некоторые крупные издательства уже включают в договоры с авторами пункт о запрете использования ИИ-иллюстраций без согласования. Не стоит игнорировать этот аспект: лучше заранее уточнить позицию издательства, если книга выходит не в самиздате.
Как выглядит рабочий процесс от начала до конца?
Начинается всё с текста книги — логично. Автор проходит по рукописи и отмечает сцены, которые нуждаются в визуализации. Для детской книги на 32 страницы это может быть 15–20 иллюстраций, для романа — 8–12 (по одной на главу плюс обложка). Затем составляется «карта иллюстраций»: краткое описание каждой сцены, привязанное к конкретной странице. Далее следует этап формирования якорного промта и «паспортов» персонажей — тот самый фундамент стилистического единства.
После подготовительной работы начинается генерация. Тут важно не торопиться. На одну удачную иллюстрацию нередко уходит 20–30 генераций, а иногда и больше. Каждый вариант стоит внимательно оценивать, сохраняя удачные элементы и подправляя промт для следующей попытки. Это итеративный процесс, похожий на скульптуру: убираешь лишнее, добавляешь недостающее, пробуешь другой ракурс. Впрочем, опыт накапливается быстро, и к десятой картинке времени на каждую уходит заметно меньше, чем на первую. Готовые изображения проходят через постпродакшн, апскейлинг, конвертацию в нужный цветовой профиль и собираются в макет книги. Для вёрстки подойдёт Adobe InDesign, а для самиздата — более бюджетный Affinity Publisher.
Типичные ошибки и как их избежать
Первая и самая распространённая — отсутствие визуальной концепции. Автор генерирует картинки «по настроению», не привязываясь к единой палитре и стилю. В итоге книга напоминает коллаж из разных журналов. Вторая ошибка — слишком короткие промты. Три–четыре слова почти никогда не дают предсказуемого результата; нейросеть заполняет пробелы по собственному усмотрению, и итог бывает далёк от замысла. Третья — пренебрежение доработкой. Артефакты на руках и пальцах персонажей, странные символы, имитирующие текст, лишние конечности у животных — всё это бросается в глаза читателю и моментально выдаёт искусственное происхождение иллюстраций.
Отдельно стоит упомянуть проблему «перегенерации». Midjourney затягивает. Ведь каждая новая версия картинки чуть лучше предыдущей, и хочется ещё и ещё. Буквально десятилетие назад иллюстратор рисовал один рисунок неделю, а теперь за вечер можно сгенерировать сотню вариантов. Парадоксально, но такое изобилие порой мешает: автор теряет ориентиры и не может остановиться. Лучший совет — заранее установить себе лимит: скажем, не более 50 генераций на одну иллюстрацию. Если за это количество попыток результат не устраивает, стоит пересмотреть сам промт, а не гонять его по кругу.
Midjourney и другие инструменты: синергия
Стоит отметить, что Midjourney — не единственный участник процесса. Довольно часто авторы комбинируют несколько инструментов для достижения наилучшего результата. Например, начальный эскиз композиции можно набросать от руки (даже на бумаге карандашом), сфотографировать и загрузить в Midjourney через параметр —iw (image weight), который задаёт степень влияния загруженной картинки на генерацию. Нейросеть возьмёт композицию из наброска, но «оденет» её в нужный художественный стиль. Это невероятно мощный приём, позволяющий сохранить авторское видение композиции.
А для тех, кто хочет придать иллюстрациям текстуру настоящей бумаги или холста, пригодится наложение в Photoshop. Поверх готовой картинки накладывается текстурный слой в режиме «Multiply» или «Overlay» с прозрачностью 10–20 %. Результат выглядит так, будто рисунок действительно напечатан на фактурной бумаге. Мелочь, но именно она добавляет ту самую изюминку, отличающую продуманную книжную иллюстрацию от случайной генерации в нейросети. Да и самому автору приятнее держать в руках книгу, в которой картинки «дышат», а не выглядят как глянцевые постеры.
Нейросетевая иллюстрация — инструмент молодой и стремительно развивающийся. Каждая новая версия Midjourney (а обновления выходят раз в несколько месяцев) расширяет возможности и закрывает прежние болевые точки. Ещё год назад руки персонажей были настоящей ложкой дёгтя, а сейчас эта проблема почти решена. Для автора, который готов вложить время в освоение промтов и постпродакшн, Midjourney становится колоритным творческим партнёром — не заменой художника, но мощным инструментом визуализации замысла. Удачи в создании книги, которая порадует читателей не только словом, но и картинкой.

