Ещё пару лет назад генерация изображений по текстовому описанию казалась чем-то из области фантастики, а сегодня нейросети вроде Midjourney выдают картинки, от которых у профессиональных иллюстраторов глаз начинает нервно дёргаться. Но вот незадача — львиная доля новичков, да и опытных пользователей тоже, натыкается на одну и ту же стену: промпт написан вроде бы грамотно, а результат получается совершенно не тот, что рисовало воображение. Дело в том, что Midjourney тяготеет к очень специфичному языку описаний, где важны не столько красивые слова, сколько точные визуальные маркеры — тип освещения, ракурс камеры, название конкретного художественного стиля. И вот тут на сцену выходит довольно неожиданный помощник — ChatGPT, который способен превратить расплывчатую идею в скрупулёзно выстроенный промпт за считанные секунды. А начать стоит с понимания того, почему вообще эти два инструмента работают в связке так эффективно.
Почему Midjourney «не понимает» обычный текст?
Распространённое заблуждение обывателя — чем подробнее и литературнее описание, тем лучше получится картинка. На самом деле всё ровно наоборот. Midjourney обучена на миллионах пар «изображение + подпись», и эти подписи в массе своей далеки от художественной прозы. Ведь типичное описание в датасете выглядит как сухой набор тегов: portrait, soft lighting, 35mm lens, oil painting style, muted colors. Когда пользователь пишет что-то вроде «нарисуй мне красивый закат над морем, чтобы было романтично и тепло на душе», нейросеть половину слов попросту игнорирует. Эмоции она не считывает — считывает конкретику. И вот эту конкретику как раз способен сформулировать ChatGPT, если правильно к нему обратиться.
Что ChatGPT делает лучше человека?
Казалось бы, нет ничего сложного — выучить десяток терминов и самому собирать промпты. Но подводные камни всплывают довольно быстро. Во-первых, у Midjourney есть негласная иерархия слов: те, что стоят в начале промпта, весят больше, чем хвостовые. Во-вторых, некоторые слова конфликтуют друг с другом, и результат получается мутным, неопределённым. Ну и, наконец, существуют сотни параметров, стилевых отсылок и модификаторов, которые держать в голове — задача не из лёгких. ChatGPT же — настоящий кладезь этих терминов. Он знает, чем cinematic lighting отличается от volumetric lighting, помнит имена фотографов и художников, чей стиль Midjourney воспроизводит особенно удачно, и умеет выстраивать слова в нужном порядке. А ещё — и это, пожалуй, самое ценное — он способен задать уточняющие вопросы, если начальное описание слишком размытое.
Первый подход: промпт для промпта
Самый простой путь. В окно ChatGPT нужно вставить инструкцию, которая объяснит ему его новую роль — генератора промптов для Midjourney. Выглядит это примерно так: пользователь просит ChatGPT действовать как эксперт по нейросетевой генерации изображений, знающий синтаксис Midjourney, и далее описывает желаемую картинку обычным человеческим языком. ChatGPT в ответ выдаёт готовый промпт, уже переведённый на «язык» Midjourney. Стоит отметить, что качество этого промпта напрямую зависит от того, насколько детально описана исходная идея. Фраза «красивый пейзаж» даст посредственный результат. А вот «осенний лес на рассвете, туман между деревьями, вид сверху, как с дрона, тёплая палитра» — совсем другое дело. ChatGPT подхватит каждую деталь и усилит её профессиональными терминами.
Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈
Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.
Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL
Как правильно «натренировать» ChatGPT?
Тонкий нюанс. Без предварительной настройки ChatGPT будет генерировать промпты в общих чертах — работать они будут, но изюминки не хватит. Опытные пользователи поступают иначе: в самом начале диалога скармливают ChatGPT от пяти до десяти примеров удачных промптов, которые уже давали хороший результат в Midjourney. Это своего рода калибровка. ChatGPT анализирует структуру, замечает паттерны — длину фраз, порядок элементов, частоту тех или иных модификаторов — и начинает генерировать в похожем ключе. К слову, многие хранят такие «эталонные» промпты в отдельном документе и обновляют его по мере того, как Midjourney выпускает новые версии движка. Ведь то, что великолепно работало в версии 5, может выдавать совсем другой результат в версии 6.
Пример запроса к ChatGPT: «Ты — эксперт по созданию промптов для Midjourney v6. Я буду описывать идею на русском языке, а ты — выдавать готовый промпт на английском, длиной от 40 до 80 слов, с указанием стиля, освещения, ракурса, цветовой палитры и соотношения сторон. Вот пять примеров промптов, которые мне нравятся: [примеры]. Сохраняй похожую структуру.»
Структура добротного промпта
Midjourney лучше всего воспринимает промпты, выстроенные по определённой логике, и ChatGPT может эту логику соблюдать неукоснительно — если ему об этом сказать. Начинается всё с основного объекта — того, что должно солировать в кадре. Далее следует окружение или фон, затем стиль (фотографический, живописный, мультяшный), после — технические параметры вроде типа объектива или освещения. Венчает промпт блок модификаторов: соотношение сторон через —ar, степень стилизации через —stylize, а иногда и параметр —chaos, отвечающий за непредсказуемость результата. Многие забывают про этот последний параметр, а ведь именно он творит чудеса, когда хочется получить что-то неожиданное. Стоит попросить ChatGPT всегда добавлять модификаторы в конец — и он запомнит это на весь диалог.
Стоит ли писать промпты на русском?
Короткий ответ — нет. Но не всё так однозначно. Midjourney формально понимает русский язык, однако качество генерации заметно проседает. Это связано с тем, что обучающая выборка на английском языке в десятки раз превышает русскоязычную. Простой пример: слово «уютный» на русском может дать что-то невнятное, тогда как cozy на английском моментально добавляет в картинку тёплый свет, мягкие текстуры и приглушённую палитру. Но ведь не каждый владеет английским на уровне, достаточном для составления детальных описаний. И вот тут ChatGPT выступает идеальным переводчиком-адаптатором: он не просто переводит слово в слово, а подбирает те английские термины, которые Midjourney «видит» лучше всего. К тому же, можно попросить его давать промпт сразу в двух вариантах — коротком и развёрнутом — чтобы сравнить результаты.
Работа с отрицательными промптами
Не менее важная грань. Midjourney поддерживает так называемый параметр —no, позволяющий исключить из изображения нежелательные элементы. Хочется портрет без очков? Добавляется —no glasses. Пейзаж без людей? —no people, crowd. Казалось бы, мелочь. Но на практике грамотное использование отрицательных промптов вдвое сокращает количество «бракованных» генераций. Проблема в том, что новички редко задумываются о том, чего именно они не хотят видеть. А ChatGPT может подсказать — достаточно описать ему ситуацию, и он сам предложит список исключений на основе типичных «артефактов» Midjourney. Лишние пальцы на руках, искажённый текст, двоящиеся лица — всё это ChatGPT уже знает и предупредит заранее.
Итеративный подход: от черновика к шедевру
Одна генерация — почти никогда не финал. Самый продуктивный метод работы выглядит как цепочка уточнений. Сначала ChatGPT выдаёт базовый промпт. Пользователь вставляет его в Midjourney, смотрит результат и возвращается в ChatGPT с обратной связью: «слишком тёмное освещение», «хочу больше деталей на переднем плане», «стиль ближе к Хаяо Миядзаки». ChatGPT тут же корректирует промпт — добавляет bright ambient light, усиливает intricate foreground details, вписывает in the style of Studio Ghibli. И так по кругу, пока изображение не приблизится к задуманному. Да, процесс не быстрый. Но кропотливый. Зато третья-четвёртая итерация обычно попадает почти в яблочко. Кстати, весь этот диалог можно вести в одном и том же чате — ChatGPT запоминает контекст и с каждым шагом понимает стилистические предпочтения пользователя всё точнее.
Продвинутые техники: мультипромпты и веса
Мало кто из новичков знает про функцию мультипромптов. Вся суть в том, что Midjourney позволяет разделить промпт на несколько смысловых блоков при помощи двойного двоеточия :: и назначить каждому блоку свой «вес». Например, forest landscape::2 magical creatures::1 dark atmosphere::3 — здесь атмосфера мрачности будет доминировать, пейзаж окажется на втором месте, а сказочные существа — скорее фоновым элементом. Вручную подбирать эти пропорции довольно утомительно, а ChatGPT справляется за секунды. Нужно лишь описать, что должно быть главным, а что второстепенным. Отдельно стоит упомянуть технику «промпт-миксинг» — когда в одном запросе сочетаются два совершенно разных стиля. Скажем, baroque painting::2 cyberpunk city::1 — результат получается неожиданным, иногда даже грандиозным. И ChatGPT охотно генерирует подобные эксперименты, если попросить его «удивить».
Ошибки, которые всплывают чаще всего
Перегруженность. Это, пожалуй, самая распространённая беда. Пользователь просит ChatGPT добавить в промпт всё и сразу — и конкретного художника, и тип объектива, и эпоху, и текстуру, и десять прилагательных подряд. Midjourney от такого изобилия «теряется» и выдаёт нечто усреднённое, где ни один элемент толком не читается. Не стоит перегружать промпт больше чем 60–75 словами (для версии 6). Следующий подводный камень — противоречивые указания. «Яркий солнечный день» и «мрачная готическая атмосфера» в одном промпте — рецепт визуальной каши. ChatGPT такие конфликты обычно замечает, но только если ему заранее поставить задачу проверять промпт на логическую непротиворечивость. А ещё довольно часто забывают указывать соотношение сторон — и получают квадратную картинку там, где нужна была вертикальная обложка для телефона.
Шаблоны на каждый день
Щепетильный подход к делу — завести собственную библиотеку шаблонов. Дело в том, что определённые задачи повторяются: аватарки для социальных сетей, обложки для YouTube, иллюстрации к статьям, концепт-арт для игровых персонажей. Под каждую такую задачу можно один раз попросить ChatGPT создать базовый шаблон, а потом лишь менять в нём переменные. Например, шаблон для портрета мог бы выглядеть так: [тип персонажа], [эмоция], [стиль], cinematic lighting, shallow depth of field, 85mm lens, —ar 2:3 —stylize 750. При следующем запросе достаточно сказать ChatGPT: «Возьми шаблон портрета, сделай эльфийскую воительницу, выражение — решимость, стиль — цифровая живопись». И через пять секунд готовый промпт лежит перед глазами. Это экономит не только время, но и нервы — ведь не приходится каждый раз изобретать велосипед.
Несколько слов о «промпт-инженерии» как навыке
Многие считают, что составление промптов — баловство, а не настоящее умение. Но на самом деле за последние два года вокруг этого сформировалась целая дисциплина. Промпт-инженер — вполне реальная должность в креативных студиях и маркетинговых агентствах. И ChatGPT в этом контексте — не замена специалисту, а его надёжный инструмент. Ведь именно человек задаёт направление, формулирует эстетические критерии, оценивает результат. Нейросеть же берёт на себя рутину: перевод замысла в технический формат, подбор терминологии, балансировку весов. Да и самому ChatGPT нужен грамотный оператор — без чёткого системного промпта он выдаёт промпты «средней температуры по больнице», без характера и стиля. Тем более что каждая новая версия Midjourney слегка меняет правила игры, и успевать за этими изменениями проще вдвоём — человек плюс языковая модель.
Связка ChatGPT и Midjourney — это не хитрая махинация и не ленивый способ обойтись без фантазии. Скорее это спасательный круг для тех, кто точно знает, чего хочет, но не может сформулировать это на языке нейросети. Со временем промпты станут получаться всё лучше, внутреннее чутьё на удачные формулировки разовьётся, а ChatGPT из костыля превратится в привычный рабочий инструмент — вроде калькулятора для инженера. Удачи в экспериментах, и пусть каждая генерация приближает к той самой идеальной картинке, которая давно живёт в голове.

