Нейросети для генерации изображений за последние пару лет совершили рывок, который ещё недавно казался фантастикой. Midjourney среди них — безусловный тяжеловес, задающий планку качества для всей индустрии. Но мало кто задумывается о том, что за каждым обновлением движка стоит не только работа инженеров, но и скрупулёзная оценка результатов живыми людьми — обычными пользователями, подписчиками сервиса. Именно для этого команда Дэвида Хольца время от времени запускает так называемые rating party — массовые сессии голосования, в ходе которых сообщество помогает разработчикам выбрать лучший вариант нового алгоритма. А с приближением долгожданной шестой крупной версии движка (V6 уже давно в строю, V7 тестировалась не так давно) всё больше разговоров ведётся вокруг V8 rating party — события, способного серьёзно повлиять на будущее генеративного искусства. Но чтобы не путаться в терминах и понимать механику процесса, стоит разобраться во всём по порядку.
Что скрывается за термином «rating party»
Само понятие звучит довольно неформально. По сути, rating party — это организованная сессия сравнительного голосования, которую Midjourney устраивает на своём сайте. Пользователям показывают пары изображений, сгенерированных по одному и тому же промпту, но разными версиями алгоритма или его вариациями. Задача проста: выбрать то, которое нравится больше. Никаких сложных критериев, никаких экспертных шкал — чистое человеческое восприятие. Дело в том, что автоматические метрики (вроде FID или CLIP-score) далеко не всегда отражают реальное качество картинки с точки зрения живого глаза. Машина может посчитать два изображения равнозначными, а человек мгновенно увидит, что на одном из них кожа выглядит восковой, а на другом — естественной. Вот эту разницу и ловят через массовое голосование.
Исторический контекст тоже важен. Первые рейтинговые сессии Midjourney проводила ещё в эпоху перехода с V3 на V4, когда команда экспериментировала с архитектурой диффузионной модели. Тогда формат был куда менее отлаженным — голосование шло прямо в Discord-каналах, и хаос творился изрядный. Со временем процесс переехал на отдельную веб-страницу midjourney.com/rank, стал аккуратнее и прозрачнее. К слову, именно благодаря этим ранним сессиям разработчики отказались от нескольких экспериментальных веток, которые выдавали технически безупречные, но «мёртвые» по ощущениям изображения.
V8 — почему вокруг столько шума?
Каждая новая мажорная версия Midjourney — событие для всего комьюнити. И V8 здесь не исключение, а скорее наоборот. Ожидания грандиозные. Ведь именно в этой итерации, судя по обрывочным комментариям Хольца в Discord, команда работает над принципиально новым подходом к пониманию промптов, особенно в части пространственных отношений между объектами. Буквально пару лет назад попросить нейросеть нарисовать «кошку, сидящую на стуле» было лотереей — кошка могла оказаться под стулом, рядом с ним или вовсе слиться с обивкой. Сейчас ситуация значительно лучше, но до идеала ещё далеко.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Нюанс в том, что V8 — это не один алгоритм, а целое семейство экспериментальных моделей. Разработчики тестируют несколько архитектурных решений параллельно. Какое из них окажется в финальном релизе — во многом зависит от результатов голосования. Именно поэтому rating party для восьмой версии приковывает столько внимания. Это не просто развлечение и не маркетинговый ход. Это реальный инструмент отбора, влияющий на то, какой движок получат миллионы пользователей. Тем более что конкуренция на рынке генеративных изображений сейчас жёсткая — DALL·E, Stable Diffusion, Flux, Ideogram дышат в спину, и каждое поколение Midjourney должно убедительно доказывать своё превосходство.
Как устроена механика голосования
Интерфейс нехитрый. Заходишь на midjourney.com/rank, авторизуешься через свой аккаунт — и перед тобой появляется пара картинок. Иногда их бывает четыре, расположенных сеткой два на два. Под каждой — кнопка выбора. Нажал на ту, что больше по душе, — и система тут же подгружает следующую пару. Никаких пояснений писать не нужно, никаких баллов расставлять. Быстро, интуитивно, почти медитативно.
Впрочем, за этой внешней простотой скрывается довольно сложная статистическая модель. Midjourney использует систему рейтингования, напоминающую шахматную Эло-рейтинг. Каждое изображение (а точнее, каждый вариант модели, которая его сгенерировала) получает числовой рейтинг, и после каждого голосования этот рейтинг корректируется. Чем больше голосов собрано, тем точнее картина. И тут возникает важный момент — голоса не равноценны. Система отслеживает последовательность выборов каждого участника, выявляет случайные клики и так называемых «спамеров», которые жмут кнопки наугад. Их голоса постепенно обесцениваются. А вот мнение тех, кто голосует вдумчиво и последовательно, получает больший вес.
Стоит ли тратить время на участие?
Резонный вопрос. Ведь за голосование Midjourney не платит деньгами. Однако мотивация всё-таки есть, и она не такая уж эфемерная. Во-первых, активные участники рейтинговых сессий получают бесплатные часы генерации — так называемый ranking bonus. За каждую тысячу оценок начисляется примерно час быстрого GPU-времени, что для подписчиков базового тарифа (около 10 долларов в месяц) — ощутимая прибавка. Во-вторых, есть менее осязаемый, но не менее важный бонус: ощущение сопричастности. Ты буквально влияешь на то, как будет выглядеть следующая версия инструмента, которым пользуешься каждый день.
Не стоит забывать и про третий аспект. Опытные пользователи, прошедшие через десятки тысяч оценок, отмечают, что сам процесс серьёзно прокачивает насмотренность. Когда за полчаса ты сравниваешь сотни пар изображений, глаз начинает замечать тонкости: неестественные текстуры, артефакты освещения, проблемы с руками (вечная боль нейросетей), странную композицию. Эта насмотренность потом напрямую влияет на качество собственных промптов. Так что rating party — своеобразная тренировка визуального мышления. Бесплатная причём.
Как попасть на V8 rating party
Вечная интрига. Midjourney не рассылает персональных приглашений и не вывешивает расписание за месяц. Обычно всё происходит довольно спонтанно: Дэвид Хольц пишет сообщение в основном Discord-канале проекта (или в специальном канале #announcements), и рейтинговая сессия стартует в течение нескольких часов. Иногда предупреждение приходит за сутки, иногда — за двадцать минут. Хаотично? Безусловно. Но в этом есть своя логика: команда запускает голосование тогда, когда готова очередная экспериментальная ветка, а не по календарному плану.
Чтобы не пропустить момент, стоит подписаться на уведомления в Discord-сервере Midjourney. Конкретнее — включить пинги для роли @Rating Reminders, если такая доступна, или просто мониторить канал объявлений. Кроме того, новости о запуске rating party довольно быстро всплывают в тематических Telegram-каналах и на Reddit в сабреддите r/midjourney. Ну и, конечно же, стоит проверить, что подписка на сервис активна — бесплатные пробные аккаунты к голосованию обычно не допускаются.
Что именно оценивают участники
Здесь кроется изюминка процесса. Разработчики редко сообщают, какие конкретно модели соревнуются друг с другом. Ты не знаешь, сгенерирована ли левая картинка текущей V6, а правая — экспериментальной V8, или обе принадлежат разным веткам одной и той же восьмой версии. Это принципиально важно. Ведь если пользователь заранее знает, что одна из картинок — «новая модель», срабатывает эффект новизны и предвзятость в её пользу. А Midjourney нужны честные, «слепые» оценки.
Во время прошлых рейтинговых сессий (для V5 и V6) участники отмечали, что сравниваемые изображения различались по нескольким параметрам. Один вариант мог быть фотореалистичнее, но с менее точным следованием промпту. Другой — идеально интерпретировал запрос, но выглядел чуть «пластиковым». Встречались и пары, где различия были настолько тонкими, что выбор давался с трудом: текстура ткани на одном чуть глубже, блик в глазах на другом чуть живее. Именно такие пограничные случаи и несут наибольшую ценность для разработчиков. Дело в том, что очевидные различия алгоритм может выявить автоматически, а вот субъективное «ощущение живости» — только человек способен уловить.
Подводные камни и типичные ошибки
Процесс кажется элементарным, но ложка дёгтя всё же найдётся. Самая распространённая ошибка — голосовать на автопилоте. Через пятнадцать-двадцать минут непрерывного сравнения глаз «замыливается», и выборы становятся случайными. Система это замечает и начинает понижать вес голосов. В итоге человек потратил полчаса, а бонусных часов генерации получил меньше, чем мог бы. Не стоит гнаться за количеством — лучше оценить двести пар вдумчиво, чем пятьсот впопыхах.
Ещё один нюанс — личные эстетические предпочтения. Многие участники инстинктивно выбирают более яркие, насыщенные картинки или те, что ближе к фотореализму. Но Midjourney генерирует контент в самых разных стилях: от акварели до киберпанковой графики. И если один вариант выглядит как журнальная фотография, а другой — как иллюстрация из детской книги, это не значит, что первый «лучше». Здесь стоит задуматься: какой из двух вариантов точнее передаёт суть промпта? Какой выглядит гармоничнее внутри собственного стиля? Впрочем, разработчики утверждают, что статистика большого числа голосов всё равно сглаживает индивидуальные перекосы. Однако осознанный подход к голосованию никому ещё не навредил.
Чем V8 rating party отличается от предыдущих
Если верить утечкам и обрывочным комментариям команды, масштаб тестирования V8 значительно превосходит всё, что было раньше. Для V5 голосование длилось около двух недель, для V6 — чуть больше месяца с перерывами. Восьмая версия (нумерация, к слову, не строго последовательная — Midjourney пропускала номера или меняла внутреннюю маркировку) предполагает несколько волн голосования, каждая из которых фокусируется на определённом аспекте генерации. Первая волна может быть посвящена фотореализму, вторая — стилизованным изображениям, третья — точности следования текстовому запросу. Такой подход позволяет выявить сильные и слабые стороны каждой экспериментальной ветки не в целом, а по конкретным параметрам.
К тому же, в последних обновлениях Midjourney добавила возможность оставлять короткий текстовый комментарий к выбору (не более 280 символов). Раньше такой опции не было. Это довольно серьёзное нововведение, ведь голое предпочтение «левая лучше правой» не объясняет почему. А разработчикам критически важно понимать мотивацию: пользователю не понравилась композиция? текстура кожи? цветовая палитра? пропорции? Текстовые комментарии — кладезь инсайтов, которые невозможно извлечь из бинарного голосования.
Влияет ли голосование на финальный результат
Скептики любят говорить, что rating party — просто PR-акция, а итоговую модель разработчики выбирают сами. На самом деле всё не так однозначно. Дэвид Хольц неоднократно рассказывал в Discord, что результаты голосования напрямую влияют на решение о том, какую ветку развивать дальше. В одном из таких разговоров (февраль 2024 года) он упомянул, что планировал включить в V6 определённый алгоритм рендеринга текста на изображениях, но после rating party стало очевидно, что пользователям больше нравится альтернативный вариант — менее точный, но с более «живой» стилистикой букв. И команда изменила курс.
Разумеется, голосование — не единственный фактор. Технические метрики, скорость генерации, потребление вычислительных ресурсов — всё это тоже учитывается. Но человеческая оценка остаётся финальным арбитром в случаях, когда два варианта примерно равны по техническим показателям. А такие случаи — львиная доля всех сравнений. Так что нет, rating party — это не декорация. Это вполне реальный рычаг влияния.
Как подготовиться к участию
Специальной подготовки, само собой, не требуется. Но несколько практических советов всё же не помешают. Первый — убедиться, что монитор откалиброван хотя бы примерно. Сравнивать изображения на экране с перекошенной цветопередачей — сомнительное удовольствие, да и результат будет искажённым. Второй — выделить конкретный отрезок времени. Двадцать-тридцать минут сосредоточенного голосования принесут куда больше пользы, чем полтора часа рассеянного листания между рабочими задачами.
Третий совет — не стоит стесняться пользоваться функцией «пропустить», если она доступна. Иногда попадаются пары, где оба варианта выглядят одинаково хорошо или одинаково плохо. Мучительный выбор в таком случае не даст разработчикам полезной информации. Лучше пропустить и перейти к следующей паре, где разница будет очевиднее. Ну, а четвёртый совет носит скорее философский характер: не стоит воспринимать rating party как рутинную обязанность ради бесплатных минут. Это возможность — пусть и небольшая — повлиять на облик инструмента, которым завтра будут пользоваться художники, дизайнеры и просто любопытные обыватели по всему миру.
Что будет после голосования
Финал рейтинговой сессии обычно проходит тихо. Midjourney не публикует развёрнутых отчётов с графиками и таблицами — по крайней мере, пока. Хольц может обмолвиться в Discord, что «результаты обработаны» и «одна из веток показала себя значительно лучше», но детали остаются за кулисами. Через какое-то время (от нескольких недель до нескольких месяцев) выходит обновление модели, и сообщество начинает тестировать его вживую. Именно тогда и становится понятно, учли ли разработчики мнение голосовавших.
С V8 ожидания особые. Если предыдущие версии совершенствовали существующий подход, то восьмая, по слухам, может принести архитектурные изменения — возможно, переход на гибридную модель, сочетающую диффузию с элементами авторегрессии. Тем более что конкуренты уже экспериментируют с подобными решениями. Результаты голосования покажут, готовы ли пользователи к такому сдвигу или предпочитают эволюционное улучшение привычного движка.
Участие в V8 rating party — это не просто приятный бонус к подписке, а реальный шанс внести лепту в развитие одного из самых внушительных инструментов генеративного искусства. Да и сам процесс затягивает — стоит только начать сравнивать картинки, и полчаса пролетают незаметно. Удачи в голосовании, и пусть ваш выбор окажется тем самым голосом, который склонит чашу весов в пользу по-настоящему добротной модели.

