Что нового в масштабном обновлении популярного генератора Ideogram 2.0

Ещё пару лет назад сгенерировать картинку с читаемым текстом внутри неё казалось чем-то из области фантастики — нейросети упорно коверкали буквы, путали слоги и выдавали абракадабру вместо надписей на вывесках и постерах. Потом появился Ideogram, и львиная доля этих проблем словно растворилась в воздухе. Сервис быстро набрал аудиторию, а дизайнеры и маркетологи по всему миру начали использовать его как добротный рабочий инструмент, а не игрушку для развлечений. Но команда разработчиков не остановилась на достигнутом, и весной 2025 года свет увидела вторая версия генератора — Ideogram 2.0, — которая, по заверениям создателей, переосмыслила сам подход к генерации изображений. А чтобы разобраться, где тут реальный прорыв, а где маркетинговый антураж, стоит рассмотреть каждое нововведение по отдельности.

Что изменилось в качестве изображений?

Первое, что бросается в глаза при работе с обновлённой версией, — внушительный скачок в детализации. Раньше мелкие элементы вроде пуговиц на рубашке, прожилок на листе или текстуры камня часто «замыливались», особенно на периферии кадра. В Ideogram 2.0 с этим дело обстоит иначе. Нейросеть научилась прорисовывать такие нюансы гораздо скрупулёзнее, и разница заметна даже при беглом сравнении двух версий. К слову, разрешение по умолчанию тоже подросло — теперь генерация выдаёт изображения с плотностью пикселей, достаточной для печати на формате А3 без видимой потери качества. Это связано с тем, что архитектура диффузионной модели была полностью переработана, а не просто «подкручена» сверху.

Отдельно стоит упомянуть работу с освещением. Предыдущая версия довольно часто грешила неестественными тенями — свет падал откуда-то сразу со всех сторон, и объект выглядел плоским, словно вырезанным из журнала. Новая модель куда лучше справляется с физикой света. Тени ложатся мягко, рефлексы на глянцевых поверхностях выглядят убедительно, а контражурные сцены (когда источник света за спиной объекта) перестали превращаться в чёрные силуэты без деталей. Ведь именно свет делает картинку живой, и разработчики Ideogram это, судя по всему, отлично понимают.

Текст на изображениях — по-прежнему козырь?

Безусловно. И даже больше, чем раньше. Собственно, умение «писать» — та самая изюминка, которая когда-то вывела Ideogram в авангард генераторов. Но если в первой версии корректное отображение текста срабатывало примерно в семи случаях из десяти, то теперь точность приблизилась к девяти из десяти, а то и выше. Нейросеть стала значительно реже путать порядок букв, перестала «зеркалить» отдельные символы и даже научилась более-менее сносно работать с кириллицей — хотя тут, признаться, до идеала ещё далеко. Латиница по-прежнему в приоритете.

Что интересно, генератор теперь лучше понимает контекст надписи. Если в промте указано «неоновая вывеска бара», буквы получат характерное свечение и лёгкое размытие по краям. А если речь идёт о рукописной записке, шрифт станет менее ровным, с лёгким наклоном — как у настоящего почерка. Раньше подобные тонкости приходилось буквально вытягивать из модели десятками перегенераций. И всё же не стоит ждать от нейросети каллиграфического совершенства: длинные фразы из пяти-шести слов иногда всё ещё «ломаются», особенно если задать нестандартный шрифт в промте.

Новый редактор и работа с холстом

Пожалуй, самое неоднозначное нововведение. Ideogram 2.0 получил встроенный канвас — полноценный холст для пост-обработки сгенерированных картинок прямо в интерфейсе. Зачем это нужно? Дело в том, что даже самый точный промт не всегда выдаёт идеальный результат с первого раза. Раньше приходилось скачивать изображение, тащить его в Photoshop, что-то подправлять и снова загружать. Теперь нужный фрагмент можно выделить кистью прямо внутри сервиса и переписать промт только для этой области. Это называется «инпейнтинг», и реализован он здесь довольно неплохо.

Кроме того, появилась функция «аутпейнтинга» — расширения границ картинки за пределы исходного холста. Допустим, сгенерирован портрет человека по пояс, а нужен — в полный рост. Теперь модель сама достраивает недостающую часть, сохраняя стиль и палитру оригинала. Впрочем, тут есть подводные камни. Если исходное изображение сложное (например, с архитектурной перспективой), стыки иногда выглядят неестественно. Но для простых композиций и абстрактных фонов инструмент работает на удивление достойно.

Стоит ли переходить на платную подписку?

Вопрос, который волнует едва ли не больше, чем все технические улучшения вместе взятые. Ideogram 2.0 сохранил бесплатный тариф, однако львиная доля новых функций доступна именно в платной версии. Бесплатный план позволяет генерировать до 25 изображений в день — неплохо для экспериментов, но для серьёзной работы маловато. А вот базовая подписка (порядка 8 долларов в месяц) снимает ограничения на количество генераций и открывает доступ к канвасу, аутпейнтингу и приватному режиму, когда созданные картинки не попадают в общую галерею сервиса.

Бьёт ли это по бюджету? Для фрилансера или владельца небольшого бизнеса — не сильно. Тем более что конкуренты вроде Midjourney за сопоставимый набор функций просят примерно столько же, а где-то и больше. Другой вопрос — есть ли смысл платить, если генерация нужна от случая к случаю, пару раз в неделю. Тут ответ скорее отрицательный: бесплатного лимита для нерегулярного использования хватает. Но если Ideogram — рабочий инструмент на каждый день, подписка себя окупает довольно быстро.

Промты и понимание естественного языка

Одно из самых заметных улучшений — модель стала значительно лучше «считывать» длинные и сложные текстовые описания. В первой версии промт из двух-трёх предложений нередко сбивал нейросеть с толку: она цеплялась за одни слова и полностью игнорировала другие. Теперь же разработчики утверждают, что архитектура языкового энкодера переписана с нуля. И на практике это ощущается. Можно задать что-то вроде «пожилой мужчина в льняной рубашке сидит на веранде деревянного дома, рядом стоит кружка с чаем, на заднем плане — закат над полем подсолнухов» — и получить картинку, где присутствуют все перечисленные элементы. Раньше подсолнухи могли «переехать» на рубашку, а кружка — вовсе исчезнуть.

К тому же появилась поддержка негативных промтов (в платной версии). Это значит, что теперь можно явно указать, чего на картинке быть не должно: «без людей», «без текста», «без водяных знаков». Да и самим пользователям так комфортнее — вместо того чтобы подбирать хитрые формулировки, пытаясь обойти нежелательные элементы, достаточно просто вписать запрет в отдельное поле. Вещь, казалось бы, очевидная, но в первой версии её не было, и это многих раздражало.

Новые стили и стилизация

Грандиозное расширение стилевой палитры — ещё одна фишка обновления. Ideogram 2.0 предлагает более сотни предустановленных стилей, и среди них встречаются довольно экзотические варианты: от японской гравюры укиё-э до эстетики ретрофутуризма 1960-х. Но куда интереснее другое — появилась возможность загружать собственное референсное изображение и просить модель генерировать в его стиле. Фактически это аналог Style Reference, который ранее был доступен только в Midjourney. И работает он, нужно признать, весьма недурно.

Однако тут есть ложка дёгтя. Стилизация под конкретного художника всё ещё вызывает вопросы — и этические, и технические. С этической стороны Ideogram старается фильтровать запросы, содержащие имена живых авторов. А с технической — стилизация через референс иногда тяготеет к прямому копированию, а не к творческой интерпретации. Нюанс тонкий, но для профессионалов он важен. Впрочем, для коммерческих задач вроде создания мудбордов или концепт-артов инструмент справляется более чем достойно.

Скорость и API для разработчиков

Не менее важное изменение — оптимизация скорости генерации. Если раньше одно изображение в высоком разрешении могло формироваться секунд двадцать-тридцать, то теперь среднее время сократилось до восьми-двенадцати секунд. Ощутимая разница, особенно когда нужно перебрать десяток вариантов подряд. Кстати, сама очередь на генерацию для платных пользователей стала значительно короче — приоритет обработки запросов у них выше, чем у бесплатных аккаунтов.

Ну и, конечно же, нельзя не упомянуть появление полноценного API. Разработчики наконец-то открыли программный интерфейс, через который можно интегрировать генератор Ideogram в сторонние приложения, сайты и рабочие пайплайны. Раньше такой возможности не было вообще, и это серьёзно ограничивало использование сервиса в продакшн-среде. Теперь же автоматизировать создание графики для карточек товаров, баннеров и социальных сетей стало куда проще. Документация, к слову, написана толково и разобраться в ней сможет даже разработчик без глубокого опыта работы с нейросетевыми API.

Как Ideogram 2.0 смотрится на фоне конкурентов?

Сравнение неизбежно — рынок генеративных нейросетей сейчас переживает настоящий бум. Midjourney по-прежнему солирует в плане «художественности» результата и остаётся фаворитом иллюстраторов и концепт-художников. DALL-E 3 от OpenAI берёт удобством интеграции с ChatGPT. Stable Diffusion привлекает тех, кому важна открытость кода и возможность тонкой настройки на собственном железе. А Ideogram 2.0 занимает свою нишу — это, пожалуй, лучший выбор для тех, кому критически важен читаемый текст на картинках и при этом нужен современный крепкий генератор общего назначения.

Многие считают, что все нейросети для генерации картинок плюс-минус одинаковые. Но на самом деле разница становится очевидной, стоит только копнуть чуть глубже поверхностных тестов с запросом «красивый кот в шляпе». Там, где Midjourney выдаёт живописное полотно, Ideogram предложит более «дизайнерский», чистый результат с акцентом на типографику. И для коммерческих задач — создания логотипов, макетов упаковки, обложек — именно этот подход зачастую оказывается полезнее.

Обновление получилось действительно масштабным, и тем, кто работает с визуальным контентом на постоянной основе, определённо стоит выделить вечер и «пощупать» новую версию собственными руками. Даже бесплатного лимита хватит, чтобы оценить прогресс и понять, вписывается ли Ideogram 2.0 в ваш рабочий процесс. А если вписывается — генератор наверняка станет одним из тех инструментов, к которым возвращаешься снова и снова. Удачи в творческих экспериментах!