В каждом семейном архиве, где-то глубоко в шкафу или на антресолях, обязательно найдётся тот самый заветный альбом с бархатной обложкой (или просто обувная коробка), хранящий историю поколений. Лица прадедов, размытые временем, смотрят на нас сквозь пелену царапин, “шума” и выцветшей сепии, безмолвно прося не забывать их и сохранить для потомков. Раньше на восстановление всего одной такой карточки у профессионального ретушёра уходили часы, а то и дни кропотливой работы, да и бил по бюджету такой заказ довольно ощутимо. Сегодня же нейросети превратили этот сложный процесс в доступную магию, способную буквально за секунды вдохнуть новую жизнь в ветхую бумагу. Но чтобы чудо действительно произошло, а не превратилось в карикатуру, машине нужно дать правильное указание. И начать стоит с понимания того, как именно алгоритм «видит» наши воспоминания.
Как это работает?
В представлении многих обывателей искусственный интеллект просто «замазывает» трещины, подобно штукатуру. На самом деле процесс этот куда глубже и интереснее. Нейросеть не просто убирает дефекты, она реконструирует изображение, опираясь на миллионы изученных ранее примеров. Анализируя контекст пикселей, алгоритм догадывается, где должен быть глаз, как именно ложится складка на пиджаке или какой формы была пуговица, наполовину стёртая временем. Это же касается и текстур кожи. Однако слепо доверяться автоматике не стоит. Без чёткого технического задания — промта — результат может оказаться непредсказуемым: царапина превратится в шрам, а пятно от кофе станет частью причёски. Секрет успеха кроется в умении объяснить машине, что именно она видит и что должна с этим сделать.
Анатомия запроса
Сложно ли составить идеальный промт? Нет, если разложить задачу по полочкам. Любой качественный запрос для нейросети строится по определённой логике, напоминающей слоёный пирог. Основа всего — это описание сюжета (Subject). Вы должны чётко обозначить, кто или что изображено на снимке. Простого «человек» машине будет недостаточно. Стоит указать пол, примерный возраст, тип одежды (военная форма 40-х годов, свадебное платье викторианской эпохи) и даже эмоцию. Ведь именно детализация помогает ИИ не «галлюцинировать», дорисовывая лишние элементы.
Далее следует блок, отвечающий за техническое состояние и задачу (Action & Defect Removal). Здесь мы перечисляем то, от чего хотим избавиться. Слова-маркеры вроде «remove scratches» (удалить царапины), «fix tears» (исправить разрывы), «denoise» (убрать шум) служат для алгоритма сигналом к действию. К тому же, необходимо задать целевое качество. Ключевые слова «high definition», «sharp focus», «highly detailed» заставляют нейросеть повышать резкость и прорабатывать мелочи. Ну и, наконец, стиль. Если вы хотите сохранить дух времени, обязательно укажите это, иначе рискуете получить глянцевую современную картинку, лишённую души.
Восстановление портретов
Работа с лицами — это всегда ходьба по тонкому льду. Главное — не потерять портретное сходство. Часто нейросети пытаются «омолодить» объект или подставить усреднённое красивое лицо из своей базы данных. Чтобы этого избежать, промт должен быть максимально скрупулёзным в описании внешности. Для восстановления портрета пожилого человека с сохранением благородных морщин и текстуры кожи запрос может звучать так:
«Restoration of an old vintage photo, close-up portrait of an elderly man wearing a flat cap, 1940s style, highly detailed wrinkled skin texture, realistic eyes, remove dust and scratches, fix fade, sharp focus, 8k resolution, cinematic lighting»
А если перед нами женский портрет, пострадавший от сильного зерна? Тут придётся сделать акцент на мягкости и чистоте. Пример запроса:
«Restore damaged antique photo, portrait of a young woman in a vintage dress, 1920s era, fix blurry face, sharpen eyes, remove grain, clear facial features, authentic film look, natural texture, sepia tone preservation»
Обратите внимание, что упоминание эпохи (1920s, 1940s) помогает нейросети подобрать правильный антураж и не нарисовать современный макияж.
Цвет и атмосфера
Нужно ли всегда раскрашивать чёрно-белые снимки? Вовсе нет. Иногда шарм кроется именно в монохроме. Но если стоит задача увидеть прошлое в цвете (Colorization), к промту нужно добавить специфические команды. Мало просто написать «in color». Машина может раскрасить мундир в розовый, а траву в синий, если не задать ей рамки. Использование двойных прилагательных, таких как «historically accurate» (исторически точный), здесь крайне уместно.
Для колоризации группового семейного фото на природе подойдёт такой вариант:
«Colorize black and white photo, family picnic in the garden, 1950s, natural skin tones, realistic grass green color, sunny day lighting, restore faded colors, vibrant but natural, 4k quality, highly detailed clothing texture»
Здесь мы прямо указываем на естественность тонов кожи (natural skin tones), что является самым сложным моментом для ИИ. Ошибка в этом параметре превращает людей в восковые фигуры.
Сложно ли работать с фоном?
Да, но результат того стоит. Фон на старых снимках страдает чаще всего: оторванные уголки, пятна плесени, выцветшие до белизны участки. Если главные герои еще различимы, то задний план часто превращается в кашу. В таких случаях в промт необходимо вводить описание локации. Это своеобразный «спасательный круг» для композиции. Допустим, мы восстанавливаем фото солдата на фоне разрушенного здания. Запрос должен содержать контекст:
«Full body shot restoration, soldier standing near a brick wall, World War II uniform, fix torn edges, fill missing background parts, remove stains, sharp details, realistic historical atmosphere, profound depth of field»
Команды вроде «fill missing parts» (заполнить отсутствующие части) или «inpainting» (если используется соответствующий режим) дают команду дорисовать утраченные фрагменты. Однако тут есть подводные камни. ИИ может дорисовать что-то лишнее, поэтому контроль за генерацией должен быть строгим.
Отрицательные промты (Negative Prompt)
Этот инструмент — настоящая палочка-выручалочка. Нельзя не упомянуть, что указание того, чего мы НЕ хотим видеть, порой важнее самого описания. В поле Negative Prompt мы отсекаем все возможные артефакты. Львиная доля брака отсеивается именно на этом этапе. Стандартный набор для реставрации выглядит внушительно и должен присутствовать практически всегда.
Примерный список “стоп-слов”, который стоит держать под рукой:
«blur, haze, noise, scratches, distortion, low quality, bad anatomy, deformed eyes, extra fingers, plastic skin, cartoon style, illustration, painting, watermark, text, bad proportions, out of focus»
Использование отрицательного промта позволяет избежать эффекта «мультяшности», когда фотография начинает напоминать рисунок маслом, а не реальный снимок. Ведь наша цель — документальность, а не художественная интерпретация.
Выбор инструмента: нюансы
Существует великое множество сервисов, но подход к ним разный. Если вы используете Midjourney, то там упор делается на творческое переосмысление. Команда «–v 5» или «–v 6» в конце промта даст высокую детализацию, но может изменить черты лица до неузнаваемости. Здесь поможет функция «Vary (Subtle)» уже после генерации. А вот Stable Diffusion — это настоящий комбайн для профессионалов.
В Stable Diffusion промт — это лишь половина дела. Огромную роль играет технология ControlNet. Это, пожалуй, самое мощное оружие реставратора. Подключая модули Canny (для определения границ) или Tile (для добавления деталей при увеличении), вы жёстко привязываете генерацию к исходному контуру. Промт при этом может быть довольно лаконичным: «Best quality, masterpiece, realistic photo, restore old photo, intricate details». Вся суть в том, что ControlNet не даст нейросети уйти в свободное плавание и сохранит композицию и черты лица исходника нетронутыми, лишь обновив текстуры.
Чего стоит избегать?
Натыкаешься на одни и те же грабли довольно часто. Первая ошибка — избыточность. Не стоит перегружать промт противоречивыми командами. Нельзя писать одновременно «vintage look» и «modern cyberpunk lighting» — нейросеть выдаст кашу. Вторая ошибка — ожидание чуда с первого клика. Реставрация — процесс итеративный. Сгенерировали, посмотрели, поправили промт, сгенерировали снова.
Ещё один нюанс касается «чистки». Иногда пользователи так хотят убрать шум, что выкручивают параметр Denoising strength (сила шумоподавления) на максимум. В итоге лицо становится гладким, как пластмассовый пупс. Текстура кожи — это микрошум. Убирая его полностью, вы убиваете реализм. Лучше оставить немного зерна, но сохранить живость взгляда.
Примеры для специфических случаев
Бывают ситуации, когда фото повреждено настолько сильно, что лиц почти ещё не видно. Здесь приходится проявлять фантазию и давать машине больше творческой свободы, описывая типаж. Допустим, снимок сильно засвечен.
«Restore overexposed photo, fix lighting balance, bring back details in highlights, vintage family portrait, standing in front of a wooden house, rustic atmosphere, clear faces, correct contrast, 4k»
Или другая крайность — фото слишком тёмное, «проваленное» в тенях.
«Fix underexposed old photo, brighten shadows, reveal hidden details, night shot of a city street, 1960s car, ambient street light, remove heavy grain, clear visibility, sharp focus»
Отдельно стоит упомянуть работу с одеждой. Ткани на старых фото часто теряют фактуру. Промт должен напоминать машине о материалах.
«Restore texture of the fabric, wool coat, silk dress, detailed embroidery, fix patterns, realistic clothing folds, high resolution»
Это поможет избежать превращения одежды в плоские цветные пятна.
Дополнительные триггеры качества
Чтобы выжать из нейросети максимум, опытные пользователи добавляют в конец промта «усилители» вкуса. Это слова, которые сами по себе ничего не значат для сюжета, но меняют математику генерации в сторону улучшения. К ним относятся: «award winning photography» (фотография, получившая награды), «unreal engine 5 render» (хотя это про 3D, но добавляет детализацию), «studio lighting» (студийный свет).
Но есть и другая сторона медали. Если вы хотите сохранить эффект старой плёнки, добавьте: «daguerreotype» (для совсем древних фото 19 века) или «polaroid aesthetic» (для снимков 90-х). Это сразу задаст правильную цветовую гамму и специфические артефакты, которые будут смотреться уместно и органично, в отличие от цифрового шума.
Реставрация — это диалог
Можно ли считать этот процесс чисто техническим? Скорее, это творческий диалог с вечностью через посредника-машину. Вы выступаете в роли переводчика, объясняющего современному сверхмозгу ценность момента, запечатлённого полвека назад на дешёвую плёнку «Свема». И тут важно чувствовать меру. Иногда стоит оставить небольшую трещинку в углу или легкую размытость фона, ведь именно они придают снимку его документальную ценность и шарм.
Не бойтесь экспериментировать с формулировками. Меняйте порядок слов, ведь те слова, что стоят в начале промта, имеют для нейросети больший вес. Если лицо важнее фона — пишите о лице первым. Если важна атмосфера праздника — начинайте с описания события.
Пусть ваши альбомы перестанут быть просто хранилищем пыльной бумаги. Оживите историю своего рода, покажите детям, какими молодыми и красивыми были их прабабушки. Ведь технологии даны нам не только для развлечения, но и для сохранения самого главного — памяти. Удачных вам генераций, и пусть каждый восстановленный кадр станет маленьким мостом между прошлым и будущим, который теперь простоит ещё долгие годы.