О неисчерпаемости пиксела. Часть 2

Обзоры 3

Некоторые снобы от фотографии утверждают, что "бездушной цифре" никогда
не сравниться с традиционной аналоговой пленкой по уровню художественной выразительности.
Последние достижения в области программного обеспечения для интерполяции делают
ошибочность этого суждения вполне очевидной. В свете данных новаций наблюдаемые
невооруженным глазом пикселы свидетельствуют не об изъянах цифровой природы изображения,
а лишь о неудачном выборе интерполяционного метода.

Самые впечатляющие результаты обеспечиваются нелинейными методами интерполяции,
несколько примеров реализации которых рассматривались в предыдущей части данного
обзора
. Причем стоимость соответствующих
программ исчислялась трехзначными цифрами. Наиболее же доступная программа такого
рода — Inzoomnia от Ларса
Мормана (Lars Mohrmann) — стоит всего 15 евро. Объем ее установочного файла —
0,5 MB, в демонстрационной версии отсутствует возможность сохранения файлов. Inzoomnia
хорошо справляется с прямыми и скругленными линиями, но способна генерировать
"зазубрины" в окрестности остроугольных элементов изображения.


Исходное изображение

Плачевные результаты 20-кратного
увеличения без интерполяции

Inzoomnia

SmartEdge

Pictura (метод AQua-2)

Результаты оптимальной триангуляции
могут напоминать художественную стилизацию ("ненатуральность"
изображения в данном случае объясняется малым числом аппроксимирующих треугольников,
выбранным для наглядности)

Триангуляция с использованием
B-сплайнов стирает грань между растровыми и векторными изображениями

Easy Mosaic

Портрет Джона Кеннеди, составленный
Робертом Силверсом из нескольких тысяч биографических снимков

Портрет Леонида Быкова работы
Игоря Дудника, ведущего киевского художника, специализирующегося в жанре
фотомозаики
.
В качестве мозаичных текстур использованы кадры из фильма "В бой идут
одни “старики”"

Вниманию пользователей, не пасующих перед спартанским интерфейсом и не склонных
впадать в панику при виде десятков опций и параметров, смысл которых может быть
прояснен лишь методом проб и ошибок, рекомендуется программа SAR (текущая
версия — 1.0) Стивена Рузинского (Steven
Ruzinsky
), являющаяся безусловным лидером рынка по соотношению функциональности
и стоимости. Помимо широкого спектра линейных интерполирующих фильтров, она поддерживает
несколько вариантов новейших нелинейных методов Криса Йенсена (Kris Jensen) и
Цзиня Ли (Xin Li), в рамках которых цветовые каналы картинки интерпретируются
как функции, подвергаемые дифференцированию и иным аналитическим операциям. Линии
и углы в масштабируемом изображении при использовании этих методов не столько
увеличиваются, сколько воссоздаются заново в большем масштабе. Выбор кратности
увеличения нелинейных методов в SAR ограничен натуральными степенями двойки. В
SAR встроены механизм создания макросов и даже несложный графический редактор,
позволяющий обрабатывать двухслойные изображения (это может быть удобно для ручной
компоновки нескольких различных результатов интерполяции). В заархивированном
виде программа занимает 1,5 MB; стоимость регистрационного кода — $20; ограничением
нелицензированной версии является невозможность сохранения конечного результата
в файл. В следующем варианте SAR, выход которого ожидается в апреле, будут предположительно
реализованы интерполяционные методы на основе IFS и оптимальной триангуляции (подробнее
о последнем — чуть ниже). Что же касается более дружественного интерфейса, то
появление такового в SAR v.2.0 не ожидается (ибо автор, по его словам,
не намерен ради второстепенных деталей отвлекаться от совершенствования интерполяционных
алгоритмов). Отметим также, что из всех рассмотренных в данном обзоре программ
SAR наиболее требовательна к объему ОЗУ.

Pictura от Digital Multi
Media Design
— приложение, развиваемое американо-румынским коллективом из
четырех программистов под руководством Дариана Муресана (Darian Muresan). Авторы
надеются, что разработанные и запатентованные ими алгоритмы позволят Pictura отвоевать
пальму первенства у Genuine Fractals. AQua-2 (Adaptive Quadratic v.2) — наиболее
совершенный из методов интерполяции, реализованный в данной программе. Он основан
на понятии оптимального восстановления, заимствованного из теории обработки
сигналов
. В рамках данного метода для каждого из синтезируемых пикселов определяется
распределение вероятности значений цветовых компонентов, зависящее от локальных
характеристик изображения. Этот амбициозный проект еще не коммерциализован и находится
на стадии тестирования "пре-альфа-версии", участие в котором возможно
с согласия авторов (размер установочного файла — 9 MB).

В числе других перспективных разработок стоит упомянуть технологию под рабочим
названием SmartEdge, создаваемую по заказу компании Samsung Алексеем Лукиным
из
МГУ
. Ключевой особенностью SmartEdge является использование алгоритма, оптимальным
образом компонующего результаты линейных и нелинейных способов интерполяции в
зависимости от локальных характеристик изображения. Таким образом, каждый из методов
проявляет свои лучшие качества, а риск возникновения артефактов сводится к минимуму.

Проект, осуществляемый в университете Биргхэм Янг под руководством Томаса Седеберга
(Thomas
Sedeberg
), основан на методе оптимальной триангуляции, когда исходная картинка
разбивается на множество маленьких треугольников, стороны которых ориентируются
вдоль границ ключевых элементов изображения. Более перспективно использование
криволинейных треугольников со сторонами, представляющими собой B-сплайны. Успех
этого проекта зависит от того, насколько авторам удастся автоматизировать процесс
триангуляции, сделав его независимым от вмешательства оператора. Знаменательно,
что финансовое участие в проекте Седеберга принимает компания Adobe Systems.

Продолжает в различных вариациях развиваться впервые опубликованный около 20 лет
назад итеративный метод интерполяции с помощью проекций на выпуклое множество
(Projections Onto Convex Sets — POCS).
При необходимости преобразовать с помощью этого метода исходное изображение с
низким разрешением, к примеру в мегапиксельное, оно вначале подвергается интерполяции
одним из обычных методов, после чего каждый из его цветовых каналов интерпретируется
как точка в миллионномерном пространстве. Затем она проецируется на выпуклое множество,
описывающее в этом пространстве некоторый подкласс изображений с резкими границами.
Выпуклость множества (т. е. свойство, запрещающее прямым пересекаться с его границами
более двух раз) позволяет воспользоваться для определения проекции методом последовательных
приближений. Конечный результат вычислений — изображение, близкое к начальному
приближению и имеющее резкие границы. Реализации метода POCS характеризуются большой
вычислительной сложностью и поэтому пока редко применяются на практике.

В Калифорнийском университете разрабатывается метод, ориентированный на увеличение
разрешения изображений, размеры которых первоначально уменьшены с помощью одного
из традиционных алгоритмов интерполяции, после чего доступ к ним в их исходном
виде стал невозможен. Таким образом, можно автоматически определять способ, которым
было сжато изображение, и использовать эту информацию для повышения достоверности
конечного
результата
.

Фотомозаики

Данный обзор был бы неполон без упоминания
об обширном семействе программ для создания фотомозаик, в которых принцип увеличения
размерности исходного снимка за счет искусственного текстурирования реализуется
наиболее последовательно. История этих программ берет начало в середине 1990-х,
когда выпускник Массачусетского технологического института Роберт Силверс (Robert
Silvers) заинтересовался возможностями компьютера для получения картин, составляемых
из множества изображений меньшего размера (как правило, объединенных общей тематикой).
Работы Силверса привлекли внимание не только искусствоведов, но и рекламных агентств,
заинтересованных в создании масштабных изображений, не теряющих информативности
при "разглядывании в упор", и стали быстро расти в цене, исчисляемой
ныне в некоторых случаях шестизначными цифрами. Сегодня основанная Силверсом компания
Runaway Technology кажется
образцовым воплощением американской мечты: сотня ее клиентов входит в список Fortune.
Почтовые ведомства 19 стран заказывают ей разработку дизайна своих почтовых марок,
а в числе знаменитостей, пожелавших увековечить свой облик в виде фотомозаичного
портрета, бывший вице-президент США Эл Гор и король Иордании Хуссейн. Календари
и пазлы из фотомозаик Силверса отмечены наградами японского министерства образования
и австралийской ассоциации любителей игр, а портрет Билла Гейтса, выложенный денежными
купюрами разных стран, стал экспонатом престижнейшей выставки "Картина века",
проводившейся в Национальной лондонской художественной галерее и призванной, по
замыслу ее организаторов, отражать наиболее значимые тенденции в современном изобразительном
искусстве.

Перспектива "бегства" технологии (runaway буквально означает "сбежавший"), которая может быть похищена или каким-то иным образом воспроизведена конкурентами, нисколько не пугает Силверса. Во-первых, она надежно защищена патентами (даже термин photomosaics является зарегистрированной торговой маркой), а во-вторых (и, по его мнению, это главное), конечный результат работы составителя фотомозаики определяется не столько качеством используемых им приложений, сколько его способностью к "творческому симбиозу" с ними. Часто в ходе создания очередного полотна для достижения желаемой цели Силверс меняет не только параметры своего ПО, но и его исходный код. Кстати, из языков программирования он отдает предпочтение обычному C (без "плюсов").

Успех Силверса породил волну подражаний, образчиком которых может служить программа
Easy Mosaic (текущая версия 5.0) компании Hotwind
Software
. Работоспособность нелицензированной версии Easy Mosaic ограничена
20-дневным сроком; размер установочного файла — около 3 MB; стоимость ключей
для регистрации в режимах Home, Professional и Commercial (отличающихся
допустимыми размерами текстур и их количеством) составляет соответственно $29,95,
99 и $149. Пользователям предоставляется доступ ко множеству тематических библиотек
мозаичных текстур.

Квинтэссенцией стремления к полной автоматизации процесса создания фотомозаик,
пожалуй, является проект "дефрагментации Internet" (Des frags) французского
художника-концептуалиста Рейнольда Друхина (Reynald Drouhin): посетителям сайта
http://desfrags.cicv.fr
нужно лишь указать исходное изображение, тему мозаичных текстур (для организации
поиска в Internet), а также адрес электронной почты, по которому будет автоматически
отправлен конечный результат.

В каждом конкретном случае выбор наилучшего метода увеличения разрешения зависит
от таких критериев, как характер исходного материала, кратность его увеличения
и преследуемые художественные цели. Если это ответственное решение вам принять
затруднительно, то, к счастью, можно отдать его на откуп профессионалам, специализирующимся
на интерполяции с использованием самых современных программных средств (см., например,
www.americaswonderlands.com/imaging_services.htm).

В ближайшем будущем на переживающем бум рынке интерполяционных программ, вероятно,
откроется еще больше возможностей для развития. Предчувствуя это, японская фирма
Celartem Technology приобрела
в конце 2002 г. компании Extensis и Lizard Technologies, став, таким образом,
обладателем двух наиболее коммерчески успешных разработок в области увеличения
разрешения изображений.

Перспективы

Так каковы же перспективы описываемого
нами класса ПО? Рассмотрим вкратце некоторые из возможностей.

Широкое распространение формата HDTV вскоре сделает актуальной задачу конвертации колоссальных по объему цифровых и аналоговых видеоархивов, рассчитанных на оборудование с традиционным низким разрешением, и наибольшего успеха в решении этой задачи, очевидно, достигнет компания, владеющая самой совершенной технологией интерполяции.

Кроме того, скачкообразный рост вычислительной мощности графических ускорителей позволит реализовать современные алгоритмы интерполяции в реальном времени, что приведет к существенному улучшению уровня текстурной детализации в играх и других 3D-приложениях.

Повышение качества интерполяции является ключевым направлением совершенствования
цифровых фототехнологий. Если компании Foveon
не удастся
захватить лидерство на рынке фоточувствительных элементов для цифровых камер (а
текущие тенденции не внушают особых надежд), то матрицы с байеровской решеткой
продолжат удерживать свое доминирующее положение. Напомним, что в красном и синем
цветовых каналах изображений, получаемых с помощью таких матриц, на каждый "реальный"
пиксел приходится три синтезированных, что может стать причиной появления цветного
муара — одного из самых неприятных артефактов, свойственных цифровым фотографиям.
Не приходится сомневаться, что современные интерполяционные алгоритмы будут реализованы
во встроенном программном обеспечении цифровых камер завтрашнего поколения. Тем
же, кому не терпится испробовать их сегодня, следует обратить внимание на функцию
Demosaicing, встроенную в программу Pictura.

Многие алгоритмы интерполяции двухмерных изображений могут быть естественным образом модифицированы для работы с трехмерными структурами данных, что позволит увеличивать с их помощью разрешение воксельных массивов. Эта задача актуальна, в частности, для развития методов анализа и визуализации результатов ЯМР-томографии.

Адаптация алгоритмов повышения разрешения к работе в 3D-пространстве изображения–времени придаст импульс развитию методов компенсации движения, применяемых для изменения частоты кадров и плавного варьирования скорости воспроизведения видеоматериалов в монтажных программах.

Оптимизация алгоритмов интерполяции является ключевым моментом для улучшения эффективности так называемых методов пирамидального сжатия. Графические файлы, сжатые посредством таких методов, могут содержать описание изображения в низком разрешении, а также уточняющую информацию о различиях между рядом его последовательных увеличений и исходным объектом. Чем выше достоверность результатов каждого из этапов интерполяции, тем большей энтропийной избыточностью (а стало быть, и "сжимаемостью") характеризуется эта уточняющая информация.

В заключение отметим, что, помимо потенциальной неограниченности перспектив увеличения разрешения изображений, все рассмотренные в данном обзоре программы обладают еще одной вселяющей надежду особенностью: сам факт их существования свидетельствует о том, что рынок графических приложений еще не окончательно поделен компаниями-монополистами и на нем по-прежнему хватает места для энтузиастов-одиночек.

  • ITC.UA

    Комментарии к статье:

    [drupal=16633]О неисчерпаемости пиксела. Часть 2[/drupal]

    [quote][/quote]

    • Anatolij

      Интересно бы узнать состояние этого рынка сегодня.

    • ljt

      поддерживаю