DVD Audio – вопросы без ответов

В марте 1999 г. DVD Forum обнародовал версию 1.0 спецификации DVD Audio. Однако первые коммерческие образцы проигрывателей поступили на прилавки супермаркетов лишь несколько месяцев назад. Миллионы людей во всем мире с удивлением взирают на эти блестящие ящики стоимостью около 1 тыс. долл., которые менеджеры эксклюзивных аудиосалонов с гордостью взгромоздили на обитые черной материей полки. Но рыночные аналитики, основываясь на показателях динамики продвижения технологии DVD, предсказывают, что уже через три года средняя цена на аудиовидеоплейеры нового стандарта снизится до 200 долл., и они станут таким же массовым товаром, каким являются устройства DVD Video сегодня.

Что такое DVD Audio?

Для аудиоданных в логической структуре диска зарезервирован каталог под названием AUDIO_TS. На дисках с видео он пуст, но в нем могут размещаться файлы, записанные с помощью схемы кодирования PCM (Pulse Coded Modulation). Помимо звуковых дорожек, предусмотрено и размещение на дисках DVD Audio дополнительного контента, например видеозаписей или фотографий.

Наиболее эффективным способом использования значительной емкости DVD-диска является "сверхкачественная" стереофоническая запись. В этом случае частота дискретизации достигает величины 192 kHz, а разрядность каждого отсчета — 24 бита. Качество оказывается максимально приближено к недостижимому прежде для бытовой аппаратуры студийному уровню. Для сравнения, обычные компакт-диски имеют куда более скромные показатели: 44,1 kHz x 16 b, что дает нам частотный диапазон шириной около 20 kHz и динамический диапазон всего 96 дБ. Однако даже меломаны серьезно сомневаются в необходимости столь экстремального усовершенствования. Согласно теореме Найквиста (Nyquist), 192 kHz соответствуют частотному диапазону шириной 96 kHz, в то время как верхняя граница частот, различаемых человеческим ухом, пролегает по меньшей мере на 70 kHz ниже. Даже если учесть погрешности, вносимые микросхемой, реализующей аналого-цифровое преобразование, это явная избыточность. Поток данных в таком режиме достигает 9,6 Mbps, что больше пропускной способности, необходимой для демонстрации видео (6,144 Mbps). Для сравнения, звуковое сопровождение кинофильмов в формате Dolby Digital генерирует поток с максимальной скоростью 640 kbps. Но не будем чрезмерно заострять внимание на этом специфическом случае, а огласим весь список предусмотренных вариантов.

Количество каналов 1—6
Динамический диапазон, дБ 144 (при 24-битовой разрядности оцифровки)
Разрядность оцифровки, b 12, 16, 20, 24
Частота оцифровки, kHz
Стереозвук 44,1, 48, 88,2, 96, 176,4, 192
Многоканальный звук 44,1, 88,2 или 48, 96

А теперь коснемся понятия многоканального звука, который и есть ключ к подлинным сокровищам DVD Audio. Под этим подразумевается, что отныне мы сможем не только наслаждаться впечатляющим аудиосопровождением кинофильмов, но и прослушивать записи в режиме объемного звука. Здесь есть свои "но", и чуть позже мы к ним обязательно вернемся. Сейчас позвольте немного проиллюстрировать скупые табличные данные.

При максимальном уровне качества одностороннего однослойного DVD-диска хватит приблизительно на 120 мин стереозаписи. Если же использовать наилучший из доступных многоканальных вариантов, то получится всего около 45 минут звука, что меньше длительности стандартного CD Audio (74 мин). Если вы поинтересуетесь, как Dolby Digital справляется со своими 5 каналами (48 kHz x 24 bit x 5 ch = 720 Kbps), то будет логично порекомендовать вам ознакомиться с принципами психоакустического кодирования. Согласно им, отбрасываются все звуки, которые предположительно не сможет различить среднестатистический человек. Аналогичная методика сжатия с потерями положена в основу стандарта MP3. Однако разработчики прекрасно понимают, что если на свете и существуют среднестатистические граждане, то найти их очень трудно. В частности, именно этот факт подвиг Стивена Спилберга (Steven Spielberg) на создание собственного стандарта под названием DTS (Digital Theater Systems), в котором степень соответствия конечного продукта оригинальному студийному звуковому треку ограничивается только емкостью носителя. Авторы спецификаций DVD Audio пошли еще дальше и приняли бескомпромиссное решение, использовав для сжатия алгоритм Meridian Lossless Packing (MLP). Его эффективность довольно велика, и степень компрессии варьируется между 38% и 52%. Кстати, перед лицом конкуренции с обретающим все большую популярность DTS лаборатория Dolby поспешила приобрести на него лицензию. MLP был создан при участии компании Meridian специально для DVD Forum, а работы над ним начались еще в 1995 г. Одной из основных составляющих MLP является методика предсказания формы волны, которая позволяет обнаруживать корреляции сигнала во времени. Другой алгоритм сжимает данные за счет межканальной корреляции. И наконец, для устранения избыточности в конечном потоке данных используется обыкновенное кодирование Хаффмана (Huffman). Чтобы сгладить пиковые выбросы скорости потока и не допустить превышения максимального значения, определенного стандартом, используется буферизация. Впрочем, полностью исключить ситуации, когда MLP не сумеет справиться с чрезвычайно насыщенным входным сигналом, невозможно. Поэтому задача динамической коррекции параметров кодирования (разрядности, частоты дискретизации) остается на усмотрение продюсера. А это означает, что необходимо обращать первоочередное внимание на имя студии-издателя. Частота дискретизации определяется для каждого канала индивидуально. Так что становятся возможными компромиссные решения, когда, например, основные каналы записываются с максимальным качеством, а фоновые — на вдвое меньшей частоте дискретизации.

Структура диска Super Audio CD

Еще одной важной задачей MLP стала реализация предусмотренного в спецификациях стандарта DVD-A микширования многоканального звука в обычное стерео. Получить корректный результат удается с помощью особых кодов, внедренных в поток. Они носят название System Managed Audio Resource Technique (SMART) и определяют весовые коэффициенты для каналов при микшировании. Если же такое решение все-таки не удовлетворяет продюсера, то двухканальную запись можно разместить на диске отдельно. Вообще говоря, вследствие разнообразия возможных вариантов записи предполагается, что на диске будет располагаться сразу несколько версий с различным количеством каналов и различной частотой дискретизации.

Дитя ошибок трудных…

Индустрия развлечений находится на перепутье, и состояние крайней растерянности наиболее крупных ее представителей сказывается на общем благополучии отрасли. Вместе с ростом уровня и возможностей бытовой техники все большую свободу в обращении с контентом получают рядовые потребители. И это не вписывается в концепцию современных методов дистрибьюции информационного продукта. В результате, в тщетных попытках уберечь свое интеллектуальное достояние от нелегального использования производители зашли в тупик. Избранная стратегия защиты контента с помощью кодирования не эффективна. Каким образом доставить информацию к пользователю так, чтобы он не мог ее скопировать, но, тем не менее, был в состоянии использовать? Решение этой дилеммы уже хорошо известно и было сформулировано учеными Берклеевского университета при разработке системы OceanStore: "Невозможно заставить независимую систему забыть переданные ей данные". Взлом кода CSS, которым защищалось содержимое дисков DVD Video, привел в замешательство поставщиков и стал одной из причин задержки анонса DVD Audio. Однако специалисты, непосредственно причастные к разработке схемы кодирования, отнеслись к этому факту абсолютно спокойно. "Мы никогда не утверждали, что CSS — это военная тайна. Мы все время говорили, что это легкая кодирующая система, и знали, что рано или поздно она будет взломана. Она продержалась существенно дольше, чем мы рассчитывали", — говорит Майкл Мораджадех (Michael Moradzadeh), управляющий юридического департамента корпорации Intel. Еще более конкретно по этому поводу высказался Брюс Шнайер (Bruce Schneier), основатель Counterpane Internet Security: "Не имеет значения, насколько хороша кодирующая схема, данные DVD доступны в открытом виде любому, кто может написать программу, чтобы взять их. Программная защита контента не работает. Она не может работать. Вы можете распространять зашифрованный контент, но для чтения, просмотра или прослушивания его необходимо расшифровать, компьютер должен иметь копию ключа и алгоритм для декодирования. Достаточно сообразительный хакер с хорошим отладочным инструментарием всегда сможет провести анализ алгоритма, получить ключ или просто перехватить контент после расшифровки".

О чем это говорит? Лишь о том, что высокая устойчивость к взлому внедряемой схемы CSS2 — не более чем плод фантазии руководства медиагигантов.

Следующая проблема, головная боль зарубежных издателей, которая завтра вполне может стать нашей, — "водяные знаки". Они вряд ли смогут защитить от пиратского копирования, однако должны помочь идентифицировать участников преступления. Идея, положенная в основу "водяных знаков", весьма уязвима. В аудиозаписи предлагается внедрить информацию таким образом, чтобы она сохранялась при использовании психоакустического сжатия и была при этом не слышна! А если учесть, что "водяной знак" должен "выживать" при существенном снижении частоты оцифровки — миссия и вовсе кажется невыполнимой. Поэтому когда Verance вместе с организацией SDMI (Secure Digital Music Initiative), образованной крупнейшими звукозаписывающими компаниями, в том числе BMG, EMI, Sony, Warner и Universal, объявила о готовой технологии, многие эксперты отнеслись к данному факту критически. Все же соблазн был велик, и другая группа, в которой числятся многие корпорации—разработчики DVD Audio — 4C Entity LLC (Intel, IBM, Matsushita, Toshiba), приняла методику Verance в качестве рекомендуемой защитной системы формата. Результаты тестирования, проведенного, по словам представителя Verance Дэвида Лейбовича (David Leibowitz), "буквально десятками" фирм, выпускающих музыкальную продукцию и оборудование, оказались засекреченными. Лейбович утверждает, что "не знает ни об одной компании, которая нашла их ("водяные знаки") слышимыми", и… … лукавит. "Заговор молчания" нарушил аудиоинженер британской фирмы Telarc — Тони Фолкнер (Tony Faulkner). Во-первых, он заметил, что, с его точки зрения, набор аудиозаписей был крайне неудачен. Он пишет: "Я оценил в 75% идентифицируемость "водяных знаков" на двух отдельных прослушиваниях. Это звучало, как жужжание пчел на среднем расстоянии со смазанной стереокартиной. "Водяные знаки" могут свести качество DVD-A к чему-то, находящемуся между хорошим MiniDisc’ом и средним CD".

Тестирование проходило и по другую сторону Атлантики. Вслед за Фолкнером (но куда более осторожно) свое неудовлетворение процедурой прослушивания выразил американский инженер Чак Эйнли (Chuck Ainlay), который сказал в интервью онлайновому изданию WebNoise: "…тесты были проведены объективно, но единственной предложенной тестовой музыкой были новые записи электрогитариста Марка Кнопфлера (Mark Knopfler), а не симфоническая, джазовая или другая музыка с широким динамическим диапазоном и большей насыщенностью деталями". В свете замечаний Фолкнера о "жужжании пчел" ясно, почему умудренные опытом американские устроители этого "передвижного цирка" предпочли электрогитару симфоническому оркестру. На самом деле результат полновесного использования "водяных знаков" должен быть еще хуже, поскольку, как выяснилось, эксперты оценивали лишь сокращенный вариант кодировки. "Это можно услышать сейчас, с двумя битами внедренной информации, как же оно будет звучать с полным 72-битовым идентификатором?" — задает себе вопрос Фолкнер. Воистину, технология компании Verance, мягко говоря, "не пара" высококачественным трекам DVD Audio. Покупатель, выкладывающий значительную сумму за возможность слушать аудио с частотой дискретизации 192 kHz, вправе ожидать большего, не так ли? Во всяком случае, известная независимая звукозаписывающая компания Telarc на этот вопрос уже дала положительный ответ, и ее продукция не будет снабжаться никакими "водяными знаками". Столь же осторожно к внедрению новинки подошли специалисты Sony, работающие над продвижением своего проекта нового аудиоформата. "Причина, по которой существует SACD, — это его качество. Так что мы весьма осторожно относимся к тому, чтобы добавить туда нечто, ухудшающее это качество". Читатель, который не вполне знаком с нынешней конъюнктурой рынка цифрового аудио, вероятно, уже озадачен: Sony, SACD?

Sony, SACD и все такое…

Как объяснить появление независимого от DVD Forum формата аудиодисков? То ли традиционной любовью Sony к внедрению патентованных, карманных стандартов, то ли сожалением о своей давнишней разработке Audio CD, стремительно отходящей в прошлое, то ли "заботой" о потребителе? О чем можно говорить с уверенностью, так это о том, что менеджеры корпорации лишь спят и видят, чтобы повторить громогласный успех компакт-диска. Так появилась идея Super Audio CD или SACD. Технология является совместной разработкой Sony и Philips. В основе ее двухслойный компакт-диск, который содержит нормальный отражающий слой, совместимый со стандартными CD-проигрывателями, и расположенный над ним полупрозрачный слой. Старые CD-приводы будут способны читать нижний слой, а новые, поддерживающие SACD, с помощью лазеров с длиной волны 650 нм получат доступ к верхнему. Кстати, последний полностью соответствует стандарту DVD по таким показателям, как тип модуляции, алгоритм коррекции ошибок, размер сектора и файловая система. Получается некий гибрид форматов CD и DVD. Однако для SACD используется другой метод кодирования аудиопотока: Direct Stream Digital (DSD). Его суть заключается в окончательной победе избыточной частоты дискретизации над битовым разрешением. Как известно, наиболее простой метод достижения большей точности описания амплитуды аналогового сигнала цифровой последовательностью заключается в повышении разрядности оцифровки. Но здесь возникает проблема тепловых шумов, которые не позволяют в действительности добиваться разрядности сэмпла свыше 20 битов. Чтобы расширить границы амплитудного диапазона за эти пределы, используется техника выборки с запасом по частоте дискретизации (oversampling). Увеличивая частоту дискретизации, возможно компенсировать недостаток разрядности, что в финале приводит к созданию быстродействующих однобитовых аналого-цифровых преобразователей. Поскольку эта техника получила уже широкое распространение, процесс "мастер-диск — слушатель" содержит в себе два лишних конвертирования: сначала однобитовый сигнал преобразовывают в 24-битовую форму и записывают на диск, а затем цифро-аналоговый преобразователь аудиосистемы выполняет обратную операцию. Таким образом, при воспроизведении приходится использовать интерполяцию и фильтрацию, что, конечно, вносит свои коррективы в оригинальное звучание. Создавая SACD, инженеры Sony и Philips решили записывать на диск данные в исходном однобитовом виде — в этом и заключается идея DSD. Это позволило альянсу заявить о возможности более точной регистрации амплитуды, чем при традиционном кодировании PCM из-за ограничения на разрядность чисел.

Итак, что нам обещает Super Audio CD? Максимальный частотный диапазон до 100 kHz, диапазон изменения амплитуды — 120 дБ, многоканальный звук. Частота дискретизации благодаря применению однобитового кодирования превышает 2 MHz. Емкость носителя — 4,7 GB, что соответствует формату DVD-5 (один слой, одна сторона). На диск помещается около 100 минут музыки, однако в отличие от DVD Audio из дополнительных материалов поддерживаются только тексты и статические изображения. Защита от копирования пока реализована в виде "водяных знаков" двух уровней: видимых и закодированных в структуре диска (PSP — Pit Signal Processing).

Плюсы и минусы

Сначала рассмотрим сложившуюся сегодня ситуацию. Во-первых, оба разработанных стандарта не совместимы с выпускаемым ныне оборудованием. Все эти ресиверы, цифровые процессоры, декодеры Dolby и DTS, DVD-плейеры не способны воспроизвести ни DVD-A-, ни SACD-диски. Производство двухслойных CD/DVD-комбикомпактов крайне сложное и дорогостоящее, поэтому первые выпущенные альбомы стоят $25 и более. При этом надо учитывать, что цены пока устанавливает японско-голландский альянс, и, вероятнее всего, это лишь нижняя планка. Кто из владельцев обычных CD-проигрывателей будет покупать более дорогой диск при наличии альтернативы? Ведь с их точки зрения это обычный компакт, ничем не отличающийся от прочих, за исключением стоимости. При этом DVD-A находится в гораздо более выгодном положении. Во-первых, существует отлаженное производство, готовое массово штамповать продукцию, приближенную по себестоимости к обыкновенному CD. Во-вторых, любой DVD-Video-плейер позволит вам воспользоваться как бонусами аудиодиска, так и треками совместимости в формате Dolby или DTS. Великолепный объемный звук сам по себе, без повышенной частоты дискретизации, представляет собой значительный интерес для потребителя.

Теперь сравним имеющуюся на рынке технику воспроизведения. И опять DVD оказывается впереди: цена на первые плейеры, поддерживающие как видео, так и аудио, колеблется в районе 1000 долл. Например, JVC с ноября прошлого года предлагает устройство XV-D721BK стоимостью $899. Сторонникам SACD придется раскошелиться — поначалу Sony вообще оторвалась от земной поверхности, представив линейку плейеров от 3,5 тыс. долл. и дороже. Позднее фирма спохватилась, и сейчас вы можете приобрести устройство, способное воспроизводить еще и DVD-Video, "всего" за $1500.

Вернемся к обещанному в первом разделе "но", касающемуся многоканального режима. Эффект от прослушивания объемного звука, конечно, впечатляющий, однако музыка — это не кино. Как утверждают аналитики, большинство людей привыкло слушать музыку на рабочем месте, в автомобиле, во время утренней пробежки, приготовления еды и выполнения прочих домашних дел. Правда, они забыли о таких вещах, как вечеринки. Так что по мере удешевления оборудования различия будут стерты, и люди постепенно забудут Audio CD, как они уже забыли виниловые проигрыватели. И здесь возникает следующий вопрос……

Отчего так высока цена? В частности, потому, что требование воспроизводить треки 192 kHz/24 b входит в обязательный набор спецификаций DVD-Audio. В пользу того, что внедрение таких высоких частот дискретизации и прецизионной точности измерения амплитуды является избыточным, говорит факт успешной работы алгоритма сжатия без потерь с полученным потоком аудиоданных. Корреляции между соседними сэмплами и каналами достигают 30—50%, и это что-то да значит! С другой стороны, усредненные проценты сжатия нельзя возводить в ранг абсолюта и утверждать о возможности сокращения потока наполовину без потери качества. Ясно одно, излишне строгие требования к качеству порождены не заботой о потребителе, а попыткой производителей заполнить значительный объем DVD-диска "хоть чем-нибудь, только не MP3-файлами". Теперь их главная задача — убедить рядового обывателя в том, что ему (чтобы не отстать от прогресса) крайне необходим идеальный звук. Здесь положительные и отрицательные моменты перемешались в такую густую и неудобоваримую смесь, что разобраться становится крайне трудно. И напоследок: пусть вас не вводит в заблуждение красочная наклейка "DVD Audio Compatible" — некоторые ранние модели плейеров (в частности, фирмы Pioneer) не поддерживают проигрывание и декодирование контента DVD-A и работают только с совместимыми Dolby-треками!