Обзоры
ML-ROM, или Как уместить 100 GB на одном DVD
0

ML-ROM, или Как уместить 100 GB на одном DVD

Индустрия дисковых накопителей всегда отличалась консервативностью. Нововведения здесь крайне редки и воспринимаются рынком очень неохотно. Компакт-диск вообще побил все рекорды долголетия — два десятилетия почти без изменений. Впрочем, последние два-три года ознаменовались появлением целого ряда новых технологий: DVD, SACD, FMD-ROM, а теперь еще и ML-ROM от Calimetrics.

Небольшая исследовательская компания из Калифорнии собирается как минимум утроить емкость традиционных CD- и DVD-носителей, фактически не внося серьезных изменений ни в устройство приводов, ни в методику штамповки. Более того, пропорционально росту емкости увеличится и линейная скорость считывания. Плюс ко всему принципы технологии многоуровневой записи (ML — Multi Level recording) с успехом распространяются и на CD-R/RW, DVD-R/RW. С учетом того, что новые приводы отличаются от старых только чипсетом, это создает самые благоприятные условия для безболезненной и быстрой адаптации нововведения.

Calimetrics была основана в 1994 г. Томасом Бурке (Thomas Burke), Терренсом Вонгом (Terrence Wong) и Майклом О’Нэйлом (Michael O’Neill). В роли президента компании выступает опытный руководитель Кеннет Кэмпбэлл (Kenneth Campbell), работавший в Xerox (в том числе и вице-президентом по исследованиям) и в Pinnacle Micro.

Помимо вышеупомянутой троицы "отцов-основателей", в Calimetrics трудится 38 высококвалифицированных специалистов, 10 из которых являются докторами наук. Как и любой технологический стартап, калифорнийская фирма аккумулировала совершенно невероятное количество патентов — более 80.

В ноябре 1997 г. было положено начало четырехлетней исследовательской программе с впечатляющей конечной целью: достижение емкости 100 GB для DVD-дисков. Работы, проводимые компанией, являются частью программы Multiple Optical Recording Enhancements (MORE) Joint Venture, объединяющей инженеров и ученых из корпораций Polaroid и Energy Conversion Devices, а также двух университетов — University of Arizona и Georgia Tech. Видимым свидетельством обмена информацией между участниками стал трансфер технологии оптики ближнего поля (near-field optics). В марте прошлого года эксклюзивную лицензию на ее использование Calimetrics получила от Polaroid… вместе с несколькими ведущими сотрудниками. Теперь Дмитрий Везенов и Леонард Ван (Leonard Wan) под руководством Джона Гуэрры (John Guerra) продолжат совершенствование разработки, получившей название nOptics, на новом месте.

Рис. 1

Словосочетание "ближнее поле" здесь означает способ фокусирования пучка света, когда энергия чрезвычайно малых размеров пятна, существующего только внутри иммерсионной линзы, "просачивается" сквозь микроскопический зазор между головкой и поверхностью носителя. Это результат действия так называемого "эфемерного сцепления" (evanescent coupling) — электромагнитные волны, локализованные в пределах определенной области, не исчезают за ее границами моментально, а постепенно угасают. Задача удержания головки на необходимой для проявления эффекта дистанции от неровного диска, который вращается на огромной скорости, невероятно сложна. В чем секрет иммерсионной линзы? Максимальная точность фокусировки зависит от числовой апертуры объектива, которая в свою очередь зависит от разницы коэффициентов преломления между веществом линз и окружающей средой. В воздухе числовая апертура не может быть больше единицы, однако, поместив линзу в масло или вообще твердое вещество, удается преодолеть данное ограничение. Технология nOptics позволила разделить иммерсионную линзу на две части. Первая располагается на головке, обладая традиционной для DVD-технологии числовой апертурой, равной 0,6, а другая, в виде раздельных полуцилиндрических элементов размером 370 нм, нанесена на диск методом "штамповка + напыление". Суммарная эффективная числовая апертура описанной системы равняется как минимум 1,5, как максимум 2. Из рис.1 видно, что пятно света диаметром 540 нм, генерируемое лазерной головкой, сужается элементом нанооптики до 90 нм. Благодаря уникальному принципу "одна линза — один пит" величина межсимвольной интерференции (inter-symbol interference) составляет всего 26 дБ, а интенсивность конечного луча в два раза выше, чем оригинального. nOptics в комбинации с ML позволит восьмикратно увеличить емкость CD- и DVD-R/RW-накопителей. И снова усовершенствование потребует лишь минимальных изменений в конструкции приводов.

Основы технологии

Идея многоуровневой записи данных витала в воздухе чуть ли не с момента изобретения компакт-диска. Как отмечается в документах компании, первые упоминания об этой методике восходят еще к 1981 году.

Рис. 2

Принцип, лежащий в основе, элементарен до смешного: штампованные углубления на поверхности отражающего слоя компакт-диска (pits, питы) теперь имеют переменную глубину. Лучи, отразившиеся от дна углубления и окружающей его поверхности, взаимодействуют, и в зависимости от глубины пита создаются различные условия интерференции, следовательно, результирующая интенсивность меняется. На рис. 2 для сравнения показаны увеличенные участки носителей, записанных с помощью традиционной и ML-технологии. ML-R- и ML-RW-методики полностью аналогичны ML-ROM, за исключением того, что тут варьируется не глубина канавки, а отражательная способность (т. е. регулируется мощность пишущего лазера).

Однако введение ML принесло с собой целый ворох проблем, связанных с высоким уровнем шума и межсимвольной интерференцией. Прежде чем рассказать о решении, поясним некоторые основополагающие понятия. Например, данные записываются на диск с применением бинарного кода с ограничением длины серии (run-length limited code). Каждый вариант кода характеризуется двумя параметрами: нижней границей (lower limit) — d и верхней границей (upper limit) — k. d — это минимальное количество нулей, которые могут разделять две единицы, а k, соответственно, максимальное. Таким образом, удается ограничивать влияние межсимвольной интерференции, проявляющейся особенно сильно при частой смене нулей и единиц. Благодаря наличию верхней границы снижается вероятность потери синхронизации, т. е. ситуации, когда электронные схемы декодирования перестают четко регистрировать границы питов. На практике для SACD- и DVD-носителей используется код EFM+. Аббревиатура расшифровывается как Eight-to-Fourteen Modulation и означает, что к каждому байту приписывается 8 дополнительных нулевых битов. Правила, по которым производится вставка "буферных" нулей, занесены в специальную таблицу подстановок. В ней для каждого из возможных 256 байтов записаны четыре 16-битовых слова, каждое из них соответствует одному из переходных состояний. Переходных состояний всего 4, они определяются видом предыдущего слова и представляют собой дополнительное правило, влияющее на выбор текущего подстановочного варианта. Человек, знакомый с английским хотя бы в пределах школьного курса, должен уже возмутиться: EFM означает 8 к 14, а не 8 к 16! Все верно, название отражает уже не столько суть метода, сколько его историю — оригинальный вариант действительно предусматривал замену байта 14-битовым словом. Но к нему приходилось добавлять 3 нулевых "буферных" бита, предотвращающих возникновение интерференции между словами. Теперь благодаря внедрению переходных состояний эта проблема ушла в прошлое вместе с одним лишним битом. Максимальная плотность размещения данных при использовании EFM+ достигает 1,5 b/pit (для M=2, d=2).

Рис. 3

Вернемся к многоуровневой технологии. Здесь каждый пит может представлять не одно, а сразу несколько значений. Данные размещаются на диске в виде непрерывного углубления или, говоря иначе, канавки с переменной глубиной. Изменения глубины происходят дискретно с неким минимальным шагом, который и суть "пит" (рис. 3). Исследователи из Calimetrics оказались перед тяжелым выбором разновидности кода (d, k) и количества уровней глубины (M). Они остановились на варианте d=0, M=8, и как честно признались разработчики, исключительно из-за его простоты.

Чтение многоуровневой дорожки с параметром d=0 затруднено межсимвольной интерференцией, которая иногда становится причиной появления нелинейных искажений. Хороший пример взаимовлияния питов показан на рис. 4. В результате чередования существенно различающихся по амплитуде участков считываемый сигнал становится мало похож на оригинальный. Изменения, связанные с общим состоянием связки "диск-головка", обычно корректируются с помощью обработки сигнала инвертированной ФПМ — функцией передачи модуляции (MTF, Modulation Transfer Function). Но когда искажения сложным образом зависят от

Рис. 4

характера информации, ФПМ бессильна. Нелинейности удалось промоделировать с помощью полиномиальной функции, содержащей 13 коэффициентов, подобранных в ходе считывания набора тестовых последовательностей. Однако объем вычислений, необходимых для такой коррекции, довольно велик и требует внесения серьезных изменений в электронные компоненты стандартных CD-приводов. Избежать этого удалось за счет переноса задачи коррекции со стадии считывания на стадию изготовления. При подготовке информации к записи она подвергается незначительной коррекции (фильтрации) с помощью сложной функции — этап прекомпенсации. Чтобы восстановить исходные данные после считывания также используется выравнивающая функция (equalization), но с незначительным количеством коэффициентов.

Несмотря на все усилия, в 1997 г. в опытных образцах разработчикам не удалось даже приблизиться к необходимому уровню шума. Намереваясь создать максимально совместимые с CD- и DVD-технологиями привод и диск, разработчики невольно взяли на себя обязательство соответствовать основным, принятым для данных устройств, стандартам. В том числе и системе коррекции ошибок, а именно, общепризнанному алгоритму Рида-Соломона (Reed-Solomon product code). Он основывается на использовании небольшого числа дополнительных битов четности, позволяющих корректировать данные при условии непревышения некой граничной плотности ошибок. Общее представление о коде Рида-Соломона вы можете получить, ознакомившись с текстом вставки.

Отталкиваясь от параметров кода коррекции ошибок, принятого DVD-форумом, можно утверждать, что нельзя допускать превышения порога в 10-3 BER. В пересчете на динамический диапазон при 8-уровневом кодировании все отклонения должны быть сведены к 2,4%. В первых опытных образцах привода (использовалась стандартная считывающая головка от 6X CD-ROM) для диска, созданного без прекомпенсации, среднеквадратическое отклонение составило 4,9%, а с ее применением снизилось до 2,9%, что, следует заметить, также не удовлетворяет первоначальным требованиям. После оценки вклада, который вносят различные элементы системы, оказалось, что наибольшее влияние на результат оказывали лазер, применявшийся для изготовления диска, и электромагнитные наводки. Определенную проблему представляла также невысокая точность полученной эмпирическим путем полиномиальной функции коррекции нелинейностей.

Эволюция

Рис. 5

В 2000 г. Calimetrics заявила о доказанной возможности конструирования 2 GB ML-R-, ML-RW-приводов на основе устройств записи CD-R/RW путем внесения минимальных изменений и обновления чипсета. В качестве системы коррекции ошибок используется стандартный Reed-Solomon Product Code, который вычисляется для отдельных 32-килобайтовых блоков информации. Но если на CD- и SACD-дисках ECC-блоки чередуются, то на ML-R/RW они располагаются последовательно. Перед записью данные выбираются группами по 5 бит, к каждой из которых добавляется 6-й бит четности, сгенерированный кодировщиком. Одна шестибитовая группа представлена двумя восьмиуровневыми питами или ML-символами. Они в свою очередь оформляются в отдельные блоки, которые начинаются и заканчиваются участками служебной информации (рис. 5). Сначала идет link-in, или ввод, играющий роль буферной зоны между блоками. Затем следует преамбула (preamble), она состоит из нескольких элементов. Во-первых, здесь расположены синхронизационные метки, во-вторых — поля AGC (Automatic Gain Control) с образцами максимальной и минимальной амплитуды сигнала, позволяющие подстроить диапазон чувствительности декодера, в-третьих — адрес блока. После блока данных (перемежающихся с метками синхронизации и уровня сигнала) следуют постамбула (postamble), чистая зона и вывод (link-out).

Считанный сигнал обрабатывается 11-полосным эквалайзером, который настраивается на метках AGC и неких тестовых последовательностях, также размещенных на диске. Несмотря на все усилия, приложенные разработчиками на протяжении 3 лет, разделяющих первую презентацию в 1997 г. и доклад, подготовленный к 30 сентября 2000 года, уровень отклонений по амплитуде достигает 3%. Частота следования ошибок составила 10-2 BER, однако благодаря двухсимвольному кодированию и дополнительному биту четности реально ошибки в обработанных данных появляются с частотой 10-5 BER и, естественно, полностью поддаются коррекции с помощью кода Рида-Соломона.

Еще более успешно продвигается финансовая сторона проекта. В марте компания завершила третий раунд финансирования, в ходе которого удалось привлечь инвестиции на сумму около 25 млн. долл. от таких брэндов, как TDK, Sanyo, Mitsubishi и других. У TDK вполне конкретные планы: корпорация собирается первой выпустить приводы с поддержкой многоуровневой записи. Демонстрационные устройства планировалось подготовить к маю. Японский гигант — не единственный, кто решил "поставить" на Calimetrics, — Texas Instruments не только приобрела лицензию на UWS (Universal Write Strategy — новое маркетинговое название ML-технологии), но и заключила соглашение на право участия как в процессе разработки, так и в производстве чипсетов. Еще одну лицензию купила компания Zen Research, автор многолучевой технологии скоростного чтения CD-дисков TrueX, — весьма любопытное событие. Какие именно патенты были оговорены в соглашении — остается тайной. Среди инвесторов называют и фирму Plextor.

В заключение несколько мыслей о будущем UWS. Главный вопрос состоит в том, как воспримут новую технологию производители контента. Не исключено, что они будут максимально противодействовать ее внедрению. Для распространения ПО такие гигантские объемы ни к чему, поэтому, скорее всего, ML-ROM найдут первоочередное применение в области аудио и видео. История DVD Audio показывает, что интересы рядового покупателя не совпадают с нуждами индустрии развлечений. Первый старается максимально заполнить свободное пространство файлами MP3 и MPEG-4, а последние с помощью всех доступных им средств (кодирование, избыточное качество записей) пытаются не допустить девальвации материальной стоимостной составляющей своего интеллектуального продукта. Но не стоит торопить события. Несмотря на смелые планы выпустить первые ML-ROM в этом году, пока в стане "сообщников" Calimetrics царит подозрительнейшая тишина. А если припомнить все технические трудности, вставшие на пути инженеров, то исход "интеллектуальной борьбы" пока неясен.

Код Рида-Соломона
Код Рида-Соломона относится к блоковому типу. Существует неcколько его вариантов, отличающихся сложностью и, соответственно, эффективностью. Характеристики кода определяются тремя параметрами, которые обычно записываются в следующем виде: (размер блока данных, объем полезной информации в блоке, количество исправляемых ошибок). Например, запись (128, 112, 8) означает, что алгоритм позволяет исправить любые 8 ошибочных байтов из 128-байтового блока, несущего всего 16 байт служебной информации. Обработанный таким образом поток данных можно передавать через соединение с битовой частотой ошибок 10-4 BER с надежностью, достигающей 10-17 BER, что эквивалентно 1 битовой ошибке за 317 лет передачи на скорости 10 Mbps. Рассмотрим простейший вариант кода, который способен исправить 1 битовую ошибку в 7-битовом блоке данных (7, 4, 1). Для примера возьмем байт 61H – [1100001]. Четыре старших разряда – полезная нагрузка, три младших – биты четности. Если нарисовать диаграмму Венна (Venn), то механизм становится предельно ясным: зеленым обозначены биты четности, синим – полезной нагрузки. Если выполнить сложение по XOR всех битов в каждом круге, то результат будет нулевой. Если один из кругов даст 1, значит, бит четности, помещенный в этот круг, является ошибочным. Если два круга дают неверный результат, то это свидетельствует о неверном бите, принадлежащем обоим кругам, но не относится к третьему. И наконец, нечетность сумм для всех кругов говорит об ошибке в бите, занимающем центральное положение в диаграмме. Теперь несколько слов о реально применяемом при записи CD- и DVD-дисков Reed-Solomon Product Code, в котором биты четности подразделяются на строчные и столбцовые. В качестве примера рассмотрим схематичную структуру наиболее прогрессивного на сегодня варианта, выбранного для SACD. Сектор диска равен 2048 байтам, 16 секторов объединяются в 33-килобайтовый блок, который логически организуется в таблицу, состоящую из 192 рядов и 172 колонок. К каждому ряду приписывается 10 байт четности, а к каждой колонке – 16. Код может исправить 8 ошибочных байтов в каждой колонке и 5 ошибок в каждом ряду. Кроме того, проведение более сложных вычислений позволяет корректировать и большее количество ошибок. Параметры кода записываются как (208, 192, 17) x (182, 172, 11). 4832 байта четности отнимают всего 12,7% общей емкости носителя, что в два раза меньше, чем требует система коррекции, принятая для CD.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: