Как оказалось, наибольший интерес почти у всех читателей вызывают вопросы влияния
таймингов DDR2 на производительность, а также то, насколько ее латентность окажется
выше по сравнению с предыдущим стандартом DDR400. Как мы уже говорили в прошлых
статьях, касающихся нюансов функционирования подсистем памяти с чипсетами предыдущих
поколений, вклад основных таймингов (к примеру, CAS Latency или RAS-to-CAS) в
общий результат — величина непостоянная, очень сильно зависящая от используемой
платформы и конфигурации. Так, наибольший рост быстродействия за счет уменьшения
задержек зафиксирован на AMD Athlon 64 (Socket 939) — при снижении значений с
8-4-4-3 (для DDR400) до 5-2-2-2 он составил в реальных задачах около 20%. В системах
на чипсетах ATI 9100IGP для платформы Socket 478, отличающихся от конкурентов
самой высокой латентностью, подобное понижение таймингов добавило лишь около 3%
производительности.
Следовательно, пока можно сделать предварительный вывод — чем меньше общая
латентность контроллера памяти, тем большее влияние на быстродействие оказывают
настройки подсистемы памяти. Не вдаваясь в теоретические размышления (см.
статью "Подсистема памяти — чем дальше, тем страшнее…"),
сразу перейдем к рассмотрению ситуации с DDR2.
Таблица 1. Сравнение приведенных задержек доступа к памяти (нс) |
||||||||
Режимы работы памяти (тайминги 8-4-4-3) |
DDR400 | DDR-533 | DDR2-400 | DDR2-533 | DDR2-667 | DDR2-800 | ||
DRAM Command Rate (CMD rate) — время нахождения микросхемы с необходимыми данными |
5 | 3,8 | 10,0 | 7,7 | 6,0 | 5 | ||
Row Cycle time (TRC) — время активности банка |
RAS# Active time (TRAS) — время активности страницы |
RAS-to-CAS (TRCD) — время между определением адреса строки и столбца |
20 | 15,4 | 40,0 | 30,8 | 24,0 | 20 |
CAS# Latency (TCL) — время между определением адресного массива и началом считывания |
15 | 11,5 | 30,0 | 23,1 | 18,0 | 15 | ||
RAS# Precharge time (TRP) — время для перезарядки страницы |
20 | 15,4 | 40,0 | 30,8 | 24,0 | 20 | ||
Общее время задержек |
60 | 46,2 | 120,0 | 92,3 | 72,0 | 60 |
Для большей наглядности выясним (табл. 1), как отличаются по времени выполнения полные циклы операций с памятью стандартов DDR400 и DDR2-533. Сделаем еще одно важное замечание, о котором часто забывают пользователи, — в подавляющем большинстве BIOS Setup материнских плат тайминги приведены в тактах реальной (!) физической шины, т. е. для DDR400 это такты 200 MHz шины, а для DDR2-533 — 133 MHz. Как видно из таблицы, общее (теоретическое) время задержек при доступе к памяти действительно значительно меньше у DDR400 даже с учетом одинаковых таймингов. Также наглядно можно убедиться, что латентность обоих стандартов уравняется только после появления DDR2-800.
Здесь необходимо сделать несколько пояснений. Во-первых, указанная латентность DDR533, DDR2-533/667/800 справедлива только при равнозначной пропускной способности процессорной шины. Во-вторых, не следует забывать, что, когда выйдет стандарт DDR2-800, при одинаковой латентности с DDR400 объем передаваемых данных будет уже в два раза выше — 6,4 GBps (при одноканальном 64-битном доступе) против 3,2 GBps у DDR400. Также данная таблица наверняка поможет понять принципы "вложенности" таймингов — к примеру, самый большой из доступных таймингов DRAM Cycle time (TRAS), в идеале, должен равняться сумме RAS-to-CAS и CAS Latency. В случае TRAS > TRCD+TCL освобождаются дополнительные такты для синхронизации сигналов, что приводит к росту стабильности при незначительном снижении производительности. Противоположный вариант — TRAS< TRCD+TCL — либо невозможен в принципе (контроллеры предыдущих чипсетов вообще не позволяли устанавливать это значение меньше 5, что заведомо больше минимальных 2+2), либо просто заданные цифры будут корректироваться в большую сторону — по той простой причине, что время активности сигнала RAS# не может быть меньше, чем потребуется на определение адреса строки и столбца (т. е. массива считываемых данных).
Забегая вперед, заметим, что нам удалось установить тайминги 3-3-2-3 для DDR2-533, при этом все программы-идентификаторы подтвердили данные значения, но никакой разницы по сравнению с 6-3-2-3 даже в низкоуровневых тестах обнаружить не удалось, что полностью подтверждает вышесказанное.
На многих материнских платах под Socket 754/939 (AMD Athlon 64) есть возможность задавать еще несколько параметров, в числе которых Row Cycle time (TRC) и Write Enable (TWE). Первый отображает минимальное время активности всего банка памяти и равняется соответственно TRAS+TRP. Если установить значение больше данной суммы, при необходимости освобождаются дополнительные такты для регенерации, в обратной ситуации система либо станет работать нестабильно (равносильно заниженному TRP), либо, как и в случае TRAS, будет просто игнорироваться. Тайминг TWE задает минимальное время, за которое должен быть выдан сигнал о том, что ячейки готовы к операции записи; как можно догадаться, его уменьшение приводит к увеличению скорости в режиме записи. На материнских платах с чипсетами Intel данный параметр, как правило, закрыт для изменения, но именно его прошитыми значениями можно объяснить разную скорость записи у моделей от различных производителей. Что касается тайминга DRAM Command rate (CMD rate), то он определяет, сколько времени потребуется для нахождения необходимой микросхемы — иными словами, нужного банка. У чипсетов для Socket 478 CMD rate по умолчанию равняется 1Т, для десктопной платформы AMD64 составляет 2Т (иногда изменяется до 1Т). Заметим, один такт задержки возможен только при последовательном обращении, а при произвольном доступе к памяти в любом случае тратится два такта.
Итак, небольшой ликбез по таймингам будем считать законченным. Перейдем к рассмотрению реальных примеров с использованием памяти DDR2 в новых настольных платформах Intel.
Таблица 2. Параметры производительности при различных режимах работы памяти |
||||
Режим тестирования | Максимальная производительность памяти, MBps |
Скорость чтения, MBps |
Скорость записи, MBps |
Латентность, нс |
12-4-4-4 DDR2-533 | 5330 | 4048 | 2230 | 82 |
6-3-2-3 DDR2-533 | 5466 | 4280 | 2260 | 79 |
12-4-4-4 DDR2-400 | 4847 | 3884 | 1906 | 88 |
5-2-2-3 DDR2-400 | 4951 | 4086 | 1952 | 81 |
Таблица 3. Значения удельной производительности* |
|||
Режим тестирования | Максимальная производительность памяти, MBps |
Скорость чтения, MBps |
Скорость записи, MBps |
12-4-4-4 DDR2-533 | 10,0 | 7,6 | 4,2 |
6-3-2-3 DDR2-533 | 10,3 | 8,0 | 4,2 |
12-4-4-4 DDR2-400 | 12,1 | 9,7 | 4,8 |
5-2-2-3 DDR2-400 | 12,4 | 10,2 | 4,9 |
* на 1
MHz эффективной частоты.
Результаты тестирования
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Для простоты понимания и наглядности данные, представленные в табл. 2, продублированы на диаграммах. Как можно заметить, даже несмотря на то, что в обоих случаях (DDR2-400 и DDR2-533) частота процессорной шины составляла всего 800 MHz, абсолютная производительность подсистемы памяти существенно увеличилась при переходе от 400 к 533 MHz. Наибольший вклад приходится именно на значительное увеличение скорости записи. Однозначно следует сказать, что контроллеры новых чипсетов Intel 915/925 изначально проектировались исключительно на частоты шины памяти 533 MHz и выше, а поддержка DDR2-400 реализована лишь для совместимости.
Еще одним веским тому подтверждением служат график, демонстрирующий скорость "отклика" подсистемы памяти в зависимости от величины пакета, и диаграмма с результатами средней латентности. Это первый случай, когда асинхронный режим работы шины памяти и процессора, да еще с увеличенными таймингами, оказался более производительным по сравнению с синхронным с меньшими уровнями задержек. Наверняка данная ситуация сохранится с выходом CPU, имеющим шину 266 (1066) MHz; примерно в то же время должны появиться в широкой продаже первые модули DDR2-667. Каким-то образом инженерам Intel удалось повысить быстродействие операций записи за счет освободившихся тактов ожидания процессора. По удельной же производительности (скорость передачи данных при 1 MHz эффективной частоты), разумеется, режим DDR2-400 имеет несколько больший КПД (табл. 3), однако, как мы уже сказали, разница оказалась намного меньшей, чем ожидалось.
Известный факт: из реальных приложений, способных адекватно воспринять сокращение задержек памяти, со значительным отрывом вперед выходят игры. Справедливости ради заметим, что ПО, работающее по принципу базы данных, также весьма чувствительно к настройкам памяти, но это, как говорится, уже совсем другая история. Для анализа изменения быстродействия в развлекательных задачах мы традиционно выбрали Unreal Tournament 2003. Видно, что разница между минимальным режимом 12-4-4-4 для DDR2-400 и 6-3-2-3 для DDR2-533 равняется 15 кадров в секунду, что составило около 8% прироста производительности. Действительно, такой отрыв можно назвать существенным, учитывая использование в тестах далеко не самой быстрой видеокарты на базе NVidia PCX5900.
Модули DDR2-533
![]() |
Kingston KVR533 |
![]() |
Micron PC2-4300U |
![]() |
Samsung PC2-4300U |
![]() |
Transcend DDR2-533 |
Отрадно сообщить, что компании, специализирующиеся на поставках модулей памяти,
практически сразу после анонсирования новой десктопной платформы Intel начали
поставки на отечественный рынок линеек DDR2-400 ECC для серверов и рабочих станций
(о них мы расскажем в будущих материалах) и DDR2-533 для настольных систем. Нам
удалось протестировать продукцию таких известных брендов, как Micron, Samsung,
Transcend и Kingston. Во всех модулях применялись микросхемы BGA со временем доступа
3,75 нс, что в точности соответствует эффективной частоте 533 MHz. В Micron и
Samsung, как обычно, установлены микросхемы одноименных производителей, тогда
как Kingston и Transcend построены на идентичных чипах от Elpida. Интересно, что
во время масштабного тестирования модулей DDR400, проведенного нами в начале нынешнего
года, ни один из продуктов не базировался на микросхемах этой японской компании.
Не вдаваясь в определение разгонного потенциала (пока невостребованного), мы решили ограничиться проверкой минимальных задержек в режиме DDR2-533 при стандартном напряжении 1,8 В и при его увеличении до 2 В (результаты приведены в табл. 4). Продукция Micron всегда была эталоном качества и производительности, не стали исключением и новые модули. При штатном и повышенном уровне питания они стабильно работали с меньшими задержками, тем более что при 2 В мо-дули MT16HTF6464AG оказались единственными, кому покорилось значение 2Т для RAS# Precharge. Неудивительно, что память от Kingston и Transcend продемонстрировала идентичные результаты, которые были чуть выше, чем у Samsung PC2-4300U. Попытка запустить тестовую систему в режиме DDR2 667 даже с таймингами 12-4-4-4 и при увеличенном напряжении ни с одним из комплектов модулей не увенчалась успехом. Жаль, что на тестирование не успели попасть линейки памяти от Hynix — как известно, продукция именно этого производителя задает тон на мировом рынке.
Таблица 4. Сравнительные характеристики модулей памяти PC2-4300 (DDR2-533) |
||||
Модуль памяти | Samsung PC2-4300U | Micron PC2-4300U | Kingston KVR533 | Transcend DDR2-533 |
Прошитые тайминги для режима DDR2-533 |
11-4-4-4 | 12-4-4-4 | 12-4-4-4 | 11-4-4-4 |
Минимальные тайминги приштатном напряжении 1,8 В |
8-4-3-3 | 6-3-3-3 | 8-3-3-3 | 8-3-3-3 |
Минимальные тайминги при повышенном напряжении 2 В |
7-4-3-3 | 6-3-2-3 | 6-3-3-3 | 6-3-3-3 |
Выводы
Этот материал — уже третий по счету, в котором серьезно затрагивается вопрос функционирования нового стандарта системной памяти DDR2. Но согласитесь, если уже в следующем году DDR2 станет массовым, подобные усилия оправданы. "Не цепляясь" за текущее сравнение DDR и DDR2, с уверенностью можно сказать, что сама технология DDR2 "не так страшна, как ее малюют", тем более что перспективы у нее очень радужные. На сайтах большинства производителей чипов уже имеется информация о готовых продуктах DDR2-667 (модули с индексом PC2-5300). Зачем далеко ходить, если в спартанских по тонким настройкам BIOS Setup материнских плат Intel присут-ствует возможность выбора этого режима, а чипсеты SiS под Socket LGA775 вообще официально поддерживают память с эффективной частотой 667 MHz.
Как мы сегодня выяснили, теоре-тически новые контроллеры, рассчитанные на применение DDR2, должны быть куда более инертными по сравнению со своими предшественниками, работающими с DDR400. Однако, как показали наши прошлые тестирования, на практике эта разница оказалась менее заметной, в чем есть реальная заслуга инженеров R&D-отдела компании Intel.
Помимо SiS, еще один крупнейший производитель чипсетов, компания VIA Technologies, также в ближайшее время покажет миру свои наборы логики под новые процессоры Intel и память DDR2. Очень будет интересно сравнить эти три решения, что мы обязательно сделаем, как только представится такая возможность.
На самом деле "страшные" значения таймингов для модулей PC2-4300 (к примеру, 12-4-4-4) еще вовсе не означают, что их нельзя привести к более привычным 6-3-3-3 (аналогичная ситуация наблюдается с линейками памяти DDR400, когда стандартная прошивка 8-4-4-3 совсем не мешает выставить на большинстве из них 5-3-2-2,5).
Модули, попавшие к нам на тестирование, являются типичными массовыми изделиями,
которым далеко до оверклокерских моделей, однако появление таковых не за горами.
Да и вообще, учитывая быстрые темпы выхода на украинский рынок новых систем Intel
и сопутствующего оборудования в виде видеокарт PCI Express и памяти DDR2, можно
ручаться, что не пройдет и полгода, как большинство отечественных пользователей
перестанут воспринимать платформу Socket 775 с ее нововведениями как что-то уникальное
и далекое от реальной жизни.
Конфигурация тестовой системы |
|
Платформа | Intel |
Процессор | Intel Pentium 4 (Prescott) 3,6 GHz, Socket LGA775, FSB 800 MHz |
Материнская плата |
Intel D925XCV, чипсет i925X |
Референсная память |
Micron PC2-4300U (DDR2-533), 2x512 MB |
Видеокарта | Leadtek PCX5900 128 MB (FX 5900XT, PCI Express) |
Режимы тестирования видео |
480/830 MHz (чип/память), ForceWare 62.01 |
Жесткий диск | Western Digital WD1600 (160 GB, 7200 об/мин) |
ОС | Windows XP Professional SP2, DirectX 9.0c |
Оборудование предоставлено |
||
Платформа Intel | Представительство Intel в Украине | (044) 490-6417 |
Модули памяти Micron | ||
Модули памяти Samsung | "Небеса" | (044) 490-3577 |
Модули памяти Kingston | ||
Модули памяти Transcend | "Технопарк" | (044) 238-8990 |
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: