Обзоры
AMD Radeon HD 6900: конкуренция обостряется

AMD Radeon HD 6900: конкуренция обостряется


Ежегодное обновление графических архитектур AMD и NVIDIA в 2010 г. оказалось не совсем таким, как всегда: вместо радикального обновления видеокарт и привычного уже большого роста производительности обе компании решили уделить внимание уже существующим GPU, оптимизировав и доработав их с целью устранения основных недостатков и удешевления конечных видеокарт. В частности, о представленных ранее AMD Radeon HD 6800 сложно сказать, что они задают новую планку производительности – они скорее приносят достигнутые прошлым поколением возможности в сегмент middle-end, являющийся наиболее массовым.

AMD Radeon HD 6900 конкуренция обостряется

Тем не менее, интерес к продуктам высшего класса для энтузиастов продолжает сохраняться, и тут обоим вендорам пришлось серьезно постараться, чтобы удовлетворить эту требовательную категорию потребителей. Мы уже рассматривали NVIDIA GeForce GTX 580 и GTX 570 – новую инкарнацию топовых видеокарт компании на доработанной архитектуре Fermi, а теперь наконец пришло время для ответного хода AMD – акселераторов Radeon HD 6900 на базе чипов Cayman.

В свете незначительного усовершенствования ядер Barts (Radeon HD 6800) по сравнению с Cypress (Radeon HD 5800), вопрос о том, как же AMD планирует нарастить производительность будущих топовых GPU, стоял очень остро: особенных предпосылок к радикальному изменению архитектуры не наблюдалось. Однако компании все же удалось нас удивить: Cayman очень значительно отличаются от своих предшественников.

Новшества в AMD Cayman: от VLIW5 к VLIW4

Новые графические процессоры AMD переведены с архитектуры VLIW5 (Very Large Instruction Word) на VLIW4. Разъясним: уже несколько поколений GPU этого вендора строятся из процессоров (SIMD Engines), которые делятся на пять исполнительных блоков: четыре одинаковых ALU, осуществляющих вычисления с плавающей точкой с 32-битной точностью, и один дополнительный более «умный» T-блок, способный также исполнять трасцендентные инструкции (математические функции тангенса, арктангенса, косинуса, возведения в степень и вычитания и т.п.). У NVIDIA в архитектуре Fermi есть аналогичные устройства, называемые Special Function Unit. Нюанс такого решения состоит в том, что для оптимального исполнения кода этими блоками необходимо тщательно его отлаживать и специальным образом организовывать, иначе они просто будут простаивать, а исполнение будет полностью осуществляться обычными ALU. Принцип параллелизации исполнения кода в архитектурах AMD базируется на инструкциях (Instruction Level Parellelism): пять ALU в пределах одного SIMD-процессора могут одновременно исполнять пять одинаковых инструкций, что в рамках одного потока встречается не так уж часто.

AMD Radeon HD 6900 конкуренция обостряется
SIMD-процессор с архитектурой VLIW4
AMD Radeon HD 6900 конкуренция обостряется
Схема GPU Cayman
AMD Radeon HD 6900 конкуренция обостряется
Оптимизированные механизмы работы с памятью

По данным AMD, в подавляющем большинстве случаев ALU действительно простаивали (средняя загруженность – 3,4 из 5), потому было принято решение избавиться от мало востребованных T-блоков, взамен нарастив число процессоров в целом. Таким образом, теперь GPU строится из SIMD-процессоров, которые состоят из четырех одинаковых обычных ALU, а в случае, если все же возникает необходимость исполнить сложную инструкцию, три из них виртуально объединяются и делают это за один такт. Освободившееся место разработчики просто использовали для наращивания количества процессоров: вместо 20 в Cypress их теперь 24.

У этого подхода есть и достоинства, и недостатки. Основной «плюс» перехода на VLIW4 – более эффективное управление загрузкой GPU: традиционный рендеринг отлично распараллеливается, и большее число одинаковых исполнительных блоков будут выгодней, нежели наличие иногда задействуемых «умных». Недостаток же состоит в том, что оптимизированные для использования расширенных ALU шейдеры, встречающиеся в некоторых играх, могут на Cayman исполняться медленнее, чем на Cypress. К тому же для целей GPGPU – еще одной ключевой сферы, на которую обращено пристальное внимание и AMD, и NVIDIA, – возможность быстрого исполнения сложных инструкций довольно важна. Однако для графического подразделения AMD игровые видеокарты – основной приоритет, потому было принято именно такое решение. К тому же вышеописанная возможность исполнения нескольких потоков одновременно и большее число SIMD-процессоров вполне могут сделать Cayman более выигрышным GPU для нужд GPGPU, нежели Cypress и Barts.

Возвращаясь к изменениям в GPU, отметим также, что в его составе появился усовершенствованный диспетчер потоков, способный теперь обслуживать несколько исполняемых «ядер» одновременно. У NVIDIA Fermi также есть такая возможность, однако есть и ограничения: хоть GPU и способен проводить вычисления нескольких ядер одновременно, все они должны генерироваться одним и тем же приложением в рамках одного и того же контекста (состояния) GPU. Если же на обработку запускаются два ядра от разных приложений (к примеру, GPGPU-рендеринг видео одновременно с Direct3D), видеокарте приходится постоянно переключаться между контекстами, уделяя внимание то одному ядру, то другому (а не одновременно), а это влечет огромные потери производительности. В AMD Cayman применен другой подход: драйвер осуществляет виртуализацию GPU для каждого исполняемого ядра, таким образом никакое из приложений, задействующих его, просто не знает о существовании других, работая будто бы с собственным процессором и собственной виртуальной памятью. Трансляцией очереди команд графическому процессору занимается драйвер, а расположенный в GPU асинхронный диспетчер потоков обрабатывает и реорганизует очередь инструкций таким образом, чтобы потери от исполнения разнородных потоков были минимальными. Единственное «но»: аппаратно-то в GPU такие возможности есть, но пока нет программного API с поддержкой этого нововведения (DirectCompute в нынешней ревизии ее не содержит, и AMD возлагает все надежды на OpenCL).

Также из усовершенствований вычислительной части GPU отметим оптимизации интерфейсов памяти: каждый SIMD-процессор содержит 8 КБ эксклюзивного кэша L1 и 32 КБ локального буфера, ядро оснащено четырьмя массивами кэша L2 по 128 КБ и 64-килобайтовым глобальным буфером. Выборка и запись данных из локального в глобальный буфер может осуществляться «на лету», не выходя из GPU в память видеокарты. Введение второго DMA-блока в контроллере памяти также ускоряет обмен данными с ней.

Значительно доработаны растеризаторы: теперь обработка 16-битных данных происходит вдвое быстрее, 32-битных – в 2-4 раза, в зависимости от типа данных.

Вдвое больше геометрии

Одним из слабых мест прошлых поколений GPU AMD была низкая производительность при обработке геометрии, в частности, радикально меньшее быстродействие при тесселяции, нежели у NVIDIA Fermi. AMD усиливает Cayman введением второго устройства Graphics Engine: теперь сборка вершин и геометрии, тесселяция и растеризация осуществляются в два потока. К тому же тесселятор 8-го поколения сам по себе работает в 2-3 раза быстрее, чем прошлая его инкарнация в Cypress. Итоговый чистый прирост производительности от увеличения скорости обработки геометрии составляет 30-70%, в зависимости от того, насколько сильно обрабатываемая сцена загружает тесселяторы.

AMD Radeon HD 6900 конкуренция обостряется
Принцип работы EQAA

В Cayman AMD вводит поддержку нового для себя алгоритма сглаживания изображения: Enhanced Quality Anti-Aliasing (EQAA). Под этим названием скрывается не что иное как знакомый нам еще со времен NVIDIA G80 Coverage Sample Anti-Aliasing – алгоритм, использующий для повышения качества сглаживания не полноценные семплы цветности и глубины, а информацию о примитивах. Если пиксель находится на границе двух примитивов (перекрывается ими) – для него цвет усредняется не только по полноценным семплам RGB+Z, но и по выбранным дополнительно только цветовым. В идеальном случае качество сглаживания должно быть равно достигаемому при мультисемплинге более высокой ступени (4xEQAA = 8xMSAA) при очень незначительном снижении производительности, т.к. памяти на эти дополнительные семплы тратится намного меньше. Кроме того, Cayman поддерживают и Morphological Anti-Aliasing – простую технику сглаживания посредством выявления контрастных зон с помощью пост-процессингового фильтра, представленную с Radeon HD 6800.

PowerTune

Как и NVIDIA, AMD серьезно озаботилась проблемой энергопотребления своих видеокарт при высокой нагрузке, когда устройства зачастую значительно превышают заявленный для них TDP. Напомним, что в NVIDIA GeForce GTX 570/580 введены блоки мониторинга потребляемого видеокартами тока, которые при обнаружении повышенной нагрузки и выявлении драйвером запущенных приложений для стресс-тестирования (FurMark, OCCT) снижают частоты вдвое. AMD пошла дальше конкурента, внедрив технологию PowerTune. Встроенные в GPU блоки постоянно оценивают уровень потребляемой им энергии, и в случае превышения TDP драйвер «на лету» немного снижает тактовые частоты (не вдвое, как на GeForce GTX 580/570, а примерно на 10%). Фактически перед нами полный аналог Intel Turbo Boost, только работающий диаметрально противоположно. Соответственно, и параметр TDP, заявляемый AMD, стоит скорее считать не абсолютно максимальным, а максимально разрешенным. Решение это абсолютно логично: вместо того, чтобы устанавливать тактовые частоты видеокарт заведомо ниже потенциально достижимых данным GPU с целью гарантированного сбережения ее от перегрева и повреждения в случае максимально возможной нагрузки, AMD теперь может задать более высокую исходную частоту, т.к. все равно чаще всего GPU не загружен полностью и не потребляет максимальный ток. Если же вдруг такое все-таки случается – драйвер просто подстраивает частоту, удерживая видеокарту в рамках TDP.

PowerTune можно настраивать в панели Overdrive утилиты Catalyst Control Center, доступны значения от -20% до +20%. Как несложно понять, таким образом регулируется порог срабатывания алгоритма. Отметим, что в штатном режиме PowerTune срабатывает крайне редко и влияет на производительность в большинстве приложений очень слабо – в пределах 1-2 кадров/с. Полностью отключить эту систему нельзя, однако, очевидно, сторонние производители видеокарт смогут модифицировать порог ее активации для своих предразогнанных моделей, а вот как быть сторонникам экстремального разгона – пока неясно.

Знакомство с AMD Radeon HD 6900

Итак, рассмотрим представленные AMD видеокарты. В семейство Cayman входят две модели – Radeon HD 6970 и Radeon HD 6950. Позиционируются они довольно интересно: топовая модификация располагается между NVIDIA GeForce GTX 580 и GTX 570, а младшая занимает собственную нишу между GeForce GTX 570 (сверху) и парой Radeon HD 6870 и GeForce GTX 470 (внизу). Рекомендованные цены установлены на уровне $369 и $299, соответственно. Топовой же моделью в линейке AMD продолжает оставаться Radeon HD 5970, появления его наследника HD 6990 на базе двух GPU Cayman стоит ожидать только в I квартале 2011 г.

Графический процессор Cayman XT в AMD Radeon HD 6970 содержит 1536 активных ALU, сгрупированных в 24 SIMD-массива по 16 SIMD-процессоров, 96 текстурных блоков и 32 растеризатора. Тактовая частота составляет 880 МГц. Видеокарта оснащается 2 ГБ памяти GDDR5 с тактовой частотой 1375 МГц (5500 МГц QDR), обращение к которой осуществляется по шине шириной 256 бит. Уровень TDP этого одночипового флагмана составляет 250 Вт – на 62 Вт выше, чем у Radeon HD 5870, и на 100 Вт выше заявленного для Radeon HD 6870.

Младшая модификация оснащается GPU Cayman Pro, в котором активны 22 SIMD-массива, что составляет 1408 ALU и 88 текстурных блоков, количество растеризаторов осталось прежним – 32. Процессор работает на частоте 800 МГц, 2 ГБ памяти GDDR5 – на 1250 МГц (5000 МГц QDR), ширина шины также сохранена на уровне 256 бит. TDP AMD Radeon HD 6950 установлен на уровне 200 Вт. В простое со сниженными частотами обе видеокарты потребляют 20 Вт.

AMD Radeon HD 6900 конкуренция обостряется
AMD Radeon HD 6900 конкуренция обостряется
AMD Radeon HD 6900 конкуренция обостряется
AMD Radeon HD 6900 конкуренция обостряется
AMD Radeon HD 6900 конкуренция обостряется
AMD Radeon HD 6900 конкуренция обостряется
AMD Radeon HD 6900 конкуренция обостряется

Обе модификации используют одинаковый дизайн печатной платы и системы охлаждения, потому рассматривать их будем вместе. Длина плат составляет 10,5” (26,7 см) – для них потребуется просторный корпус. Пластиковый кожух прямоугольной формы полностью накрывает всю видеокарту, дизайнерских изысков вроде своеобразного оформления отверстий воздухозаборника, как на Radeon HD 5870, нет. Система охлаждения представляет собой полностью накрывающий GPU и чипы памяти массивный радиатор, подошва которого – ставшая так популярной среди разработчиков СО испарительная камера. Продувается радиатор традиционным центробежным вентилятором, весь горячий воздух выводится за пределы корпуса. Отметим, что, в отличие от NVIDIA, AMD все же не стала пытаться уместить все видеовыходы на одной стороне крепежной планки и отдавать вторую половину на вентиляционную решетку: тут она занимает всего четверть планки. Эффективность СО вполне достаточна: алгоритм управления оборотами настроен таким образом, чтобы удерживать температуру GPU на уровне 88-90 оС, а до того момента кулер остается практически неслышимым. В особенности это относится к Radeon HD 6950: с охлаждением ее СО справляется вообще без проблем, а вот старшую модель при максимальной нагрузке в FurMark все же нельзя назвать тихой. Отдельно стоит отметить, что алгоритм явно не учитывает возможность увеличения порога срабатывания PowerTune: если в штатном режиме кулер Radeon HD 6970 работает громко, но постоянно, то при поднятии порога на 20% он начинает постоянно раскручиваться и замедляться, следуя колебаниям температуры и срабатываниям PowerTune. Звук при этом, соответственно, довольно неприятно пульсирует.

Питание видеокарт обеспечивается двумя разъемами, для Radeon HD 6970 это один 8-контактный и один 6-контактный, для младшей версии – два 6-контактных. VRM организован по схеме 6+2, о нехватке питания или неподключенном разъеме призван сигнализировать установленный на плате пьезодинамик.

Графические интерфейсы представлены двумя DVI, один из которых работает в режиме Dual-Link, второй – Single-Link, одним HDMI 1.4a и двумя mini-DisplayPort 1.2. Об особенностях этой ревизии DisplayPort мы уже писали.

Обе видеокарты поддерживают построение массивов CrossfireX вплоть до Quad Crossfire с четырьмя видеокартами. Возле разъемов для подключения мостиков CF можно увидеть неожиданный переключатель, имеющий два положения. Дело в том, что Radeon HD 6900 содержат два чипа BIOS, один из которых поддается перепрошивке пользователем, а второй заблокирован и позволяет в случае неполадок загрузиться с гарантированно стабильными настройками. Вполне возможно, в дальнейшем появится возможность регулировать (или совсем отключать) PowerTune именно редактированием BIOS – тогда наличие такой меры предосторожности более чем оправданно.

Из дополнительной функциональности Radeon HD 6900 ничего нового выделить мы не можем, набор технологий все тот же: поддерживаются панорамный вывод 3D-изображения Eyefinity, стереоскопическая технология HD3D, аппаратное воспроизведение и обработка MPEG-4/ASP, MPEG-4/AVC, MPEG-4/MVC, VC-1 и MPEG-2 посредством движка UVD3.

Перейдем к тестированию

Прежде всего обратим внимание на тест Unigine Heaven: тяжелая нагрузка на тесселяторы ранее делала это приложение настоящим козырем NVIDIA Fermi. Как видим, усовершенствования, проведенные AMD в новых GPU, позволяют им наконец потягаться с соперниками: Radeon HD 6970 идет практически вровень с GeForce GTX 570, у которой блоков тесселяции не 2, как в Cayman, а целых 15. Подчеркнем, что в данном случае нельзя говорить, что Cayman настолько быстрее Fermi в тесселяции: именно в данном тестовом приложении с используемыми им коэффициентами его двух блоков восьмого поколения достаточно для паритета с GeForce GTX 570/580. В целом же геометрическая мощь видеокарт NVIDIA намного выше. Что касается сравнения поколений архитектур ATI/AMD, то тут прогресс налицо: превосходство Radeon HD 6950 над Cypress в виде Radeon HD 5870 составляет 36%.

Переходя к комплексным и игровым тестам, мы сталкиваемся с несколько противоречивой ситуацией. Обе используемых нами версии 3DMark показывают, что Radeon HD 6970 «промахивается» мимо назначенной ей ниши между GeForce GTX 580 и GTX 570, располагаясь сразу под ними. В то же время Radeon HD 6950 работает именно так, как и обещалось, обеспечивая заметный отрыв от GeForce GTX 470 и Radeon HD 6870.

Игровые тесты показывают, что в большинстве случаев AMD Radeon HD 6970 все же оказывается медленнее своих прямых конкурентов, причем иногда очень заметно: обратите внимание на слабо объяснимый провал в Dirt 2. Мы склонны связывать такие результаты с недостаточной отлаженностью драйверов: значительное изменение архитектуры явно потребует оптимизации ПО для наиболее эффективной работы. Вероятнее всего, в списках изменений следующих версий Catalyst мы увидим много сообщений о повышении быстродействия Cayman в тех или иных играх.

Что касается Radeon HD 6950, то эта модификация радует намного больше флагмана: при ее позиционировании и цене на сегодняшний день конкурентов ей попросту нет, а обеспечиваемый ей уровень производительности более чем достаточен для подавляющего большинства современных игр.

Выводы

В целом новые топовые видеокарты AMD, бесспорно, можно считать новым витком эволюции графической архитектуры компании. Если с технической точки зрения Radeon HD 6800 нас не смогли порадовать, будучи простой доработкой уже существующих GPU, то Radeon HD 6900 действительно содержат серьезно переработанные процессоры. Больший уклон на производительность в среднестатистических расчетах позволил AMD нарастить мощность ядер, тем самым ускорив видеокарты относительно прошлого поколения. К сожалению, острой борьбы с NVIDIA за пальму первенства все же не получилось (уж слишком быстра GeForce GTX 580), однако в рукаве AMD еще остается традиционный козырь – возможное снижение цен. Правда, в случае Radeon HD 6900 оно вряд ли будет таким агрессивным, как с видеокартами прошлого поколения: GPU Cayman заметно сложнее, себестоимость его выше, а следовательно, и «пространства для маневра» у AMD меньше.

Одним словом, революции не произошло, и, в отличие от 2009 года, на этот раз AMD вступает в новый год на позиции догоняющей. Что ж, нам, как конечным потребителям, такая конкуренция лишь на руку.


Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: