Обзоры
Технические характеристики графических акселераторов

Технические характеристики графических акселераторов


Модель и кодовое имя GPU

По названию модели нетрудно определить основные функциональные возможности акселератора. Когда ATI или NVIDIA выпускают новое поколение графических чипов, оно обычно сразу бывает представлено несколькими ревизиями (обозначаемыми кодовыми именами) со схожими характеристиками, но некоторыми различиями в производительности, а иногда и функциональности, за счет разных поддерживаемых частот, ширины шины памяти, количества рабочих конвейеров, техпроцесса. У NVIDIA кодовое имя имеет префикс NV (или G начиная с GeForce 7xxx). У ATI – префикс R или RV (например, R520 – GPU Radeon X1800 XT). Нет прямого соответствия между кодовым именем и моделью видеокарты. На одной ревизии чипа может выпускаться несколько моделей карт, например, на NV43 основаны все разновидности GeForce 6500 и 6600 (в том числе GT и LE-редакции), или наоборот: одна и та же модель – на разных чипах (AGP-версии разных GeForce 6800 GT базируются на ре-визии NV40, PCI-E-версия – на NV45). Впрочем, для потребителя, не интересующегося тонкостями разгона, окажется более понятным официальное название ядра, например GeForce 6800 GT, а не лежащая в его основе ревизия чипа, так как этим названием и будут определяться основные параметры видеокарты.

Производственный процесс, нм

Параметр, говорящий о минимальном размере элемента на кристалле GPU. Конечным пользователям может быть интересен прежде всего тем, что от него в немалой степени зависят тепловыделение и разгонный потенциал GPU. Чем меньше числовое значение техпроцесса, тем меньше площадь кристалла и тем меньшего тепловыделения можно ожидать, а значит, большего разгона достичь. При прочих равных характеристиках обычно стоит предпочесть акселератор на ревизии GPU с более тонким техпроцессом.

Интерфейс

Этим параметром определяется, на какой платформе и материнской плате способна работать та или иная модель акселератора. Сейчас, если отбросить совсем уж древние интерфейсы, остаются два варианта: AGP 8X либо PCI Express x16. На материнской плате имеется только один способ подключения видеокарт (кроме экзотических моделей), причем шина AGP является устаревшей и встречается лишь на платформах прошлого поколения. Новые модели акселераторов рассчитаны на PCI Express.

Частота GPU (core clock), MHz

Частота графического процессора, частота шины памяти и разрядность шины являются главными параметрами, определяющими быстродействие конкретной модели видеокарты по сравнению с другими акселераторами на этом же чипе. Производитель GPU устанавливает некую рекомендуемую («референсную») частоту для каждой модели чипа, на которой он должен стабильно работать и которой рекомендуется придерживаться изготовителям готовой продукции. В то же время многие топ-модели видеокарт уже протестированы на стабильную работу с повышенными частотами самими производителями. Рост частоты увеличивает нагрев GPU, а также риск появления артефактов в изображении, зависаний или даже выхода GPU из строя, но существует немало утилит для повышения штатной частоты, в том числе и таких, которые идут прямо с «оверклокерскими» моделями акселераторов и поддерживаются их производителями.

Частота шины памяти (memory clock), MHz

Частота памяти вместе с шириной шины памяти и типом памяти определяет пиковую пропускную способность видеопамяти в гигабайтах в секунду (GBps). Наряду с частотой GPU эта характеристика чаще и проще всего поддается изменению, причем разгон акселератора по памяти способен дать лучшие результаты, чем разгон самого GPU. Максимальный разгонный потенциал памяти (до появления проблем) во многом определяется временем доступа установленных на видеокарте микросхем памяти (задается в наносекундах). Его можно оценить, поделив единицу на это время.

Ширина шины памяти (memory bus width), bit

Шириной шины определяется, сколько информации может быть передано между GPU и видеопамятью за один цикл доступа. В зависимости от поколения и модели GPU выбор обычно стоит между 64 и 128 бит или (для новых поколений) 128 и 256 бит. Урезанные по ширине шины памяти модели видеокарт характеризуются серьезной потерей производительности, которая значительно более заметна, чем даже при снижении частоты памяти либо GPU. По возможности, таких моделей желательно избегать.

Объем видеопамяти, МB

Объемом видеопамяти будет определяться, сколько графических ресурсов сможет уместиться в локальную скоростную память видеоакселератора. Больше всего памяти занимают текстуры самого различного назначения, немного меньше – геометрия 3D-моделей. Десятка два и более мегабайт обычно уходит на организацию обязательных буферов кадров и хранение специальных промежуточных текстур – render targets, используемых при многопроходном рендеринге и для сложных эффектов. При нехватке локальной видеопамяти приложения вынуждены будут обращаться к технологии GART (Graphics Address Remapping Table), также иногда называемой AGP-текстурированием (однако применяется она и на PCI-E-ускорителях), для хранения части текстур в системной памяти, что может значительно ударить по производительности. Но и брать низкопроизводительную модель видеокарты с чрезмерно большим объемом видеопамяти тоже не стоит, на средних настройках качества она будет бесполезна. Кроме того, в такие модели зачастую ставят более медленные микросхемы памяти.

FFP (Fixed Function Pipeline)

До появления шейдеров и программируемой архитектуры GPU технология FFP была единственным доступным методом обработки 3D-графики на 3D-акселераторе. Как видно из названия, это жестко фиксированный набор простейших операций и алгоритмов, из которых можно выбирать необходимые в данный момент и иногда комбинировать их друг с другом, однако весьма ограниченным и нерасширяемым способом. В современных 3D-акселераторах отдельный аппаратный блок, отвечающий за поддержку FFP для старых приложений, отсутствует и полностью эмулируется драйвером с помощью шейдеров.

Шейдеры

Шейдеры – это небольшие программы, написанные непосредственно для графического процессора (GPU). Они загружаются в память видеокарты и используются на некоторых этапах 3D-конвейера, требующих особой гибкости. Применение шейдеров обеспечивает программируемую архитектуру GPU и предоставляет разработчику приложений большую свободу для реализации идей по сравнению с использованием FFP.

Типы шейдеров

По функциональному назначению и набору инструкций шейдеры делятся на две категории – вершинные (vertex shader) и пиксельные (pixel shader). Вершинные шейдеры обрабатывают геометрию 3D-моделей и отвечают, например, за такие задачи, как простейшая трансформация (поворот, масштабирование) модели, ее анимация и деформация, повертексное освещение. Пиксельные шейдеры подключаются к делу на более позднем этапе конвейера при растеризации изображения, т. е. отрисовке 2D-картинки. Они оперируют такими данными, как отдельные пиксели текстур, и итогом их работы будет результирующий цвет пикселя, вычисленный на основе этих данных. Вершинные и пиксельные шейдеры действуют в связке, и пиксельный использует данные, подготовленные для него вершинным (например, текстурные координаты, освещенность, цвет).

Версии шейдеров (или Shader Model)

Существует несколько поколений шейдеров, которые отличаются набором инструкций и их возможностями, количеством адресуемых регистров, определенными лимитами. Последняя актуальная версия – SM 3.0, соответствующая требованиям DirectX 9.0c. Поддержка поколений шейдеров является обратно совместимой, т. е. акселератор с поддержкой SM 3.0 также поддерживает и SM 2.0, и 1.x.

Поддерживаемый 3D API

Каждая следующая версия API Direct3D добавляет новые возможности и расширяет существующие. Кроме того, она предъявляет еще и набор технических требований, которые акселератор должен поддерживать аппаратно, чтобы быть полностью совместимым с данной версией (впрочем, иногда производители делают программную эмуляцию каких-то возможностей нового API в драйвере, но это более медленно и не всегда достижимо). Подобные требования относятся не только к версии шейдеров, но и, например, к поддерживаемым акселераторами форматам текстур (скажем, поддержка текстур floating point-формата нужна для HDR). Уже пару лет наиболее актуальным остается DirectX 9.0c, хотя выход десятой версии с немалым числом изменений ожидается в 2007 г.

В отличие от Direct3D версии OpenGL обновляются куда реже, так как основные нововведения принято реализовывать с помощью различных расширений, и только проверенные и наиболее полезные находят отражение в базовом API. Все акселераторы, поддерживающие DirectX 9.0c, также поддерживают и OpenGL 2.0, последнюю версию этого API.

Количество пиксельных и вершинных конвейеров (исполнительных блоков) GPU

От количества исполнительных блоков зависит вычислительный потенциал акселератора, его способность распараллеливать вычисления на различных этапах. Данное число определяется моделью установленного GPU (но не кодовым именем, так как бывает, что разные модели на одной ревизии GPU выпускаются за счет отбраковки и отключения части конвейеров). И в большинстве случаев, кроме моделей с отключенными конвейерами, изменить его нельзя. К тому же процедура эта нетривиальна и легко может привести к выходу акселератора из строя либо проблемам со стабильностью его работы.

Тип видеопамяти

DDR, GDDR2, GDDR3 – тип памяти, который определяет в основном возможность достижения более высоких частот. На сегодняшний день самыми скоростными являются чипы GDDR4, способные работать на частотах порядка 2 GHz.


Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: