NVIDIA GeForce GTX 480: гостья из будущего (часть 3: практика)

Архитектура нового поколения графических процессоров NVIDIA Fermi, рассмотренная нами в предыдущих двух частях обзора, бесспорно, впечатляет своей сложностью и ориентированностью на высокопроизводительные вычисления. Теперь посмотрим, как же она ведет себя в современных играх.

Компания NVIDIA предоставила нам образец топовой видеокарты GeForce GTX 480, которая на сегодняшний день является старшей моделью среди основанных на GPU GF100. Что интересно, даже этот флагманский акселератор базируется не на полнофункциональном ядре с 512 потоковыми процессорами, а на урезанной до 480 SP модификации. Очевидно, сделано это для того, чтобы уложиться в заявленный TDP 250 Вт, приемлемые температурные режимы и обеспечить более-менее широкую доступность.

Дело в том, что ядро GF100 содержит 3,2 млрд транзисторов и занимает площадь 529 мм2, для техпроцесса 40 нм изготовление подобного чипа без изъянов – задача не из легких. Для сравнения, флагманская модификации AMD Evergreen – GPU Cypress, устанавливаемые на Radeon HD 58xx (состоят из 2,1 млрд транзисторов и занимают 334 мм2)– в полтора раза меньше. При этом AMD начала отладку 40-нм техпроцесса на мощностях TSMC на полгода раньше NVIDIA и все равно испытывает сложности с выходом годных кристаллов, формирующие дефицит на топовые модификации видеокарт. Что уж говорить о ситуации, когда требуется вырастить в полтора раза больший кристалл, а потом еще и заставить его работать на частоте 700 МГц без проблем… Потому NVIDIA пошла на отключение одного из потоковых мультипроцессоров, а полноценный вариант Fermi пока что будет устанавливаться только в ускорители Tesla. Возможно, со временем будет выпущена и ускоренная игровая видеокарта, в которой будут активны все 512 процессоров. Кстати, упомянув Tesla, стоит заметить интересное решение NVIDIA по искусственному «стимулированию» разработчиков, ориентирующихся на серьезные научные и коммерческие проекты, к приобретению профессиональных ускорителей: в игровой модификации Fermi – GeForce GTX 400 – производительность в вычислениях с двойной точностью искусственно ограничена на 1/8 от производительности в одинарной точности, в то время как основанные на GF100 Tesla такого ограничения иметь не будут.

Итак, на сегодняшний день семейство GeForce GTX 400 состоит из двух видеокарт, GeForce GTX 480 и GTX 470. Старшая, которую мы сегодня протестируем, основана на GPU с 480 SP, 60 текстурными блоками, 15 PolyMorph Engine, 48 ROP и 768 КБ кэша (последние два параметра соответствуют максимальной конфигурации GF100). Устройство оснащается 1536 МБ памяти GDDR5, работающей на частоте 3696 МГц QDR и общающейся с ядром посредством шести шин по 64 бита, что суммарно составляет ширину 384 бит. Ядро (точнее, контроллеры памяти и ROP) работает на частоте 700 МГц, а SM с текстурными блоками, PolyMorph Engine и кэшем – на удвоенной частоте 1,4 ГГц. Что интересно, в графических процессорах прошлого поколения соотношение между растровым и шейдерным доменом устанавливалось определенным для каждого GPU коэффициентом, и ими можно было управлять отдельно. В Fermi основными блоками являются мультипроцессоры, и управление частотой доступно только для них, а для растрового домена она просто делится пополам.

Поскольку видеокарта, исходя из технических характеристик, потребляет 250 Вт, для ее питания требуется подключение двух разъемов, одного восьми- и одного шестиконтактного. NVIDIA уделила большое внимание системе охлаждения: GeForce GTX 480 оснащается довольно сложным кулером, состоящим из нескольких частей: пластины, покрывающей чипы памяти и печатную плату, массивного хромированного радиатора с 5 тепловыми трубками с конструкцией direct contact (трубки напрямую контактируют с крышкой GPU) и турбины, продувающей всю эту систему. Горячий воздух выводится наружу корпуса, кроме того, небольшую лепту в эффективность охлаждения вносит и металлическая наружная сторона радиатора, которая не закрывается пластиковым кожухом, как ранее. Длина платы составляет 10,5 дюйма (26,7 см), разъемы питания ориентированы вверх, кулер занимает соседний разъем на плате. Таким образом, GeForce GTX 480 сложно назвать компактной видеокартой, однако в большинство полноразмерных корпусов ATX она все же поместится и не будет упираться в дисковую корзину.

За вывод изображения отвечают два разъема Dual Link DVI и один mini-HDMI. По словам представителя NVIDIA, последний был выбран, поскольку DisplayPort пока не слишком популярен, в отличие от HDMI, а для полноразмерного разъема места попросту не осталось. Вопрос лишь в том, не окажется ли ситуация с переходниками с mini-HDMI на обычный HDMI еще хуже, чем с DisplayPort.

Младшая модель Fermi – GeForce GTX 470 – оснащается еще более урезанным ядром. В нем отключены два мультипроцессора и один блок растеризации. В итоге конфигурация выглядит следующим образом: 448 SP, 56 текстурных блоков, 14 PolyMorph Engine, 40 ROP, 5 каналов памяти общей шириной 320 бит, 620 КБ кэша. Ядро работает на частоте 607 МГц, шейдерный домен – на 1215 МГц. Видеокарта оснащается 1280 МБ памяти GDDR5 с частотой 3348 МГц. TDP этого устройства составляет 215 Вт, что позволило ограничиться лишь двумя шестиконтактными разъемами питания. Как и в старшей модели, кулер на GeForce GTX 470 занимает два слота, однако выглядит гораздо более похожим на те, что встречались на видеокартах прошлых серий СО.

Приступим к тестированию. Поскольку в обзоре использовались только видеокарты высшего класса, режимы работы тестовых приложений выбирались соответственно: во всех играх настройки выставлялись на максимум, полноэкранное сглаживание и анизотропная фильтрация устанавливались в режимы 8x MSAA и 16x AF.

Технические характеристики видеокарт

МодельATI Radeon HD 5870NVIDIA GeForce GTX 285NVIDIA GeForce GTX 295NVIDIA GeForce GTX 480
ЯдроCypress XTGT200b2xGT200bGF100
Кол-во транзисторов, млн215414002×14003200
Площадь ядра, мм23344702×470529
Техпроцесс, нм40555540
Кол-во потоковых процессоров1600 (320×5)2402×240480
Кол-во текстурных блоков80802×8060
Кол-во ROP32322×2848
Частота GPU*, МГц850648 (1476)576 (1242)700 (1401)
Шина памяти, бит2565122×448384
Тип памяти, объем, МБ1024, GDDR51024, GDDR32×896, GDDR31536, GDDR5
Частота памяти, МГц4800248419983696
TDP, Вт188204289250
Поддерживаемые APIDirectX 11, OpenGL 4.0, OpenCL 1.0DirectX 10, OpenGL 3.2DirectX 10, OpenGL 3.2DirectX 11, OpenGL 4.0, OpenCL 1.0
Ориентировочная стоимость$425$375$525$499

Конфигурация тестового стенда

КатегорияМодельПредоставлено
ПроцессорIntel Core i7 965 Extreme Edition 3,8 ГГцПредставительство Intel в Украине, www.intel.ua
Материнская платаASUS P6T Deluxe/WiFi APПредставительство ASUS в Украине, www.asus.ua
Оперативная памятьKingston KHX1600C9D3K3/3GX 3×1 ГБ DDR3-1600Представительство Kingston в Украине, www.kingston.com
Жесткий дискKingston SSDNow V+ SNVP325-S2/128 GB AHCI 
ВидеокартыNVIDIA GeForce GTX 480NVIDIA, www.nvidia.com
Sapphire Radeon HD 5870 Vapor-XSapphire, www.sapphiretech.de
Zotac GeForce GTX 285Zotac, www.zotac.com
inno3D GeForce GTX 295 
Блок питанияSeasonic S12D-850 850 Вт"Синтекс", (044) 593-02-01
МониторLG W3000HПредставительство LG в Украине, ua.lge.com
Программное обеспечениеMicrosoft Windows 7 Ultimate 64-bit, NVIDIA ForceWare 197.17/197.13, ATI Catalyst 10.3 

Производительность в тесселяции

Вычислительные способности NVIDIA Fermi в одной из ключевых функций DirectX 11 впечатляют: тестовый пакет Unigine Heaven 2.0 в режиме тесселяции Extreme демонстрирует двукратное преимущество новой архитектуры перед прошлым фаворитом – Radeon HD 5870. Также интересно, что падение производительности при переходе с режима High на Extreme у Fermi довольно невелико, чего не скажешь об Evergreen. Очевидно, немалую роль в этом играет наличие емкого кэша в мультипроцессорах, радикально снижающего количество обращений в DRAM. Единственное «но» – хоть Heaven и базируется на реальном игровом движке, который Unigine продает разработчикам, к настоящим играм он не имеет практически никакого отношения: готовых продуктов на его основе не существует, а нагрузка в бенчмарке чисто синтетическая. Современные игры постепенно начинают использовать тесселяцию (она реализована в S.T.A.L.K.E.R.: Call of Pripyat, Colin McRae Dirt2, Metro 2033), однако в очень небольших количествах для легкого улучшения вида персонажей, земли и т. п. Естественно, с течением времени она станет все более и более популярной и сложной, однако на сегодняшний день двукратное преимущество NVIDIA Fermi перед ATI Evergreen в тесселяции на практике будет практически незаметно.

Синтетические тесты

Тестовые пакеты Futuremark 3DMark06 и 3DMark Vantage используют API DirectX 9 и 10 соответственно, потому никакого влияния дополнительные способности Fermi по тесселяции оказывать не должны. Так и происходит: в обоих тестовых пакетах преимущество перед топовой видеокартой ATI довольно невелико и составляет лишь около 10% для DirectX 10 и всего 2% для 3DMark06 и, соответственно, DirectX 9. При этом превосходство над флагманской одночиповой моделью на базе ядра GT200, бесспорно, огромно: GeForce GTX 285 отстает от новичка на 30–40%, и конкуренцию Fermi может составить только GeForce GTX 295, оснащаемый двумя GPU. При этом стоит учитывать, что не все игры будут так же хорошо воспринимать массив SLI, который представляет собой эта видеокарта, и масштабироваться, как 3DMark.

Игровые тесты

В наш тестовый пакет входят как новейшие игры, использующие DirectX 11, так и более старые с DirectX 10. Отметим, что свежайший продукт украинских разработчиков – Metro 2033 – был запланирован как одно из тестовых приложений, однако в процессе исследования выяснилось, что он не позволяет адекватно сравнивать видеокарты ATI и NVIDIA, по крайней мере с использованием FRAPS. Во-первых, Radeon HD 5870 показывает аномально низкие результаты с применением полноэкранного сглаживания (близкие к нулю), что говорит о некорректной работы драйвера или движка игры. Во-вторых, Metro 2033 довольно активно использует PhysX и CUDA для обработки некоторых эффектов, в частности, теней, перспективы (Depth of Field), освещения и т.д. Таким образом, получаются попросту неравные условия для Radeon и GeForce, хотя, бесспорно, с точки зрения игрока это неважно, тем более что на GeForce GTX 480 Metro 2033 выглядит заметно эффектней. 4A Games готовит к выходу утилиту для тестирования в Metro 2033, и когда она выйдет, мы еще раз все перепроверим, возможно, ситуация и исправится.

Перейдем к тестам. Прежде всего рассмотрим результаты в приложениях, основанных на DirectX 10. Интересные показатели демонстрирует Unreal Tournament 3: в режиме максимального качества преимущество GeForce GTX 480 перед Radeon HD 5870 составляет 8–14%, снижаясь с ростом разрешения, однако лидером неожиданно оказывается GeForce GTX 295. Очевидно, сказывается более высокая пропускная способность памяти (2×111,9 ГБ/с против 177,4 ГБ/с у Fermi).

Tom Clancy’s H.A.W.X. также показывает, что новый флагман NVIDIA опережает соперника из стана ATI, однако не настолько, насколько хотелось бы: разрыв составляет от 17% до 7% в разрешении 2560×1600. GeForce прошлых поколений тут в явных аутсайдерах, поскольку, кроме всего прочего, H.A.W.X. использует некоторые эффекты DirectX 10.1, которые при эмуляции в DirectX 10 требуют больших затрат.

На фоне остальных тестов особняком стоит Far Cry 2, демонстрирующий, как много в итоговом быстродействии значит оптимизация ПО. Эта игра разрабатывалась в рамках программы NVIDIA The Way It’s Meant To Be Played, и неудивительно, что на GeForce она работает быстрее, но в данном случае «быстрее» – неудачное слово: Fermi опережает ATI Evergreen на 48–54%! Как жаль, что это единичный случай…

И S.T.A.L.K.E.R.: Зов Припяти, и Colin McRae Dirt2 используют тесселяцию для обработки грунта, персонажей (автомобилей) и некоторых других объектов, однако эффекта, подобного наблюдаемому в Unigine Heaven, нет: GeForce GTX 480 работает быстрее Radeon HD 5870 на 15–20% просто благодаря более быстрой архитектуре и большему объему памяти. В этой связи стоит упомянуть, что ATI планирует выпустить модификацию Radeon HD 5870 с 2 ГБ памяти, что должно благотворно сказаться на производительности при сверхвысоких разрешениях. Интересно, какой будет расстановка сил между GeForce GTX 480 и этой видеокартой?

Результаты новой игры Just Cause 2, также разработанной в рамках программы NVIDIA TWIMTBP, показывают два аспекта современной ситуации с игровыми движками на PC, сформированной противостоянием двух вендоров. С одной стороны, благодаря расширенному использованию PhysX и CUDA на GeForce GTX 480 игра выглядит абсолютно по-другому (например, эффект боке для удаленных источников света вместо обычного размытия всего «задника» сильно влияет на качество картинки). С другой стороны, дополнительные эффекты приносят и дополнительную нагрузку на GPU, и производительность заметно снижается. В итоге Radeon HD 5870 демонстрируют значительно более высокие результаты, однако без непосредственного сравнения двух видеокарт адекватно оценить их невозможно, все же играем мы не ради счетчика FPS, а ради удовольствия, в котором визуальная составляющая – далеко не второстепенный фактор. Для сравнения мы привели два одинаковых кадра из тестового сценария, воспроизведенного на максимальных настройках на обеих графических архитектурах.

Температура, энергопотребление и разгон

Огромный GPU и 1.5 ГБ памяти GDDR5, естественно, не могли не сказаться на энергопотреблении и тепловыделении. Система охлаждения, установленная на GeForce GTX 480, вполне справляется со своими обязанностями и удерживает температуру в безопасных пределах в любом режиме работы, однако нагревается видеокарта все же очень сильно. Так, во время стресс-теста в OCCT графический процессор сначала прогрелся до 96оС, а затем турбина повысила частоту вращения до 80% и снизила температуру до 94оС, и на этой отметке она и зафиксировалась. Форсирование вентилятора до 100% скорости снижает режим работы GPU до 82оС, однако шум, издаваемый СО при этом, просто невыносим. В простое графический процессор также холодным не назовешь: 55оС – довольно большое значение, особенно с учетом того, что частоты в 2D снижаются почти в 5 раз. Вопрос рабочей температуры на самом деле довольно интересный: ядро GF100 имеет безопасный порог до 105оС, потому за его сохранность беспокоиться не стоит, однако высокий нагрев снижает надежность многих других компонентов платы, к тому же выделяемое видеокартой тепло будет частично греть и другие компоненты ПК. Стоит также учитывать, что наш стенд – открытый, а в закрытом корпусе ситуация усугубится. NVIDIA даже отдельно требует от пользователей, устанавливающих две и более Fermi в массив SLI, обеспечивать принудительный обдув мощными вентиляторами.

Что касается энергопотребления, то и тут у Fermi все не слишком хорошо: в покое наш тестовый стенд потреблял от розетки 192 Вт, а при полной загрузке видеокарты в OCCT – целых 491 Вт! Превзойти этот показатель удалось только GeForce GTX 295 (202 и 508 Вт соответственно), а вот непосредственный конкурент от ATI – Radeon HD 5870 – оказался намного экономичнее, с ним стенд потребляет 156 Вт в покое и 339 Вт под нагрузкой. Скажем прямо, GeForce GTX 480 – самая «прожорливая» одночиповая видеокарта из виденных нами.

На удивление неплохим оказался разгонный потенциал нашего образца. Если от памяти можно было ожидать значительного запаса прочности, поскольку на референсных частотах видеокарты она работает намного медленнее номинальных, то GPU показал, что «пространство для маневра» есть и там. При полной скорости кулера мы смогли добиться стабильной работы на частоте 810 (1620) МГц для ядра и 2550 (5100) МГц для памяти, что соответственно равно 16% и 38% прироста. В первую очередь большое значение будет иметь разгон памяти на высоких разрешениях, поскольку именно она становится бутылочным горлышком при обмене огромными объемами данных в таком режиме.

Выводы

NVIDIA Fermi оставляет противоречивое впечатление. С одной стороны, новая графическая архитектура значительно опережает прошлое поколение продуктов компании и снова выводит ее на первое место. GeForce GTX 480 – действительно самая быстрая одночиповая видеокарта из существующих. Возможности, заложенные в чип GF100, значительно превышают способности видеокарт конкурента. С другой стороны, на сегодняшний день просто не существует прикладного ПО, которое бы могло полностью раскрыть потенциал Fermi, поскольку даже самые современные игры не задействуют высокопроизводительные блоки тесселяции и другие особенности этой архитектуры в полной мере. Конечно, в будущем начнут появляться и игры, и программные продукты на основе CUDA и OpenCL, в которых благодаря более мощной архитектуре GeForce GTX 480 значительно вырвется вперед по сравнению с Radeon HD 5870, однако пока их нет, а существующие демонстрируют отрыв всего в 10–15%. Учитывая, что рекомендованная стоимость новинки NVIDIA составляет $499, а в украинской рознице она наверняка достигнет $600, соперничество с флагманом ATI, ценники на который на сегодняшний день находятся на уровне $400–450, оказывается явно неравным. К тому же значительным «отягчающим обстоятельством» является высокая шумность и высокое энергопотребление и тепловыделение Fermi, предъявляющие дополнительные требования к корпусу и блоку питания. Конечно, несколько скрашивает ситуацию дополнительная функциональность новых видеокарт – значительный прирост производительности в CUDA (и постепенное расширение ассортимента ПО с использованием этой платформы), поддержка технологий 3D Vision и PhysX, для которых у ATI пока нет конкурента. Однако, по нашему мнению, достоинства эти вторичны и не оправдывают основных недостатков – несоразмерного ценнику прироста производительности в современных играх, ужасного теплового режима при работе и шумности. Практически все основные «минусы», впрочем, могут быть исправлены: крупные вендоры наверняка будут выпускать модели с более тихими и мощными кулерами, а постепенная отладка техпроцесса и выход новых ревизий GPU могут помочь NVIDIA снизить себестоимость и, следовательно, розничную цену GeForce GTX 480. А там, может быть, и ПО подоспеет…

Еще раз подчеркнем: архитектура NVIDIA Fermi получилась не плохой, а наоборот, отличной и перспективной. Проблема лишь в том, что она опережает свое время. Говоря аналогиями, перед нами Ferrari Enzo на улицах Киева: красиво, дорого, мощно, вот только ездить негде.