Обзоры
AMD Bulldozer: универсальная архитектура на вырост

AMD Bulldozer: универсальная архитектура на вырост


Процессоров AMD с принципиально новой архитектурой Bulldozer откровенно заждались не только почитатели продукции компании, но и многие пользователи, следящие за IT-прогрессом. В последние несколько лет предлагая интересные решения по соотношению цена/производительность, AMD в основном концентрировалась на устройствах начального и среднего уровней. Возрождая линейку FX, очевидно, что компания рассчитывает привлечь внимание и более взыскательных энтузиастов, готовых к экспериментам и требующих максимальных скоростей. Возможности нового семейства мы будем изучать на примере первого в мире восьмиядерного процессора для десктопов – AMD FX-8150. Посмотрим, удастся ли производителю оправдать ожидания своих поклонников.

AMD Bulldozer

В отличие от основного конкурента, который может себе позволить следовать маятниковому принципу разработки CPU, проводя смену архитектур и технологических процессов c годичной периодичностью, компания AMD не очерчивает для своих проектов определенных временных рамок, полагаясь на чутье рынка и собственный технологический потенциал. История с архитектурой Bulldozer началась давно. Предполагалось, что ее представят еще в 2009 году, но в силу различных обстоятельств практическое воплощение смелых инженерных решений в кремнии стало возможным лишь сейчас.

Bulldozer для AMD – это всерьез и надолго. Данная микроархитектура на ближайшие несколько лет станет основой для будущих процессоров из различных сегментов: серверного, десктопного и мобильного. Это касается как дискретных CPU, так и гибридных – APU также со временем планируется трансформировать под Bulldozer. Лишь для компактных систем AMD собирается использовать чипы на экономичной Bobcat и ее модернизированных версиях. С анонсом Bulldozer компания решила возродить легендарную серию, представив процессоры линейки AMD FX, которые получили новую архитектуру и производятся с применением наиболее прогрессивного 32-нанометрого техпроцесса.

Особенности архитектуры

В основе чипов Bulldozer лежат модули с двумя вычислительными блоками x86. При этом последние не являются полностью автономными – некоторые ресурсы общие для обоих ядер. В частности, блок предварительной выборки, декодер инструкций, FPU и кеш-память второго уровня (L2). Монолитный двухъядерный модуль обеспечивает одновременное выполнение двух потоков, но с определенными оговорками. По расчетам производителя, такой подход вполне оправдан и позволяет получить порядка 80% эффективности полноценных физических ядер. Однако при этом значительно уменьшается количество транзисторов, а соответственно, площадь кристалла и его энергопотребление.

С учетом новой структуры внутренняя архитектура была очень серьезно переработана, что фактически затронуло все исполнительные блоки. Сходства с К10, которая использовалась для чипов Phenom II и Athlon II, практически нет. AMD внедрила поддержку инструкций AVX, SSE 4.2 и AES-NI и добавила собственные наборы FMA4 и XOP.

Платформа Intel LGA2011
Топовые восьмиядерные AMD FX
поставляются в жестяных коробках

Как и топовые процессоры Phenom, чипы FX получили трехуровневую систему кеширования. Однако ее организация также заметно отличается о той, что была у предшественников. Кеш-данных L1 уменьшился с 64 КБ до 16 КБ, в то же время существенно возросла его пропускная способность. L2 объемом 2 МБ является общим для обоих ядер каждого модуля. В зависимости от количества последних суммарная емкость кеш-памяти второго уровня в процессоре AMD FX может составлять от 4 до 8 МБ. Латентность его несколько увеличена – плата за оптимизацию для работы на повышенных частотах. Чипы с архитектурой Bulldozer также оснащены L3-кешем объемом 8 МБ. Учитывая эксклюзивную схему работы, суммарный объем буфера довольно впечатляющий как для десктопных моделей. Усовершенствованный алгоритм предвыборки данных позволяет надеяться, что скорость подсистемы памяти будет увеличена. Что касается непосредственно ОЗУ, то CPU FX поддерживают модули DDR3-1866 в двухканальном режиме.

Для производства AMD FX используется 32-нанометровый техпроцесс с технологией SOI, аналогичный применяемому при изготовлении APU Llano. Чипы выпускаются на мощностях родственной компании GlobalFoundries. В основе CPU лежит восьмиядерный кристалл площадью 315 мм2. Согласно топологии, большая его часть отводится под кеш-память, потому неудивительно, что суммарное количество транзисторов в данном случае составляет впечатляющие 2 млрд. Для сравнения: шестиядерные Phenom II X6 (Thuban) включают «всего» 904 млн транзисторов, но из-за 45-нанометрового техпроцесса площадь кристалла равна 346 мм2. Учитывая разницу в площади, можно предположить, что себестоимость чипов FX ниже, чем у предшественников. Однако переход на 32 нм непросто дается GlobalFoundries. AMD уже сообщала о сложностях с выходом годных заготовок, ввиду которых компания не может в полной мере удовлетворить спрос на гибридные Llano. Будем надеяться, что это никак не повлияет на доступность в продаже FX, и все желающие смогут их приобрести.

Для четырех- и шестиядерных моделей будет использоваться тот же кристалл, что позволит эффективнее распорядиться чипами, имеющими определенные дефекты. Между тем вполне вероятно, что для производства данных CPU станут применяться и полностью работоспособные кристаллы с деактивированными модулями. А в этом случае можно рассчитывать на очередную лотерею с разблокированием отключенных ядер. Прекрасный получился бы способ подогреть интерес к процессорам AMD FX.

Технические характеристики процессоров
Модель FX-8150 Phenom II X6 1075T Phenom II X4 975 Core i7-2600K Core i5-2500K
Кодовое имя Bulldozer Thuban Deneb Sandy Bridge Sandy Bridge
Количество ядер/потоков, шт. 8/8 6/6 4/4 4/8 4/4
Базовая тактовая частота, ГГц 3,6 3 3,6 3,4 3,3
Тактовая частота после авторазгона, ГГц 3,9/4,2 3,5 3,8 3,7
Объем кеш-памяти L2/L3, МБ 8/8 6×0,5/6 4×0,5/6 4×0,25/8 4×0,25/6
Технология производства, нм 32 45 45 32 32
Процессорный разъем AM3+ AM3 AM3 LGA1155 LGA1155
Энергопотребление (TDP), Вт 125 125 125 95 95
Рекомендованная цена, $ 245 181(162*) 175 (160*) 317 (315*) 216 (225*)
* По данным каталога Hotline.ua.

Turbo Core

Технология динамического увеличения частоты Turbo Core ранее использовалась компанией AMD для шестиядерных Thuban и APU Llano. Процессоры FX имеют новый механизм и алгоритм работы данной функции. В случае, когда под нагрузкой энергопотребление чипа укладывается в рамки его TDP, а температура не превышает заданного значения, частота может автоматически увеличиваться (100–300 МГц) даже в ситуации, когда активны все ядра (All Core Boost). Если же как минимум половина модулей простаивают, то AMD FX может переходить в режим Max Turbo Boost, повысив напряжение питания и весьма значительно тактовую частоту работающих блоков (до 900 МГц).

AMD также озаботилась улучшением экономичности новых чипов. Учитывая рост количества вычислительных ядер, полагаться только на эффект от использования более тонкого техпроцесса нельзя. При отсутствии нагрузки на оба процессорных ядра в рамках одного модуля и переходе их в состояние энергосбережения C6 силовые транзисторы позволяют отключать питание от данного узла, снижая общее потребление CPU.

Логическая поддержка

Как и у предыдущей десктопной платформы AMD, контроллер шины PCI Express 2.0 остался прерогативой северного моста чипсета, а не перебрался под крышку процессора. Именно количество поддерживаемых линий данного интерфейса, а вследствие и способность построения конфигураций с несколькими видеокартами стали определяющими отличиями новых наборов логики для чипов Zambezi. В распоряжении топового AMD 990FX находятся 42 линка с возможностью компоновки на графические нужды как 2×16x или 4×8x. AMD 990X имеет 26 линий и позволяет подружить только две видеокарты в режиме CrossFireX или SLI в конфигурации 2×8x. Ну а AMD 970 при таком же числе линков PCI-E предлагает довольствоваться одним адаптером. Во всех случаях периферию обслуживает южный мост SB950, который не несет каких-либо интересных новшеств: шесть портов SATA 6 Гб/c с возможностью создания RAID (0,1,5,10), до 14 разъемов USB 2.0, работа с PCI. Увы, в отличие от чипсета AMD A75 для платформы FM1 поддержки скоростной шины USB 3.0 здесь нет.

Платформа AM3+

Для работы с процессорами серии FX нужна материнская плата с разъемом AM3+. Это может быть как модель на «новом» чипсете AMD 9xx, так и продукт с логикой предыдущих поколений. Совместимость с AM3 теоретически возможна, но не гарантируется ни самой AMD, ни производителями материнских плат. Не исключено, что последние выпустят прошивки для своих топовых решений, но это скорее единичные случаи. И даже в подобных ситуациях чипы FX будут функционировать с уменьшенной скоростью переключения состояний Turbo Boost и Cool’n’Quiet. При этом все возможные проблемы с работой системы лягут на плечи пользователей. Потому на беспроблемный апгрейд рассчитывать в данном случае не приходится.

AMD Bulldozer

Платы с AM3+ легко отличить по черному цвету процессорного разъема, тогда как коннектор AM3 белый. К счастью, конструкция элементов крепления СО не изменилась, потому для охлаждения AMD FX подойдет любой кулер, совместимый с AM2/AM2+/AM3.

Модельный ряд

3DMark 11, тест CPU (Physics), баллы
AMD Bulldozer
3DMark Vantage, баллы
AMD Bulldozer
PC Mark 7, тест Cоmputation, баллы
AMD Bulldozer
CineBench 11.5, баллы
AMD Bulldozer
x264 HD Benchmark 4.0, кадры/c
AMD Bulldozer
7-Zip 9.20, MIPS
AMD Bulldozer
Far Cry 2, 1920×1080, DX10, высокое качество, кадры/c
AMD Bulldozer
Hard Reset, 1920×1080, режим High, кадры/c
AMD Bulldozer
Metro 2033, 1920×1080, DX11, PhysX, высокое качество, кадры/c
AMD Bulldozer
Colin McRae: DiRT 3, 1920×1080, высокое качество, кадры/c
AMD Bulldozer
Lost Planet 2, 1920×1080, DX11, высокое качество, тест B, кадры/c
AMD Bulldozer
Crysis 2, 1920×1080, DX9, высокое качество, тест Downtown, кадры/c
AMD Bulldozer
Энергопотребление системы, Вт
AMD Bulldozer

Благодаря модульной структуре процессоров компании несложно выстроить свой модельный ряд, предлагая устройства с различными количеством вычислительных блоков и тактовыми частотами. На старте линейка десктопных чипов, получивших название Zambezi, включает четыре CPU. Флагманом является восьмиядерное решение FX-8150 с частотной формулой 3,6/3,9/4,2 ГГц. По 8 МБ кеш-памяти L2 и L3, а также TDP на уровне 125 Вт. Схожа по оснащению и FX-8120, отличие лишь в частотном режиме работы – 3,1/3,4/4,0 ГГц. Шестиядерный FX-6100 имеет 6 МБ кеш-памяти второго уровня и все те же 8 МБ L3, а вот его тепловой пакет – 95 Вт. Наиболее доступная версия с двумя модулями и четырьмя вычислительными блоками x86 FX-4100 функционирует на 3,6/3,7/3,8 ГГц, довольствуется 4 МБ L2, емким L3 (8 МБ) и TDP в 95 Вт. Что касается стоимости устройств, то рекомендованные оптовые цены для перечисленных моделей находятся на уровне $245/205/165/115 соответственно.

Разгон

Возможность беспрепятственного разгона процессоров является одним из ключевых параметров чипов FX. На этой особенности компания AMD делает отдельный акцент. Свободный множитель доступен всем моделям линейки, а возможность его изменения будет присутствовать на любой плате с AM3+.

Архитектура FX изначально создавалась с учетом функционирования на высоких тактовых частотах. Умельцы, вооруженные сосудами с жидким азотом, смогли получить скриншот CPU-Z в ситуации, когда процессор работал почти на 8,5 ГГц. При этом, правда, понадобилось оставить активным лишь один модуль из четырех. Все восемь ядер удалось заставить функционировать на 8,1 ГГц. Ранее подобных частот достигали разве что максимально облегченные версии Intel Celeron для LGA775. Теперь же у энтузиастов появится куда более интересный объект для оверклокерских экспериментов.

В случае с воздушной системой охлаждения придется довольствоваться более скромными результатами. При повышении напряжения питания до 1,45 В CPU стабильно работал на 4,6 ГГц. Может и не столь впечатляюще, но потенциал очевидно лучше, чем у 45-нанометровых чипов Phenom II.

Итоги

Результаты тестов производительности представлены на диаграммах. Картина достаточно показательна для того, чтобы в целом сложить мнение о возможностях новой разработки AMD. Процессоры FX ожидаемо получили прирост быстродействия в многопоточных задачах – архивировании, кодировании HD-видео, рендеринге. Здесь восьмиядерному чипу вполне по силам тягаться и с Core i5-2500K, и с более дорогостоящим Core i7-2600K. Однако как только дело доходит до приложений с неважной оптимизацией для параллельного исполнения кода, AMD FX сдают позиции – удельная производительность их x86-блоков даже несколько ниже, чем у продуктов с архитектурой K10. В играх, которые в лучшем случае задействуют 3–4 потока, заметное преимущество у процессоров от Intel. Если использовать максимальные настройки качества графики, где видеокарта становится ограничителем, показатели систем выравниваются, но оценить реальный потенциал CPU в таких условиях невозможно.

Переход на 32-нанометровый техпроцесс, скорее, позволил удержать энергопотребление на прежнем уровне при возросшем быстродействии. Вероятно, приоритетом в данном случае была именно производительность, а не улучшенная экономичность CPU.

Даже судя по стоимости AMD FX очевидно, что компания в первую очередь планирует закрепиться в средней ценовой категории, осознанно отдавая Intel сегмент топовых дорогостоящих решений. В текущих условиях достойно выступать в лиге «супертяжеловесов» объективно производитель сейчас не может. Сделав ставку на многоядерные вычисления, получить выдающиеся результаты в слабо оптимизированном ПО очень проблематично. Вместе с тем всего пять лет назад мы искренне удивлялись, кому может понадобиться на десктопе четырехъядерный процессор и как эффективно использовать ресурсы подобного CPU. Сегодня же это обыденность, и преимущества чипов с таким количеством вычислительных блоков уже не вызывают вопросов. Возможно, подобное признание некоторое время спустя получат и восьмиядерные модели.

К счастью, AMD не будет сложа руки наблюдать, какая участь постигнет ее процессоры. Озвученные планы дальнейшего развития внушают хотя и сдержанный, но все же оптимизм. Компания продолжит активно дорабатывать нынешнюю архитектуру, улучшая как энергоэффективность, так и производительность CPU, однако указанные темпы – 10–15% в год – не очень впечатляют. С подобными показателями рассчитывать на кардинальное изменение ситуации можно лишь в том случае, если Intel замедлит развитие своих продуктов, но предпосылок для этого нет – механизм «тик-так» пока еще не давал сбоев. Уже весной 2012 года будут представлены чипы Ivy Bridge, выполненные по 22-нанометровой технологии и использующие 3D-транзисторы.

Итоговая оценка рассмотренной архитектуры и процессора AMD FX-8150 на ее основе неоднозначна, а это уже говорит о том, что революции не произошло. По крайней мере на данном этапе она незаметна для конечного пользователя. Качественный скачок производительности имеет место на хорошо распараллеливаемых приложениях, тогда как в однопоточных задачах серьезной прибавки не наблюдается. Большие ожидания, возлагаемые на Bulldozer, оправдались лишь отчасти. AMD еще есть над чем поработать, чтобы предложить интересные решения и побороться за место в сердцах требовательных энтузиастов.

Конфигурация тестового стенда
Процессоры AMD FX-8150, Phenom II X4 975, Phenom II X6 1075T, Intel Core i7-2600K, Core i5-2500K
Материнские платы ASUS Crosshair V Formula, Gigabyte GA-Z68AP-D3
Оперативная память Kingston HyperX Genesis KHX2133C9AD3X2K2/4GX
Видеокарта ASUS Matrix GTX580 1536MB
Блок питания be quiet! Dark Power Pro 1000W
Продукты предоставлены
AMD AMD, www.amd.com
ASUS ASUS, www.asus.ua
Gigabyte Gigabyte, www.gigabyte.ua
be quiet! Revoltec, www.revoltec.com.ua
Kingston Kingston, www.kingston.com
Intel «Евро Плюс», www.eplus.kiev.ua

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: