Обзоры
Обзор процессоров AMD A10-7850K и A10-7700K

Обзор процессоров AMD A10-7850K и A10-7700K


AMD_Kaveri_intro_900

В январе нынешнего года компания AMD представила очередное поколение гибридных процессоров с кодовым названием Kaveri. В новых APU производитель попытался реализовать свои наиболее перспективные наработки. Вычислительные ядра были переведены на архитектуру Steamroller, графический блок построен по лекалам прогрессивной GCN, при этом сами процессоры производятся по нормам 28-нанометрового техпроцесса. Давайте на примере A10-7850K и A10-7700K детальнее разберемся, на что же способны новые чипы производителя.

Процессорная архитектура Steamroller

Блок x86 процессоров Kaveri использует архитектуру Steamroller, которая должна увеличить вычислительную производительность APU. Оценивая проведенные изменения, можем говорить, что Steamroller скорее является эволюционным развитием Piledriver, которая используется в чипах Trinity/Richland. Здесь по-прежнему задействуется модульная двухъядерная структура, в которой часть блоков являются общими для обоих ядер. В частности речь о блоках декодирования инструкций и операций с плавающей запятой. Такой подход позволяет несколько упростить общую структуру чипа, однако в определенных условиях при многопоточных нагрузках подобная модель вызывает простои вычислительных блоков.

AMD_Kavery_Steamroller
В Steamroller постарались частично решить эту проблему, разделив декодер инструкций на два независимых блока для каждого ядра. Это одно из наиболее кардинальных улучшений новой архитектуры, которое должно увеличить производительность процессора при работе с целочисленными вычислениями. Блок FPU по-прежнему остается единым для обоих ядер модуля, равно как и блок выборки. Тем не менее, некоторые улучшения были сделаны и здесь. В частности, усовершенствован алгоритм блока предвыборки, с 64 КБ до 96 КБ увеличен кеш инструкций, а также оптимизирован целый ряд второстепенных параметров.

Однако, даже для подобных изменений потребовалось заметно увеличить количество транзисторов. И это одна из причин, по которой AMD не торопится с выпуском процессоров, включающих более двух спаренных модулей.

Steamroller не предлагает никаких дополнительных наборов инструкций. В этом отношении новая архитектура повторяет Piledriver.

Графическая архитектура Graphics Core Next (GCN)

Процессоры Kaveri получили усовершенствованный графический блок Radeon R7, для которого используется самая последняя архитектура GCN 1.1, аналогичная применяемой для топовых видеокарт на GPU семейства Hawaii.

AMD_Kavery_GCN
Для гибридных процессоров AMD встроенный графический блок это нечто значительно большее, чем средство для вывода картинки на экран. Видеоядро, получившее название Spectre, занимает 47% площади всего кристалла. В максимальной конфигурации APU Kaveri может содержать 8 кластеров, суммарно включающих 512 вычислительных блоков. Напомним, что для чипов Trinity/Richland использовалась архитектура VLIW4, а количество шейдерных процессоров не превышало 384.

Благодаря мощной, по меркам интегрированных решений, встроенной графике, AMD заявляет о том, что вычислительная производительность топовой модели Kaveri составляет 856 GFLOPS, при этом на долю GPU приходится более 85% общей мощности – 737 GFLOPS.

Графическое ядро также унаследовало улучшенные блоки видеообработки. В частности унифицированный видеодекодер UVD 4 и усовершенствованный движок кодирования VCE 2.

Учитывая то, что видеоядро основано на архитектуре GCN, гибридный чип автоматически получает поддержку не только DirectX 11.2, но и нового низкоуровневого API Mantle, которое позволяет эффективнее использовать ресурсы GPU. Кроме того, новые APU также располагают аппаратным DSP-процессором для реализации AMD TrueSound. Поддержка оной сулит возможность прочувствовать сложные звуковые эффекты, которые не будут нагружать вычислительный блок. Конечно, как и в случае с Mantle, здесь без должного усилия разработчиков ПО не обойтись.

Концепция HSA

Ранее перечисленные функции новых APU заслуживают отдельного внимания, однако в рамках Kaveri наконец реализованы механизмы, которые наполняют содержанием броское определение «гибридный процессор». Речь о технологических решениях, необходимых для того, чтобы эфемерная концепция HSA (Heterogeneous System Architecture) получила практическое воплощение.

AMD_Kavery_HSA
Поддержка технологии hUMA (Heterogeneous Uniform Memory Access) позволяет решить задачу с доступом разнородных вычислительных блоков к единому адресному пространству. В этом случае не требуется разделение на видеопамять, которая доступна GPU и системную область с которой работают блоки x86. Реализация hUMA должна заметно упростить разработку приложений и в частности алгоритмов для подключения всех ресурсов APU.

Еще одной важной технологией, которая реализована в Kaveri – hQ (Heterogeneous Queuing). Она позволяет увеличить автономность всех вычислительных блоков. В данном случае GPU получает право создавать независимые потоки для параллельного исполнения кода без дополнительного контроля со стороны CPU, как это было ранее.

AMD_Kaveri_Compute_Cores-12

Именно по этой причине для обозначения количества вычислительных ядер (Compute Core) процессоров Kaveri компания AMD указывает общее количество блоков CPU и GPU, а не только x86. В результате топовая модель представляется как 12-ядерный APU (4 CPU + 8 GPU).

Однако, одной лишь аппаратной поддержки HSA очень мало для того, чтобы ощутить сколь-либо весомые преимущества такой конфигурации. Необходима программная экосистема, которая выстраивается не столь высокими темпами. Облегчить работу программистам должен фреймворк OpenCL 2.0, который был утвержден в ноябре 2013 года. Здесь фактически заложены основы для эффективного использования гетерогенных вычислений, как то использование общего адресного пространства, работа с разделяемой виртуальной памятью, динамический параллелизм и другие функции. Прикладных приложений, реализующих HSA придется еще подождать. Актуальные программы, в которых уже используются вычисления GPGPU, для некоторых функций пока реализуют лишь возможности OpenCL 1.1/1.2.

AMD_Kaveri_OpenCL_progs
На сегодня количество приложений, в которых используются гетерогенные вычисления, хотя и возрастает, но все же увеличивается не так быстро, как хотелось бы. К тому же, не для всех алгоритмов можно эффективно задействовать ресурсы GPU, потому в перечне приложений с соответствующей оптимизацией в основном значатся пакеты для работы с мультимедийными данными. А вот среди прикладных программ, которые используются в повседневной работе ярких примеров не так много.

Процессоры Kaveri

Новые APU производятся на мощностях компании Globalfoundries по нормам 28 нм. Производителю удалось наладить выпуск кристаллов с использованием данного техпроцесса, но сделать это оказалось не так просто.

AMD_Kavery_Die
Дело в том, что из-за усложнившейся архитектуры и особенности модульного проектирования, Kaveri содержит 2,41 млрд. транзисторов, что почти вдвое больше, чем у 32-нанометровых APU Richland (1,3 млрд.). Если учесть, что физическая площадь кристалла осталась практически неизменной – 245 vs. 246 мм² – плотность компоновки транзисторов практически удвоилась.

AMD_Kavery_Line

На старте продаж линейка чипов Kaveri включает три APU. Топовая модель A10-7850K имеет базовую частоту 3,7 ГГц с возможностью ускорения до 4 ГГц. Наличие индекса «K» в обозначении уже привычно говорит о разблокированном множителе, позволяющим достаточно просто форсировать процессор. Графический блок включает 8 кластеров с 512 вычислителями. Штатная частота для GPU составляет 720 МГц. Тепловой пакет чипа составляет 95 Вт.

Модель A10-7700K также имеет два спаренных блока x86, однако базовая частота чипа снижена до 3,5 ГГц, а порог динамического ускорения составляет 3,8 ГГц. Количество вычислительных графических кластеров уменьшено до 6, соответственно число шейдерных блоков составляет 384. При этом частота GPU не изменена – 720 МГц. TDP данного APU также укладывается в рамки 95 Вт, а индекс «K» в названии модели – признак того, что чип позволяет оверклокерам пошалить.

Третья модель в новой линейке APU – четырехъядерный A8-7600. Данный чип любопытен тем, что позволяет конфигурировать энергопотребление в зависимости от условий эксплуатации. Если необходима максимальная экономичнось, APU может работать в режиме 3,1/3,3 ГГц, укладываясь в рамки TDP 45 Вт. Если же приоритетна производительность, то процессор функционирует по формуле 3,3/3,8 ГГц, но его тепловой пакет возрастает до 65 Вт. Переключаться между режимами пользователь может самостоятельно, используя соответствующую опцию в BIOS материнской платы. В принципе, идея снижения энергопотребления путем уменьшения тактовых частот – классический пример даунклокинга, который нередко используется энтузиастами, если нужно снизить нагрев CPU. Вне зависимости от режима, GPU с 384 вычислителями на борту (как и у A10-7700K), работает на 720 МГц.

Старшая модель A10-7850K оценена производителем в $172, рекомендованная стоимость A10-7700K составляет $152, тогда как модель A8-7600 будет предлагаться за $119. Ценовая политика AMD в отношении новых APU – повод для дискуссии. Напомним, что топовый чип линейки Richland предлагается за $142. Стоимость нового флагмана на 20% выше, чем у предшественника. Очевидно производитель верит в высокий потенциал Kaveri, повышая верхнюю ценовую планку фактически до уровня таковой для четырехъядерных процессоров Intel.

Платформа Socket FM2+

Для работы гибридных процессоров Kaveri необходима материнская плата с разъемом Socket FM2+. Подобные модели появились в продаже еще в прошлом году, за несколько месяцев до анонса новых APU. Платы имеют обратную совместимость и без проблем будут работать с процессорами Trinity/Richland, но вот использовать Kaveri на устройствах с Socket FM2, увы, не удастся из-за отличий в электрической разводке. Чтобы исключить попытки самостоятельного «апгрейда», чипы имеют даже механическую несовместимость, потому новые APU не устанавливаются в FM2.

AMD_Kavery_Platform
Для систем начального уровня на базе Socket FM2+ предлагается чипсет AMD A55, который в неизменном виде находится в строю еще со времен первых гибридных процессоров Llano для Socket FM1. Напомним, что этот чипсет не имеет встроенной поддержки USB 3.0 и SATA 6 Гб/c, при необходимости данные интерфейсы реализуются с помощью дополнительных контроллеров, но учитывая позиционирование плат на основе этого чипсета, случается это крайне редко.

Для материнских плат среднего уровня предлагается AMD A78. Функционально это аналог A75, а это значит, что чипсет поддерживает 4 порта USB 3.0 и имеет 6 каналов SATA 6 Гб/c. Однако, еще более популярным является AMD A88X с контроллером SATA 6 Гб/c на восемь портов и возможностью разделять процессорные линии PCI Express в режиме x8+x8 для CrossFire-режима.

AMD_Kaveri_motherboard
Учитывая общее позиционирование платформы, цена самых дорогостоящих моделей на AMD A88X составляет $120–140, тогда как подавляющее большинство плат стоят не дороже $100. Да и в целом выбор плат с разъемом Socket FM2+ достаточно велик. В каталоге hotline.ua на данный момент представлено более четырех десятков устройств различных форм-факторов. Подобрать подходящий вариант не составит никаких проблем.

Процессоры под FM2+ приносят возможность по HDMI передавать картинку с разрешением 4K. Кроме того, новые APU также получили контроллер PCI Express 3.0, впервые позволяя «закольцевать» скоростную шину в рамках платформы AMD. Материнские платы с разъемом FM2+ на базе A78 и A88X, которые появились значительно раньше APU Kaveri, априори поддерживают такую возможность, ну, а видеокарты с PCI-E 3.0 уже в продаже более двух лет.

AMD A10-7850K и A10-7700K

Для знакомства с возможностями Kaveri мы использовали две доступные ныне модели – A10-7850K и A10-7700K. Процессоры предлагаются в коробках с ярким и достаточно стильным оформлением.

AMD_Kaveri_Box
В комплект входит непосредственно сам процессор, заключенный в прозрачный пластиковый блистер, небольшая наклейка с форменным логотипом и брошюра с кратким руководством по установке. C APU поставляется штатная система охлаждения.

Кулер включает алюминиевый радиатор достаточно простой конструкции, который продувается 70-миллиметровым вентилятором. Общая высота охладителя составляет 50 мм. В области контакта с процессором изначально нанесена термопаста «квадратно-гнездовым» способом.

Во время тестирования мы использовали материнскую плату MSI A88X-G45 Gaming. Согласно заданному по умолчанию алгоритму управления СО, в режиме покоя вентилятор работал на 1800 об/мин. Под высокой нагрузкой на открытом стенде скорость вращения повышалась до 2900 об/мин, при этом температура процессора удерживалась на уровне 65 С. Эффективности такой СО достаточно для работы процессора в штатном режиме, однако для желающих разгонять APU, а также тишины точно понадобится более эффективная альтернатива.

Коробочная версия A10-7850K предлагается в рознице примерно за $185, тогда как A10-7700K стоит порядка $160. Модель A8-7600 должна была появиться в продаже в течение первого квартала нынешнего года, однако на момент написания материала этот чип все еще недоступен для покупки.

AMD_Kaveri_7700-7850_APU

Процессор A10-7850K имеет частотную формулу 3,7/4 ГГц, при этом в режиме покоя частота чипа снижается до 1700 МГц.

AMD_Kaveri_7850K_info

Графический блок в максимальной комплектации содержит 512 вычислителей, 32 текстурных модуля и 8 блоков растеризации. Пропускная способность памяти целиком и полностью зависит от частоты системной ОЗУ. В условиях двухканального режима с парой модулей DDR3-2133 она составляет 34 ГБ/c. Конечно, для GPU такого уровня показатель очень невысокий.

AMD_Kaveri_7850K_info_GPU

A10-7700K уступает флагману в тактовой частоте ядер x86. Пара двухъядерных модулей работают в режиме 3,5/3,8 ГГц. Любопытно, что без нагрузки частота APU снижается до 2000 МГц, а не 1700 МГц, как у старшей модели.

AMD_Kaveri_7700K_info

Графическое ядро данного процессора включает 6 вычислительных кластеров на 384 шейдера. Количество текстурных блоков уменьшилось до 24, а число растеризаторов не изменилось – 8. Частота GPU уже представленных моделей Kaveri составляет 720 МГц. Что касается пропускной способности памяти, то в идентичной конфигурации системы при 128-битовой шине она составляет все те же 34 ГБ/c.

Производительность

Для оценки возможностей процессоров Kaveri мы подобрали новым чипам достойных оппонентов. Прежде всего, это топовая модель семейства Richland – A10–6800K. Сравнение с APU предыдущего поколения напрашивается само собой. Данный APU является хорошим ориентиром. Процессоры Intel представлены в данном случае моделью Core i5-4440. Один из наиболее доступных четырехъядерных CPU конкурента, стоимость которого очень близка к таковой для A10-7850K.

Начав с синтетических тестов, прежде всего мы оценили работу подсистемы памяти и кешей APU различных поколений.

AMD_Kaveri_6800K_cache

AMD_Kaveri_7850K_cache
Стоит отметить, что скорость передачи данных при записи, чтении, а также копирования данных в ОЗУ в случае с Kaveri несколько возросла, однако увеличилась и латентность памяти c 67 нс до 77 нс. Более чем вдвое возросла скорость записи и копирования в L1, существенно ускорилась работа кеш-памяти второго уровня, но, опять же задержки стали чуть больше. Как на практике скажется такая оптимизация, покажут результаты тестов.

Первые замеры демонстрируют, что APU предыдущего поколения не дадут расслабиться новичкам и преимущество в 400 МГц может в ряде случаев нивелировать архитектурные улучшения. Минимальное преимущество A10-6800K над чипами Kaveri в игровой синтетике и архиваторе 7-Zip – лишнее тому подтверждение. Вместе с тем, с кодированием видео 28-нанометровые чипы справляются получше, не смотря на существенную разницу частот. Однако, рендеринг сцены в Cinebench R15 демонстрирует, что грубую силу тоже не стоит игнорировать. 400 МГц – это 400 МГц.

AMD_Kaveri_diags7
AMD_Kaveri_diags8
AMD_Kaveri_diags9
Улучшение работы целочисленных блоков приносит очень существенное ускорение APU в тестах Super Pi и wPrime. Да и с шахматными комбинациями у Kaveri стало получше, хотя с четырехъядерным носителем Haswell они все еще играют в разных лигах.

AMD_Kaveri_diags10
После вереницы этапов, в которых APU различных поколений сражались исключительно между собой, результаты тестов PCMark 8 становятся приятной неожиданностью. Вернее, хороший прирост производительности при вовлечении GPU вполне можно было прогнозировать, но хорошая оптимизация тестового пакета под OpenCL скорее даже превзошла ожидания. Гетерогенные вычисления на марше. Наглядная демонстрация того, как оно может быть, и это еще OpenCL 2.0 не задействован. Перспективы интересные, вопрос лишь в том, сколько еще понадобится времени, чтобы такие результаты были не редким исключением. Работы здесь еще очень много.

Тестирование интегрированной графики – услада для решений AMD. Гибридные чипы имеют заметно более мощный графический блок, чем таковой у процессоров Intel. Потому в данном случае любопытно, насколько улучшен новый GPU в сравнении с предшествующим решением, встроенным в чипы Richland.

AMD_Kaveri_diags_GPU1
AMD_Kaveri_diags_GPU2
В тестах 3DMark прирост производительности составляет 26–33%. При этом даже встройка A10-7700K c 384 вычислителями, работающими на 720 МГц, оказывается заметно предпочтительнее интегрированной графики A10-6800K, содержащей идентичное количество шейдерных блоков и работающей на частоте 844 МГц.

AMD_Kaveri_diags_GPU3
AMD_Kaveri_diags_GPU4
AMD_Kaveri_diags_GPU5
AMD_Kaveri_diags_GPU6
В реальных играх многое зависит от используемых движков. В целом Kaveri смотрятся предпочтительнее, но ситуация разнится. A10-7850K на 20% опережает A10-6800K в Bioshock Infinite, имеет преимущество в 36% в Bafflefield 4 и более скромные 11% в игре Thief. Кстати, последняя позволяет активировать API Mantle. После этого результаты устройств с графикой GCN улучшились примерно на 10% (на диаграммах указаны показатели без Mantle). Исключением из общей картины стала Total War: Rome II, где топовая модель с Radeon R7 смогла лишь приблизиться к результатам A10-6800K.

Во время экспериментов мы также оценили влияние пропускной способности памяти на производительность графической подсистемы.

AMD_Kaveri_diags_Memory1
AMD_Kaveri_diags_Memory2
Полученные результаты – наглядное подтверждение очень большой зависимости показателей от рабочей частоты памяти. Количество кадров/c можно увеличить до 50% используя DDR3-2400 вместо DDR3-1333. В данном случае можно говорить, что комплект из двух модулей DDR3-2133 – минимум, который необходим, если вы планируете использовать встроенную графику. Более скоростные модули уже стоят подороже, но в том же режиме 2400 МГц, зачастую вполне нормально работают и номинальные комплекты DDR3-2133 после некоторого повышения таймингов и напряжения питания.

Энергопотребление

Заявленный уровень TDP для обеих рассматриваемых моделей Kaveri составляет 95 Вт, на 5 Вт выше тепловой пакет у A10-6800K, ну, а Core i5-4440, согласно спецификации, должен укладываться в рамки TDP 84 Вт.

AMD_Kaveri_diags_TDP1
AMD_Kaveri_diags_TDP2
Во время максимальной нагрузки на вычислительные блоки x86 энергопотребление чипов Kaveri находится примерно на том же уровне, что и у предыдущего флагмана. А вот во время игры Battlefield 4 новые APU оказались заметно энергоэффективнее. До показателей Core i5-4440 еще далеко, однако если сделать пересчет количества кадров/c на ватт затраченной энергии, то такое соотношение для новых чипов AMD будет выглядеть довольно примечательно.

Разгон

Более современный техпроцесс изготовления, как правило, позволяет рассчитывать на улучшение частотного потенциала процессоров. Однако, увы, это не аксиома. Серьезно увеличенная сложность компоновки, а также практически удвоившаяся плотность размещения транзисторов сказалась на частотном потенциале Kaveri. Несмотря на то, что APU производятся по нормам 28-нанометрового техпроцесса, на существенный разгон рассчитывать не стоит. Воспользовавшись возможностями процессоров с разблокированным множителем, после повышения напряжения питания на 0,1 В нам удалось повысить тактовую частоту обоих чипов Kaveri до 4,4 ГГц. Неплохо, но не более того. 32-нанометровые процессоры Richland, как правило, можно ускорить до 4,6–4,8 ГГц, хотя, как мы видим, производительность на мегагерц у них все же ниже, чем у APU с архитектурой Steamroller.

AMD_Kaveri_7850K_4400
Стоит также отметить особенность разгона Kaveri. Новые APU имеют усовершенствованный механизм регулировки энергетических состояний и различные механизмы, позволяющие избежать перегрева процессора и удерживать энергопотребление чипа на заданном уровне. В этом случае возможна ситуация, когда под высокой нагрузкой частоты блоков x86 и GPU будут автоматически уменьшаться, снижая производительность, потому ценность больших цифр на скриншоте CPU-Z будет нивелироваться.

Мы также поэкспериментировали с разгоном графического ядра A10-7700K. Тактовую частоту GPU процессора A10-7700K удалось повысить с 720 до 1029 МГц (+43%). Отметим, что наращивать частоту можно с определенной дискретностью, потому предельный «стабильный мегагерц» получить затруднительно.

AMD_Kavery_BIOS_GPU
Как видим, графическое ядро имеет существенный потенциал для увеличения частоты, однако с ее увеличением производительность масштабируется не так хорошо, как того хотелось бы. Дело в том, что узким местом графической подсистемы в данном случае является пропускная способность памяти, которую увеличить очень проблематично. Допустимый режим ОЗУ – DDR3-2400. Других повышающих делителей платформа Socket FM2+ не предполагает. Сюда бы скоростную GDDR5, но, увы, ОЗУ такого типа в качестве системной пока не предвидится даже в среднесрочной перспективе.

Несмотря на очень существенный разгон GPU, прирост производительности не так велик. В синтетических приложениях это неплохие 20–25%, но в реальных играх кадры/c выросли заметно скромнее – 5–15%. Отметим, что повышение рабочей тактовой частоты GPU с 720 до 1029 МГц увеличило энергопотребление системы под графической нагрузкой на 15–20 Вт.

Итоги

Подводя общие итоги, при всем желании избежать неоднозначности оценок новых чипов AMD, сделать это не удается. Процессорная архитектура Steamroller действительно эффективнее Piledriver, что позволяет зачастую не только нивелировать разницу частот старших моделей APU двух поколений, но и в ряде случаев выводит Kaveri в лидеры. Однако в счетных задачах при высокой нагрузке на блоки x86 даже новым процессорам сложно конкурировать с четырехъедерниками Intel. При этом в гибридных процессорах AMD сокрыта большая сила, которую можно высвободить, используя концепцию HSA. Приходится надеяться на то, что разработчики ПО все активнее будут переходить на сторону гетерогенных вычислений, учитывая что OpenCL 2.0 позволяет заметно упростить этот процесс, не требуя серьезных жертвоприношений.

Для игровых систем или мощных ПК с дискретной графикой все же предпочтительнее чипы Intel. Вместе с тем, процессоры Kaveri определенно заслуживают внимания, особенно когда речь идет о сборке универсальной системы, владельцу которой будет достаточно возможностей интегрированного видео. APU имеют целый ряд интересных возможностей, которые не лежат на поверхности. Хорошим выбором новые чипы будут и в том случае если в душе вы техноромантик, желающий растянуть во времени удовольствие от покупки, радуясь хорошим результатам своей системы в очередном оптимизированном приложении. Снижение цены добавит привлекательности новым APU, кроме того было бы интересно увидеть гибридные чипы новой волны среднего и начального уровней.

Процессоры AMD A10-7850K, A10-7700 и A10-6800K предоставлены для тестирования компанией AMD, www.amd.com

Процессор Intel Core i5-4440 предоставлен для тестирования компанией «Евро Плюс», www.eplus.kiev.ua


Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: