На проходящей сейчас во Франкфурте Международной конференции по суперкомпьютерам ISC 2016 опубликована очередная, 47 по счету, редакция рейтинга суперкомпьютеров TOP500, обновляемого каждые полгода. Предыдущий шестикратный чемпион – китайский суперкомпьютер Tianhe-2 – в этом году опустился на второе место, уступив титул самого быстрого в мире своему «соотечественнику» – системе Sunway TaihuLight, разработанной научным центром NRCPC (National Research Center of Parallel Computer Engineering & Technology) для китайского национального суперкомпьютерного центра в городе Уси.
Главной особенностью системы Sunway TaihuLight являются китайские 260-ядерные процессоры (256-ядерные, если быть точным) ShenWei SW26010. Конфигурация этого суперкомпьютера включает сорок вычислительных стоек с 40 960 узлами с одним процессором в каждом, то есть в общей сложности получается свыше 10 млн процессорных ядер. Пиковая производительность Sunway TaihuLight достигает немыслимого значения в 125 PFLOPS. И хотя результат Sunway TaihuLight в тесте Linpack несколько ниже – 93 PFLOPS (1015 вычислений с плавающей запятой в секунду), он на целых 74% выше предыдущего абсолютного рекорда по отрасли. Кстати говоря, предшественник Sunway TaihuLight – суперкомпьютер Sunway BlueLight с производительностью 796 TFLOPS, разработанный тем же центром NRCPC – использовал 16-ядерные китайские процессоры ShenWei SW1600 третьего поколения.
Прежде чем вернемся к особенностям Sunway TaihuLight, отметим еще один интересный момент – количество самых производительных систем списка TOP500, установленных в Китае, впервые в истории превысило таковое в США – 167 против 165.
Производительность процессоров ShenWei нового поколения достигает 3 TFLOPS, позволяя им на равных соперничать с процессорами Intel Xeon Phi поколения Knights Landing – немного иронично на фоне прошлогоднего запрета правительства США на поставки процессоров Intel Xeon в Китай. Напомним, планируемое тогда обновление Tianhe-2 процессорами Intel Xeon Phi должно было увеличить производительность суперкомпьютера до 110 PFLOPS.
Как и предыдущие ревизии чипа ShenWei, новая модель SW26010 представляет собой 64-разрядный процессор архитектуры RISC с поддержкой инструкций SIMD и внеочередным исполнением команд. Базовая блок-схема процессора по-прежнему является тайной за семью печатями, хотя ранее сообщалось, что в основе лежит архитектура DEC Alpha. Процессор изготовлен по схеме, предусматривающей использование четырех кластеров с 64 вычислительными ядрами (CPE) и одним управляющим ядром (MPE) в каждом. В каждом кластере также имеется собственный контроллер памяти, а суммарная пропускная способность на один процессорный разъем достигает 136,5 ГБ/с. На каждое ядро выделено 12 КБ кэш-памяти инструкций и 64 КБ кэш-памяти данных. Рабочая частота процессора указана равной 1,45 ГГц.
Остается добавить, что энергопотребление системы Sunway TaihuLight составляет 15,3 МВт, что ощутимо меньше аналогичного показателя прошлого лидера Tianhe-2, равного 17,8 МВт.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: