05.07.2021

Тестирование семейства масштабируемых процессоров Intel Xeon 3-го поколения

В апреле 2021 года компания Intel представила 3-е поколение масштабируемых серверных процессоров Intel Xeon. Одним из наиболее заметных нововведений стал переход на 10 нм техпроцесс, который повлек за собой множество других улучшений. Количество ядер в процессоров увеличилось до 40, прирост IPC составляет до 20%, а один из излюбленных показателей увеличения производительности по сравнению с системой пятилетней давности достиг коэффициента 2,65.

image_04.jpg

Архитектура Sunny Cove стала первым за шесть лет существенным изменением со времен появления SkyLake. Оптимизации и улучшения, производимые внутри поколения достигли своего потолка и новые процессоры призваны сделать достаточно серьёзного прироста производительности.

Можно выделить следующие улучшения: обновление емкости передней части конвейера, за счет чего было оптимизировано предсказание ветвлений. Вычислительные блоки были улучшены по глубине и ширине конвейера, что позволяет процессорам поддерживать больше наборов инструкций и выполнять большее количество инструкций. Кроме этого произошло увеличение кэша и буфера по сравнению с Cascade Lake – кэш L2 вырос с 1 Мбайт на ядро до 1,25 Мбайт на ядро и увеличилось количество Load/Store блоков.


image_02.jpg

Архитектура Sunny Cove получила поддержку новых наборов команд ISA, среди которых Vector-AES, SHA-NI и AVX512. За счет использования первых двух пользователи получат аппаратное ускорение шифрования и дешифровки, а значит и прирост производительности при работе с многими алгоритмами криптографии.

image_05.jpg

Важным фактором также стало увеличение каналов памяти с шести до восьми, в каждом канале поддерживаются два модуля, причем теперь можно устанавливать память стандарта DDR4-3200. Для связи между CPU в многопроцессорных системах используется Ultra Path Interconnect, ширина канала которого была увеличена с 10,4 до 11,2 ГТ/с. Таким образом, взаимодействие между центральными процессорами стало еще быстрее относительно предыдущих поколений.

Поддержка PCI Express 4.0 увеличивает скорость работы подключенных дополнительных устройств в системе, для двухпроцессорных серверов будет доступно до 128 линий PCI Express.

image_03.png

Значительно улучшились задержки при обращении к кэшу L3 удаленного сокета в многопроцессорных конфигурациях, Intel удалось снизит этот показатель до 118 нс по сравнению с 180 нс у поколения процессоров Cascade Lake.

Для сравнения производительности центральных процессоров было выбрано две системы с топовыми в своих поколениях процессорами – Intel Xeon Platinum 8280 (Cascade Lake-SP, 28 ядер) и Intel Xeon Platinum 8380(Ice Lake-SP, 40 ядер).

 

Характеристики

Intel Xeon Platinum 8380

Intel Xeon Platinum 8280

Количество ядер/потоков

40/80

28/56

Частоты (базовая/Boost/All-core), ГГц

2.9/3.4/3.0

2.7/4.0/3.3

TDP, Ватт

270

205

Кэш L2, Мб

50

28

Кэш L3, Мб

60

38.5

Линии PCI Express

64 линии стандарта 4.0

48 линий стандарта 3.0

Подключение UPI

3 по 11.2 ГТ/с

3 по 10.4 ГТ/с

Цена, USD

8100

10010


Оценить производительность нового поколения помогут тесты пропускной способности памяти – Stream, 3D рендеринга – Blender, тесты баз данных – HammerDB, и комплексные SPECrate 2017 Integer и SPECrate 2017 Floating Point.

 

Intel Xeon Platinum 8280 (Cascade Lake-SP, 28 cores)

Intel Xeon Platinum 8380 (Ice Lake-SP, 40 cores)

Stream Copy, MB/s

255260

304675

Stream Scale, MB/s

214993

310961

Stream Triad, MB/s

227853

315862

Stream Add, MB/s

219634

316743

Blender bmw27, c

35

23

Blender pvallion_barcelona, c

101

67

HammerDB, транзакции в минуту

5802

9613

HammerDB, операции в минуту

16624

29004

SPECrate int

215,7

304,2

SPECrate fp

210,4

312,4


Следует сказать несколько слов об энергопотреблении. Система на Intel Xeon Platinum 8380 потребляла при полной нагрузке около 950 ватт, в то время как предшественник 8280 смог скушать только 825. Казалось бы, стало ожидаемо, ведь ядер стало больше, да и TDP процессора вырос с 205 до 270 ватт, но при делении общего результат на количество ядер получается, что процессор новой архитектуры потребляет 11,875 ватт на ядро в составе готового сервера против 14,75 у предыдущего поколения.

Что можно сказать по итогу? Компания Intel сделал неплохой шаг в сторону повышения производительности серверных систем. В третьем поколении масштабируемых процессоров Intel Xeon были предложены более совершенный техпроцесс, улучшенные наборы инструкций, поддержка интерфейса PCI Express 4.0, увеличение производительности на ядро, несмотря на снижение частоты относительно предыдущих моделей. Стоит отметить снижение рекомендованных цен почти на 20% для топовых процессоров, что делает покупку более привлекательной.