Платим блогерам
Редакция
Новости Hardware GreenCo
Шкатулка с секретом.

реклама

Вчерашний день можно считать днём, когда стартовали продажи самых производительных в мире процессоров — 12- и 16-ядерных моделей AMD Ryzen Threadripper. Пока готовится подробный обзор новинок, мы, по горячим следам, рассмотрим ряд особенностей работы Ryzen Threadripper с памятью и периферией PCIe.

реклама

Процессоры AMD Ryzen Threadripper, что уже не является секретом, физически состоят из четырёх 8-ядерных кристаллов "Summit Ridge", два из которых представляют собой болванки. Это наследие упаковки серверных процессоров AMD EPYC, число ядер у которых достигает 32 штук. Подобная структура, когда появляются условно ближние и дальние контроллеры (каналы памяти и линии PCI Express), накладывает свои особенности (ограничения) на работу вычислительной системы в целом.

Фактически каждый процессор AMD Ryzen Threadripper представляет собой двухпроцессорную систему со всеми вытекающими из этого свойствами — ростом задержек при обращении к памяти, подключённой ко "второму" процессору, и к необходимости оптимизации игрового и массового программного обеспечения по подобию оптимизации серверного программного обеспечения. Иначе нас ждут разочарования или, говоря оптимистично, мы не сможем в полной мере воспользоваться заложенным в AMD Ryzen Threadripper потенциалом.

По умолчанию AMD Ryzen Threadripper работает в режиме nUMA (неоднородная общая память или локальный режим). В BIOS или в утилите AMD Ryzen Master (с последующей обязательной перезагрузкой системы) можно выбрать другой режим — UMA (общая память или распределённый режим). Переключения на лету нет. В одном случае программы могут выиграть от выбора режима, в другом — проиграть. Выбирать и экспериментировать пользователям, хотя AMD будет давать свои рекомендации. Также для оптимизации работы системы потребуется физическая перестановка модулей памяти, если их меньше четырёх (по одному модулю каждому кристаллу или по два модуля на один кристалл).

В локальном режиме nUMA мы получим минимальные задержки, но потеряем два канала памяти и, следовательно, радикально снизим общую пропускную способность подсистемы памяти. В распределённом режиме UMA мы получаем в распоряжение все четыре канала памяти, но теряем в задержках, когда ядро из одного кластера обращается к контроллеру памяти ядра кластера второго кристалла. По данным AMD для модулей DDR4-3200 задержки в локальном режиме могут достигать 66,2 нс, а в распределённом — 86,9 нс. На практике, в виду отсутствия оптимизации программ, разница может быть в разы.

Похожая проблема с ростом задержек может наблюдаться с выбором линий PCI Express, которых у процессоров Ryzen Threadripper 64 штуки на два кристалла. Компенсировать эту особенность компании удаётся впечатляющим пакетом одновременно работающей PCI-e периферии. К процессору одновременно можно подключить 8 устройств. Точнее, одно из них — чипсет x399 — подключено всегда и забирает 4 линии. Остальные 7 устройств, например, могут быть представлены четырьмя видеокартами и тремя SSD или шестью видеокартами для ускорения расчётов и одним SSD.

Показать комментарии (18)

Сейчас обсуждают