Изучаем AMD Ryzen в синтетике и 2D-приложениях: одно-, двухранговая память и разгон – а нужно ли и до скольких?
реклама
Оглавление
- Вступление
- Немного теории
- Настройки системы
- Тестовый стенд
- Результаты тестов
- AIDA64
- Futuremark PCMark 8
- 7-Zip 16.04 x64
- ABBYY FineReader 14
- Blender 2.79 x64
- BOINC
- Cinebench R15 x64
- Corona Benchmark
- LinX v0.7.0 (2017.0.21)
- VeraCrypt 1.21 x64
- x264 FHD Benchmark 1.0.1 64-bit
- x265 HD Benchmark 0.1.4 64-bit
- Заключение
Вступление
Мы разгоняем в статьях оперативную память (неважно, будь то обзоры материнских плат или самой памяти), а надо ли это на самом деле? Да и на форумах часто спорят, что лучше: двухранговые модули на невысокой частоте или одноранговые – на высокой? Насколько принципиален отрыв между количеством рангов?
Где именно находится та примерная планка, свыше которой – «ну да, разогнали, но толку от такого высокого результата на практике немного, это скорее для души»?
реклама
После некоторых размышлений (и не буду скрывать – сомнений и споров с редакцией) было решено попробовать разобраться в данном вопросе тщательнее. Разумеется, идеальный ответ найти сложно, но некоторая картина по итогам наших публикаций, первую из которых вы сейчас открыли, должна образоваться. И, благодаря нашему постоянному партнеру – компании Регард, начнем с самих процессоров AMD Ryzen и тестов в синтетике и 2D-приложениях.
Немного теории
Процессоры AMD Ryzen
В своей новой архитектуре, официально выпущенной «в широкие массы» в марте этого года, AMD ушла от той, как показало время, не совсем удачной идеи модульности, когда вычислительные ядра объединялись в модули по два и получали общие блоки вроде FPU, что заметно ограничивало их быстродействие. Тем не менее, полного отказа от модульности не произошло и в архитектуре Ryzen просматривается новый уровень ее развития: технически AMD оперирует теперь CCX-блоками (CCX – CPU CompleX), каждый из которых содержит по четыре полноценных ядра.
Первый нюанс: каждый из таких блоков оснащен своим независимым L3, а это значит, что при обращении к данным, лежащим в L3, работа будет сильно зависеть от того, где они находятся – в «собственном» L3 или соседнего CCX.
реклама
Физически на данный момент все Ryzen состоят из таких модулей, независимо от количества активных ядер. И связь между этими модулями обеспечивает двунаправленная 256-битная шина Infinity Fabric.
Второй нюанс заключается в том, что CCX-блоки и с остальными блоками процессора сообщаются по этой шине – контроллер памяти, контроллер PCI-Express, SATA-контроллер (если кто до сих пор не в курсе, в платформе Socket AM4 два контроллера SATA – к набору системной логики прибавился интегрированный в процессор контроллер на два порта SATA 6 Гбит/с), USB 3.1. И частота Infinity Fabric прямо связана с частотой памяти – она составляет 1/2 значения последней (например, при частоте памяти 2666 МГц частота Infinity Fabric будет составлять 1333 МГц).
Обобщая: разгоняя память, мы повышаем быстродействие AMD Ryzen не только благодаря тому, что разгоняем собственно память, но и за счет параллельного повышения частоты работы его внутренней шины, соединяющей различные блоки кристалла процессора. Кроме того, уменьшаются внутренние задержки на тех операциях, где обращения к памяти не происходит вовсе.
Оперативная память
Существует понятие «ширина модуля» – это параметр, прямо связанный с шиной данных контроллера памяти, которая для современных процессоров составляет 64 бит на канал. Но объем памяти лимитируется максимальным числом микросхем DRAM, которые могут быть одновременно подключены к шине и емкостью доступных в производстве микросхем DRAM.
Например, восемью микросхемами емкостью 4 Гбит один 64-bit объем 16 Гбайт не собрать. Чтобы обойти это ограничение на количество микросхем в стандарте, была реализована управляющая линия «Chip Select», позволяющая переключаться между микросхемами. Таким образом на одном модуле можно распаивать несколько наборов микросхем, разрядность каждого из которых составляет 64-bit. Ранг как раз и обозначает количество таких наборов.
В розничной оперативной памяти встречаются обычно один и два ранга (визуально такие модули, как правило, определяются по расположению микросхем – с одной или двух сторон модуля), хотя технически количество рангов по стандарту может достигать восьми. Восьмиранговая память выпускается, но встречается она в серверах, где зачастую реализован дополнительный контроль целостности данных ECC и ширина шины составляет 72 бит.
Именно ради возможности наращивания объемов при ограниченной емкости микросхем DRAM были придуманы ранги. Однако, как это водится, у любого решения есть свои эксплуатационные плюсы и минусы.
В числе плюсов оказалось слегка подросшее быстродействие. Иначе говоря, помимо типичного чередования каналов, контроллер памяти может также чередовать и ранги. По ряду оценок, при использовании двукратного чередования рангов прирост быстродействия (по оценкам Intel) достигает около 10-12%. Дальнейшее наращивание чередования также дает некоторый выигрыш, но он идет уже по резкой ниспадающей (счет идет на единицы процентов).
В минусах – повышенная нагрузка на контроллер памяти, из-за которой могут проявляться их [контроллеров памяти] архитектурные слабости. Например, стабильная работа на сниженной, относительно предельно возможной для этих модулей, частоте. Наглядный пример уже мелькал в одном из предыдущих обзоров, когда процессор Intel смог стабильно удерживать четыре двухранговых модуля Samsung на частоте 3333 МГц, а AMD Ryzen эти же четыре модуля удержал лишь на частоте 2667 МГц, а два – на 3066 МГц.
И про этот факт нужно помнить – в сочетании с еще одним фактором он может оказаться определяющим: на ряде материнских плат бюджетного класса, основанных на наборе системной логики AMD X370, множитель 3066 попросту отсутствует (навскидку можно вспомнить Gigabyte Aorus GA-AX370-Gaming 3 и Biostar X370GT5). В таком случае пользователю и вовсе придется ограничиться частотой 2933 МГц, если не удастся добиться стабильной работы при 3200 МГц. Исходя из этого, были подобраны соответствующие настройки.
Настройки системы
Используемый процессор разогнан до 3800 МГц. Для сравнения замеры проводились на настройках для модулей памяти по умолчанию – 2133 МГц и с таймингами, прописанными в SPD.
реклама
В BIOS материнской платы отключен HPET.
В операционной системе с целью минимизации «фризов» и их влияния на показатели в тестах отключен файл подкачки, профиль производительности установлен как «Высокий».
Тайминги оперативной памяти устанавливались по схемам: tRAS=tCL+tRP, tRC=tRAS + tRP. Используемые модули памяти устанавливались во второй и четвертый по счету слоты от процессорного разъема.
С задержками сразу обнаружился сюрприз: для двухранговых модулей автоматически устанавливался Command Rate 2T, поэтому для всех режимов, кроме «по умолчанию», вручную активировался GearDown Mode в BIOS материнской платы, после чего Command Rate устанавливался равным 1T.
Другой проблемой стало то, что не удалось более сносно стабилизировать систему с двумя двухранговыми модулями на частотах 3333 и 3466 МГц. Многие тесты завершались с ошибками, часть результатов была ниже, чем на более низкой частоте; часто один из двух модулей при очередной перезагрузке просто «отваливался» (виделся, но операционная система в свойствах выдавала, что его объем недоступен) – ровно та ситуация, которая была описана несколькими абзацами выше.
реклама
Страницы материала
Лента материалов раздела
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила