Sамая Lучшая Iнтеграция: сравнение прироста скорости от режима SLI на платформах AMD и Intel
реклама
Введение
Выпустив очень удачный чипсет для процессоров AMD – nForce4 SLI, и завоевав уже около 50% рынка наборов логики под данную платформу, компания NVIDIA решила не останавливаться на достигнутом и в начале апреля анонсировала чипсет nForce4 SLI (Intel Edition), предназначенный для процессоров Intel. В отличие от своего предшественника nForce4 SLI (Intel Edition) построен по классической двухчиповой схеме. Так как, режим SLI в nForce4 SLI (Intel Edition) реализуется так же, как и в AMD Athlon 64 системах – путём использования двух шин PCI Express x8, то почему бы не сравнить эффективность их работы с разными процессорами и типами оперативной памяти (DDR и DDR2)? Где прирост производительности от активации SLI будет выше? На платформе с процессором AMD Athlon 64, имеющим встроенный контроллер памяти и использующим только DDR память, или в системах на базе процессоров Intel Pentium 4 с поддержкой оперативной памяти DDR2 вплоть до DDR2-667 SDRAM? Вот это мы с Вами сегодня и попробуем выяснить.
Тестовая конфигурация, драйверы и методика тестирования
Все тесты были проведены на следующих платформах:
Комплектующие | Платформа на базе AMD Athlon 64 | Платформа на базе Intel Pentium 4 |
Материнская плата: | MSI K8N Diamond (NVIDIA nForce4 SLI), Socket 939, BIOS v.1.1 | MSI P4N Diamond (NVIDIA nForce4 SLI IE), LGA775, BIOS v.1.0 |
Процессор: | AMD Athlon 64 3200+, 2000MHz, 512Kb (Winchester, D0) | Intel Pentium 4 540 3200MHz, 1024Kb, (Prescott, E0) |
Кулер: | PENTAGRAM FREEZONE QVC-120 Cu+ | |
Термопаста: | Thermaltake Thermal Grease #2 (Arctic Silver 5) | |
Оперативная память: | 2 x 512Mb DDR PC3200 | 2 x 512Mb DDR2 PC4300 |
Patriot XBLK | Corsair CM2X512A | |
200(400)MHz, 2-2-2-5 | 266(533)MHz, 3-2-3-3 | |
Видеокарты: | 2 х MSI GeForce NX6800-TD256E 256Mb (MS-8984) | |
MSI Radeon RX850XT-VT2D256E 256Mb (MS-8990) | ||
Дисковая подсистема: | 160Gb IDE Seagate Barracuda 7200.7 (3160023A) 7200RPM 8Mb | |
Привод: | DVD±R/RW & CD-RW NEC ND-3520A firmware v.1.05 | |
Корпус системного блока: | INWIN-S508 + блок питания 420W (Thermaltake-W0009) + два корпусных 80-мм кулера Zalman (~1400RPM, 7v.) |
Учитывая, что процессоры относительно слабы для тестирования скорости двух GeForce 6800 в режиме SLI, оба CPU были разогнаны: максимум для AMD Athlon 64 3200+ степпинга D0 составил 2500MHz при напряжении 1.55v.:
реклама
Intel Pentium 4 смог стабильно работать на 4000MHz при напряжении 1.5385v.:
Оперативная память DDR PC3200 Patriot XBLK при разгоне AMD Athlon 64 работала на 209 (418) MHz с таймингами 2-2-2-5-1T. Как показало предварительное тестирование, такой режим оказался быстрее, чем на 250 (500) MHz с таймингами 2.5-3-3-5-2T (а более низкие тайминги на этой частоте память уже "не тянула"). На платформе с процессором Intel Pentium 4 частота работы оперативной памяти DDR 2 была зафиксирована на стандартной для неё отметке 266 (533) MHz, при этом тайминги её работы удалось понизить до 3-2-3-3, что явно нетипично для данного типа памяти и заметно прибавляет в скорости системы в целом.
Видеокарты GeForce 6800 были разогнаны до 425/855MHz как при работе в режиме SLI, так и при одиночном режиме тестирования.
Все тесты были проведены в операционной системе Windows XP Home Edition SP2, установленной на первый раздел жесткого диска размером 5Gb. В свою очередь, бенчмарки и игры были установлены на второй раздел винчестера размером в 30Gb. Чтобы минимизировать влияние на итоговые результаты прочих программных факторов, во время проведения тестов все лишние сервисы, за исключением 4-х, необходимых для нормального функционирования операционной системы, были отключены. Никаких дополнительных программ также не устанавливалось ("чистый трэй"). Система настроена на максимальное быстродействие.
Тесты выполнялись с использованием системных драйверов Intel Chipset Software Installation Utility версии 6.3.0.1008 и библиотек DirectX 9.0с. Что же касается драйверов для видеокарт GeForce 6800, то, помня неработоспособность драйверов версии 76.10 в режиме SLI в игре The Chronicles Of Riddick: Escape From Butcher Bay, специально для проведения тестирования были скачаны еще две относительно свежих версии драйверов Force Ware 72.01 и 76.50. Приятно, что в обеих версиях режим SLI в игре The Chronicles Of Riddick: Escape From Butcher Bay оказался работоспособен и, главное, заметно прибавлял в скорости в сравнении с одной GeForce 6800, но при проведении тестов на версии Force Ware 76.50 вновь приходилось прибегать к помощи последней версии программы RivaTuner и принудительно использовать библиотеки OpenGL версии 1.3. Кроме того, результаты тестов на драйверах версии 72.01 в данной игре оказались несколько выше, чем показатели FPS на 76.50. Учитывая, что во всех остальных играх и синтетических бенчмарках 76.50 показывает более высокую производительность, было решено использовать именно данную версию, но The Chronicles Of Riddick: Escape From Butcher Bay все же тестировался на Force Ware 72.01. Надеюсь, что Вы отнесетесь снисходительно к таким "выкрутасам" с драйверами при тестировании. Хочется всегда выжать максимум из тестовой системы.
Как показали предыдущие тесты режима SLI в играх, использование анизотропной фильтрации не влечет за собой заметное снижение производительности, поэтому от тестов просто в чистом режиме "Quality" было решено отказаться. В результате тестирование было проведено в 32bit-ном цвете в двух разрешениях: 1024х768 и 1280x1024, и при двух режимах настроек драйверов:
- Режим "Quality+AF16x" – настройки драйвера на "Quality", VSync Off, AF16x, AA Off;
- Режим "Quality+AF16x+AA4x" – настройки драйвера на "Quality", VSync Off, AF16x, AA4х.
Оптимизации трехлинейной и анизотропной фильтрации в драйверах NVIDIA во время тестирования были активированы.
реклама
Выбор метода рендеринга режима SLI: AFR или SFR?
Одной из особенностей режима SLI является возможность выбора пользователем в панели управления драйверов Force Ware метода рендеринга: AFR (alternate-frame rendering, или "рендеринг с чередованием кадра"), либо SFR (split-frame rendering, или "рендеринг с разделением кадра"):
В случае выбора пользователем режима AFR, подготовленные попеременно видеокартами кадры выдаются на экран непрерывно, при интенсивном использовании кадрового буфера. В сравнении с режимом SFR, alternate-frame rendering обеспечивает более высокий прирост производительности в большинстве бенчмарков и игр. Тем не менее, для полного раскрытия потенциала данного режима необходимо выполнение, как минимум, двух условий: наличие мощного центрального процессора и, так сказать, отточенность драйверов (здесь также нельзя упомянуть про специфику игровых приложений и бенчмарков, проще говоря, поддержку ими режима SLI). Если соблюдение первого условия для владельцев двух видеокарт уровня 6800 и выше, а также материнской платы стоимостью под 200$ (а то и более) не должно являться существенной проблемой, то вот с драйверами вопрос до сих пор до конца не решен. Но об этом подробнее я скажу чуть ниже.
Режим SFR формирует картинку, разделяя сцену, выводимую на монитор, на две части, процентное соотношение которых меняется динамически. Так, например, в один момент времени верхние 40% экрана может рендериться первой видеокартой, а 60% - второй. В следующую секунду ситуация меняется и процентное соотношение уже 39% на 61%, например. "Благодаря" багам в драйверах Force Ware как версии 72.01, так и 76.50 в Far Cry и The Chronicles of Riddick: EFBB (здесь только на 72.01) на неразогнанном процессоре AMD Athlon 64 3200+ (2000MHz) при использовании режима SFR можно было наблюдать плавающую горизонтальную полосу, которая и являлась границей совместного рендеринга двух GeForce 6800 в режиме SLI. При разгоне процессора до 2500MHz подобных дефектов изображения не наблюдалось. Странно, что это происходило именно в режиме SFR, который теоретически должен быть менее процессорозависим, чем режим AFR.
Посмотрим, какой же режим окажется наиболее быстрым и наименее процессорозависимым:
GeForce 6800 SLI (425/855MHz) & AMD Athlon 64 3200+ (2000MHz) | |||||
Benchmark’s & Games | Resolution | Quality + AF16x | Quality + AF16x + AA4x | ||
AFR | SFR | AFR | SFR | ||
3DMark 2003 | 1024x768 | 15 416 | 15 392 | 11 214 | 11 205 |
3DMark 2005 | 7 776 | 7 918 | - | 8 156 | |
Aquamark 3 | 68.0 | 68.0 | 66.9 | 67.1 | |
Far Cry | 1024x768 | 78.9 | 78.1 | 78.5 | 77.5 |
1280x1024 | 77.7 | 77.2 | 75.3 | 75.2 | |
DOOM 3 | 1024x768 | 87.7 | 96.0 | 88.3 | 88.3 |
1280x1024 | 80.6 | 92.2 | 57.6 | 57.3 | |
Half-life 2 | 1024x768 | 100.0 | 106.6 | 102.9 | 103.0 |
1280x1024 | 100.3 | 100.2 | 88.8 | 88.6 | |
The Chronicles of Riddick: EFBB | 1024x768 | 134.9 | 58.5 | 80.0 | 30.3 |
1280x1024 | 100.6 | 46.8 | 52.7 | 21.3 |
Если производительность двух видеокарт в режиме SLI ограничивается скоростью центрального процессора, то без активации полноэкранного сглаживания режим SFR оказывается быстрее в обоих разрешениях в DOOM 3, в разрешении 1024x768 в Half-life 2 и в 3DMark 2005. Что же касается провала скорости данного режима в игре The Chronicles of Riddick: EFBB, то можно было бы возложить вину на движок игры или некорректность работы драйверов Force Ware, если бы не результаты режима SFR после разгона процессора... В остальных играх и бенчмарках наблюдается примерный паритет.
При активации полноэкранного сглаживания, за исключением опять же The Chronicles of Riddick: EFBB, результаты выровнялись еще больше. Но проблемой здесь стал стабильный вылет 3DMark 2005 при тестировании в режиме AFR. В итоге мне так и не удалось получить в данном бенчмарке результат при AA4x, причем как на драйверах версии 72.01, так и версии 76.50.
Теперь оценим, насколько изменятся результаты тестирования после разгона процессора на 25%.
GeForce 6800 SLI (425/855MHz) & AMD Athlon 64 3200+ @2500MHz | |||||
Benchmark’s & Games | Resolution | Quality + AF16x | Quality + AF16x + AA4x | ||
AFR | SFR | AFR | SFR | ||
3DMark 2003 | 1024x768 | 15 890 | 15 900 | 11 488 | 11 484 |
3DMark 2005 | 8 545 | 8 508 | 8 472 | 8 484 | |
Aquamark 3 | 79 | 78.9 | 76.9 | 76.9 | |
Far Cry | 1024x768 | 80.4 | 80.4 | 80.3 | 80 |
1280x1024 | 79.5 | 80.1 | 72.2 | 72.3 | |
DOOM 3 | 1024x768 | 113.3 | 113.4 | 96.5 | 96.4 |
1280x1024 | 105.5 | 107.2 | 61.2 | 61.2 | |
Half-life 2 | 1024x768 | 100.3 | 110.2 | 103.5 | 103.9 |
1280x1024 | 96.9 | 97.2 | 81.6 | 81.9 | |
The Chronicles of Riddick: EFBB | 1024x768 | 127.7 | 127.6 | 72.4 | 72.4 |
1280x1024 | 91.6 | 91.5 | 48 | 48 |
Очень незначительное, но все же преимущество рендеринга с разделением кадра (SFR). При этом обратите внимание, что результаты The Chronicles of Riddick: EFBB режимов AFR и SFR выровнялись. Я специально проверил логи тестов, не перепутаны ли в таблицах колонки AFR и SFR, но оказалось все правильно.
Теперь несколько слов о рендеринге с чередованием кадра (AFR). Пришлось отказаться от выбора данного режима работы SLI в дальнейших тестах в силу его большей глючности по сравнению с SFR. При использовании AFR картинка частенько просто рвется, в играх нередко наблюдаются рывки и артефакты. Не замечено дефектов изображения только в 3DMark 2003, в Unreal Tournament 2004 и Splinter Cell (результаты тестов последних двух не привожу, вследствие их очень высокой процессорозависимости). Кроме того, оба режима были проверены в играх Ил-2 Штурмовик: Пёрл Харбор и Brothers in Arms. В итоге при проведении дальнейших тестов было решено остановиться на использовании рендеринга с разделением кадра (SFR), как наиболее стабильном и не уступающем в скорости конкуренту в лице AFR. Остается надеяться, что более перспективный AFR-режим в скором времени все же получит "допинг" в виде новых исправленных и быстрых драйверов Force Ware.
Прирост производительности режима SLI платформ на базе AMD и Intel
Заранее необходимо сказать, что задачи сравнить производительность процессоров AMD и Intel в контексте данного тестирования не стоит, говориться в статье об этом не будет и обсуждению в соответствующей ветке конференции так же не подлежит. Главное в сегодняшнем тестировании – оценить, на какой платформе режим SLI работает эффективнее и где прирост производительности от перехода к использованию связки из двух разогнанных GeForce 6800 выше. В тестах вне конкурса также принимает участие уже знакомый Вам ранее MSI Radeon X850XT разогнанный до 555/1250MHz (GPU/memory) с использованием драйверов Catalyst 5.4 и всеми активированными оптимизациями в них.
реклама
Дабы не загружать Вас лишними диаграммами и, учитывая, что разрешение 1280 x1024 является наиболее показательным и менее зависимым от скорости центрального процессора, ниже будут приведены только диаграммы с результатами тестирования в играх в разрешении 1280x1024. Тем не менее, линки на диаграммы в разрешении 1024x768 я буду приводить в каждом разделе тестов. Так как оба 3DMark-а и Aquamark 3 тестировались только в разрешении 1024x768, то результаты в данных синтетических и полусинтетических бенчмарках будут приведены именно в этом разрешении.
При тестировании был использован последний build 3.6.0 бенчмарка. Тесты в данном синтетическом пакете были проведены только в одном разрешении – 1024x768, при активированной анизотропной фильтрации уровня 16x и затем, в дополнение к ней, еще и полноэкранного сглаживания уровня 4x. Посмотрим, что получилось:
Как в режиме с активированным полноэкранным сглаживанием, так и без него небольшое преимущество в приросте производительности от перехода к режиму SLI находится на стороне платформы Intel (0.9%-2.1%).
Так же как и в предыдущем случае 3DMark был пропатчен до последней на момент написания статьи версии 1.2.0. Одно разрешение – 1024x768 и аналогичные 3DMark 2003 режимы качества графики:
В 3DMark 2005 мы уже можем наблюдать иную картину: SLI работает эффективнее на платформе на базе процессора AMD Athlon 64, причем преимущество в обоих режимах качества графики составляет здесь уже около 12%.
В Aquamark 3 сохраняется паритет, очевидного преимущества нет ни у одной платформы.
Переходим к результатам тестирования в играх и их анализу в разрешении 1280x1024.
В качестве тестовой демки была выбрана демо-запись "Training" уровня с одноименным названием от Ubisoft. Версия игры – 1.31 (build 1337), максимальная детализация, два последовательных прогона бенчмарка. Технологии "Geometry Instancing" и сжатия карт нормалей ("Normal-maps compression") во время тестирования были активированы.
Far Cry v.1.31 1024x768 | |
Quality + AF16x | Quality + AF16x + AA4x |
Как и в 3DMark 2005, в Far Cry режим SLI чуть больше благосклонен к платформе AMD. Прирост производительности от перехода к совместной работе двух видеокарт при использовании анизотропной фильтрации уровня 16x на платформе с процессором AMD Athlon 64 превышает на 2.3% прирост производительности на платформе с процессором Intel. При активации полноэкранного сглаживания этот разрыв увеличивается до 3.6%. Здесь необходимо учесть, что в абсолютных показателях система с процессором Intel Pentium 4 и DDR2 оперативной памятью показывает более высокую производительность. Можно предположить, что при равной производительности платформ преимущество в приросте производительности от перехода к режиму SLI еще несколько вырастет в пользу AMD.
Для тестов использовалось стандартное демо "demo1" при детализации графики в самой игре – "Ultra Quality" и, также как и в Far Cry, двойном прогоне демо-записи.
DOOM 3 1024x768 | |
Quality + AF16x | Quality + AF16x + AA4x |
Довольно интересные результаты можно наблюдать в DOOM 3. Когда полноэкранное сглаживание не используется, SLI эффективнее работает на платформе с процессором AMD: +28.4FPS (+36.4%) против +21.8FPS (+27.5%) на Intel Pentium 4 (сказывается всем известное преимущество в скорости в играх процессора AMD). Но стоит только включить AA4x, увеличив тем самым нагрузку на графическую подсистему, как впереди уже оказывается Intel: +29.9FPS (+69.4%) против +23.6FPS (+59.9%) на AMD – разрыв достигает 10%.
Все тесты проводились на демо-записи d1_town_01 и при максимальных настройках графики в самой игре.
Half-life 2 1024x768 | |
Quality + AF16x | Quality + AF16x + AA4x |
В Half-life 2 небольшое преимущество в обоих режимах качества графики на стороне платформы на базе процессора AMD Athlon 64. Вновь в данной игре отлично смотрится Radeon X850XT.
Максимальная детализация, Shader 2.0, demo_ducche .
The Chronicles of Riddick: EFBB 1024x768 | |
Quality + AF16x | Quality + AF16x + AA4x |
В The Chronicles of Riddick: EFBB прирост производительности на обеих платформах одинаков, разница находится в пределах погрешности.
Подведем итоги.
Заключение
Посмотрим на результаты прироста производительности при переходе к режиму SLI всех бенчмарков и игр в двух разрешениях и двух режимах качества графики на платформах на базе процессоров AMD Athlon 64 и Intel Pentium 4 в одной таблице*:
Benchmark’s & Games | Resolution | Quality + AF16x | Quality + AF16x + AA4x | ||
AMD Athlon 64 3200+ @ 2500 MHz | Intel Pentium 4 3.2 GHz @ 4000 MHz | AMD Athlon 64 3200+ @ 2500 MHz | Intel Pentium 4 3.2 GHz @ 4000 MHz | ||
3DMark 2003 | 1024x768 | 64.9% | 65.8% | 71.3% | 73.4% |
3Dmark 2005 | 85.1% | 73.1% | 85.2% | 73.9% | |
Aquamark 3 | 21.2% | 23.2% | 33.0% | 32.9% | |
Far Cry | 1024x768 | 6.1% | 6.2% | 24.0% | 21.1% |
1280x1024 | 31.0% | 28.7% | 54.4% | 50.8% | |
DOOM 3 | 1024x768 | 11.9% | 4.6% | 56.1% | 47.6% |
1280x1024 | 36.4% | 27.5% | 59.9% | 69.4% | |
Half-life 2 | 1024x768 | 7.4% | 1.5% | 25.0% | 19.9% |
1280x1024 | 37.6% | 32.9% | 49.2% | 46.1% | |
The Chronicles of Riddick: EFBB | 1024x768 | 71.7% | 63.2% | 82.4% | 82.1% |
1280x1024 | 80.3% | 80.5% | 85.5% | 85.6% | |
Average % (games only) | 1024x768 | 24.3% | 18.9% | 46.8% | 42.7% |
1280x1024 | 46.3% | 42.4% | 62.3% | 63.0% |
В большинстве случаев платформа на базе процессора AMD Athlon 64 работает с режимом SLI эффективнее своего конкурента. Нельзя сказать, что разница критична, но уж то, что заметна – это точно. Добавлю еще раз – здесь необходимо учитывать, что в контексте данного тестирования платформа AMD оказалась немного медленнее, чем Intel ("лакмусовой бумажкой" являются результаты разогнанного Radeon X850XT). Тем не менее, это не помешало ей обойти грозного соперника в приросте производительности от перехода к использованию связки из двух GeForce 6800. Думаю, что при равной производительности платформ преимущество AMD должно еще немного вырасти.
В заключение нельзя не сказать о том, что на сегодня производительность режима SLI в большей степени зависит от корректности работы драйверов NVIDIA, которые, как при использовании метода рендеринга AFR так и SFR, оставляют желать лучшего. С другой стороны – когда есть что оптимизировать и улучшать на программном уровне, это интереснее и дешевле чем менять что-то аппаратно :). Судя по появляющейся в последнее время чуть ли не каждый день в новостной ленте информации о технологии компании ATI Multi-Rendering, являющейся конкурентом режима SLI от NVIDIA, тонкостей и "подводных камней" в ней будет не меньше...
Ваши замечания и предложения по сегодняшней статье предлагаю обсудить в соответствующей ветке конференции.
Сергей Лепилов aka Jordan
реклама
Лента материалов раздела
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Сейчас обсуждают