Intel Core i5 3550 BOX

3.3GHz, LGA 1155
цена 6'850 руб.
 
Intel Core i5 3570K OEM

3.4GHz, LGA 1155
цена 6'990 руб.
 
Intel Core i5 3450 BOX

3.1GHz, LGA 1155
цена 6'540 руб.
 
Intel Core i5 3450

3.1GHz, LGA 1155
цена 5'760 руб.

Сайт работает на сервере спонсора. Хостинг - Наука-Связь

Конференция
Персональные страницы
Статистика разгона CPU (+3 за неделю, всего: 25942) RSS
 
Zotac GeForce GTX 580 AMP

DVI x2, mini HDMI
цена 12'870 руб.
 
MSI GeForce GTX 670 OC

цена 15'590 руб.
 
KFA2 GeForce GTX 670
EX OC

цена 15'610 руб.
 
27" Samsung S27A850D

S-PLS, LED, 2xDVI, DisplayPort
цена 26'560 руб.









Объявления компаний (реклама) и анонсы + ещё

Вы можете отметить интересные вам фрагменты текста,
которые будут доступны по уникальной ссылке в адресной строке браузера.

Sамая Lучшая Iнтеграция: сравнение прироста скорости от режима SLI на платформах AMD и Intel

Jordan 11.05.2005 02:48 ссылка на материал | версия для печати | архив

Введение

Выпустив очень удачный чипсет для процессоров AMD – nForce4 SLI, и завоевав уже около 50% рынка наборов логики под данную платформу, компания NVIDIA решила не останавливаться на достигнутом и в начале апреля анонсировала чипсет nForce4 SLI (Intel Edition), предназначенный для процессоров Intel. В отличие от своего предшественника nForce4 SLI (Intel Edition) построен по классической двухчиповой схеме. Так как, режим SLI в nForce4 SLI (Intel Edition) реализуется так же, как и в AMD Athlon 64 системах – путём использования двух шин PCI Express x8, то почему бы не сравнить эффективность их работы с разными процессорами и типами оперативной памяти (DDR и DDR2)? Где прирост производительности от активации SLI будет выше? На платформе с процессором AMD Athlon 64, имеющим встроенный контроллер памяти и использующим только DDR память, или в системах на базе процессоров Intel Pentium 4 с поддержкой оперативной памяти DDR2 вплоть до DDR2-667 SDRAM? Вот это мы с Вами сегодня и попробуем выяснить.

Тестовая конфигурация, драйверы и методика тестирования

Все тесты были проведены на следующих платформах:

Комплектующие Платформа на базе AMD Athlon 64 Платформа на базе Intel Pentium 4
Материнская плата: MSI K8N Diamond (NVIDIA nForce4 SLI), Socket 939, BIOS v.1.1 MSI P4N Diamond (NVIDIA nForce4 SLI IE), LGA775, BIOS v.1.0
Процессор: AMD Athlon 64 3200+, 2000MHz, 512Kb (Winchester, D0) Intel Pentium 4 540 3200MHz, 1024Kb, (Prescott, E0)
Кулер: PENTAGRAM FREEZONE QVC-120 Cu+
Термопаста: Thermaltake Thermal Grease #2 (Arctic Silver 5)
Оперативная память: 2 x 512Mb DDR PC3200 2 x 512Mb DDR2 PC4300
Patriot XBLK Corsair CM2X512A
200(400)MHz, 2-2-2-5  266(533)MHz, 3-2-3-3
Видеокарты: 2 х MSI GeForce NX6800-TD256E 256Mb (MS-8984)
MSI Radeon RX850XT-VT2D256E 256Mb (MS-8990)
Дисковая подсистема: 160Gb IDE Seagate Barracuda 7200.7 (3160023A) 7200RPM 8Mb
Привод: DVD±R/RW & CD-RW NEC ND-3520A firmware v.1.05
Корпус системного блока: INWIN-S508 + блок питания 420W (Thermaltake-W0009) + два корпусных 80-мм кулера Zalman (~1400RPM, 7v.)

Учитывая, что процессоры относительно слабы для тестирования скорости двух GeForce 6800 в режиме SLI, оба CPU были разогнаны: максимум для AMD Athlon 64 3200+ степпинга D0 составил 2500MHz при напряжении 1.55v.:

Intel Pentium 4 смог стабильно работать на 4000MHz при напряжении 1.5385v.:

Оперативная память DDR PC3200 Patriot XBLK при разгоне AMD Athlon 64 работала на 209 (418) MHz с таймингами 2-2-2-5-1T. Как показало предварительное тестирование, такой режим оказался быстрее, чем на 250 (500) MHz с таймингами 2.5-3-3-5-2T (а более низкие тайминги на этой частоте память уже "не тянула"). На платформе с процессором Intel Pentium 4 частота работы оперативной памяти DDR 2 была зафиксирована на стандартной для неё отметке 266 (533) MHz, при этом тайминги её работы удалось понизить до 3-2-3-3, что явно нетипично для данного типа памяти и заметно прибавляет в скорости системы в целом.

Видеокарты GeForce 6800 были разогнаны до 425/855MHz как при работе в режиме SLI, так и при одиночном режиме тестирования.

Все тесты были проведены в операционной системе Windows XP Home Edition SP2, установленной на первый раздел жесткого диска размером 5Gb. В свою очередь, бенчмарки и игры были установлены на второй раздел винчестера размером в 30Gb. Чтобы минимизировать влияние на итоговые результаты прочих программных факторов, во время проведения тестов все лишние сервисы, за исключением 4-х, необходимых для нормального функционирования операционной системы, были отключены. Никаких дополнительных программ также не устанавливалось ("чистый трэй"). Система настроена на максимальное быстродействие.

Тесты выполнялись с использованием системных драйверов Intel Chipset Software Installation Utility версии 6.3.0.1008 и библиотек DirectX 9.0с. Что же касается драйверов для видеокарт GeForce 6800, то, помня неработоспособность драйверов версии 76.10 в режиме SLI в игре The Chronicles Of Riddick: Escape From Butcher Bay, специально для проведения тестирования были скачаны еще две относительно свежих версии драйверов Force Ware 72.01 и 76.50. Приятно, что в обеих версиях режим SLI в игре The Chronicles Of Riddick: Escape From Butcher Bay оказался работоспособен и, главное, заметно прибавлял в скорости в сравнении с одной GeForce 6800, но при проведении тестов на версии Force Ware 76.50 вновь приходилось прибегать к помощи последней версии программы RivaTuner и принудительно использовать библиотеки OpenGL версии 1.3. Кроме того, результаты тестов на драйверах версии 72.01 в данной игре оказались несколько выше, чем показатели FPS на 76.50. Учитывая, что во всех остальных играх и синтетических бенчмарках 76.50 показывает более высокую производительность, было решено использовать именно данную версию, но The Chronicles Of Riddick: Escape From Butcher Bay все же тестировался на Force Ware 72.01. Надеюсь, что Вы отнесетесь снисходительно к таким "выкрутасам" с драйверами при тестировании. Хочется всегда выжать максимум из тестовой системы.

Как показали предыдущие тесты режима SLI в играх, использование анизотропной фильтрации не влечет за собой заметное снижение производительности, поэтому от тестов просто в чистом режиме "Quality" было решено отказаться. В результате тестирование было проведено в 32bit-ном цвете в двух разрешениях: 1024х768 и 1280x1024, и при двух режимах настроек драйверов:

  1. Режим "Quality+AF16x" – настройки драйвера на "Quality", VSync Off, AF16x, AA Off;
  2. Режим "Quality+AF16x+AA4x" – настройки драйвера на "Quality", VSync Off, AF16x, AA4х.

Оптимизации трехлинейной и анизотропной фильтрации в драйверах NVIDIA во время тестирования были активированы.

Выбор метода рендеринга режима SLI: AFR или SFR?

Одной из особенностей режима SLI является возможность выбора пользователем в панели управления драйверов Force Ware метода рендеринга: AFR (alternate-frame rendering, или "рендеринг с чередованием кадра"), либо SFR (split-frame rendering, или "рендеринг с разделением кадра"):

В случае выбора пользователем режима AFR, подготовленные попеременно видеокартами кадры выдаются на экран непрерывно, при интенсивном использовании кадрового буфера. В сравнении с режимом SFR, alternate-frame rendering обеспечивает более высокий прирост производительности в большинстве бенчмарков и игр. Тем не менее, для полного раскрытия потенциала данного режима необходимо выполнение, как минимум, двух условий: наличие мощного центрального процессора и, так сказать, отточенность драйверов (здесь также нельзя упомянуть про специфику игровых приложений и бенчмарков, проще говоря, поддержку ими режима SLI). Если соблюдение первого условия для владельцев двух видеокарт уровня 6800 и выше, а также материнской платы стоимостью под 200$ (а то и более) не должно являться существенной проблемой, то вот с драйверами вопрос до сих пор до конца не решен. Но об этом подробнее я скажу чуть ниже.

Режим SFR формирует картинку, разделяя сцену, выводимую на монитор, на две части, процентное соотношение которых меняется динамически. Так, например, в один момент времени верхние 40% экрана может рендериться первой видеокартой, а 60% - второй. В следующую секунду ситуация меняется и процентное соотношение уже 39% на 61%, например. "Благодаря" багам в драйверах Force Ware как версии 72.01, так и 76.50 в Far Cry и The Chronicles of Riddick: EFBB (здесь только на 72.01) на неразогнанном процессоре AMD Athlon 64 3200+ (2000MHz) при использовании режима SFR можно было наблюдать плавающую горизонтальную полосу, которая и являлась границей совместного рендеринга двух GeForce 6800 в режиме SLI. При разгоне процессора до 2500MHz подобных дефектов изображения не наблюдалось. Странно, что это происходило именно в режиме SFR, который теоретически должен быть менее процессорозависим, чем режим AFR.

Посмотрим, какой же режим окажется наиболее быстрым и наименее процессорозависимым:

GeForce 6800 SLI (425/855MHz) & AMD Athlon 64 3200+ (2000MHz)
Benchmark’s & Games Resolution Quality + AF16x Quality + AF16x + AA4x
AFR SFR AFR SFR
3DMark 2003 1024x768 15 416 15 392 11 214 11 205
3DMark 2005 7 776 7 918 - 8 156
Aquamark 3 68.0 68.0 66.9 67.1
Far Cry 1024x768 78.9 78.1 78.5 77.5
1280x1024 77.7 77.2 75.3 75.2
DOOM 3 1024x768 87.7 96.0 88.3 88.3
1280x1024 80.6 92.2 57.6 57.3
Half-life 2 1024x768 100.0 106.6 102.9 103.0
1280x1024 100.3 100.2 88.8 88.6
The Chronicles of Riddick: EFBB 1024x768 134.9 58.5 80.0 30.3
1280x1024 100.6 46.8 52.7 21.3
* – полужирным шрифтом отмечены лучшие результаты.

Если производительность двух видеокарт в режиме SLI ограничивается скоростью центрального процессора, то без активации полноэкранного сглаживания режим SFR оказывается быстрее в обоих разрешениях в DOOM 3, в разрешении 1024x768 в Half-life 2 и в 3DMark 2005. Что же касается провала скорости данного режима в игре The Chronicles of Riddick: EFBB, то можно было бы возложить вину на движок игры или некорректность работы драйверов Force Ware, если бы не результаты режима SFR после разгона процессора... В остальных играх и бенчмарках наблюдается примерный паритет.

При активации полноэкранного сглаживания, за исключением опять же The Chronicles of Riddick: EFBB, результаты выровнялись еще больше. Но проблемой здесь стал стабильный вылет 3DMark 2005 при тестировании в режиме AFR. В итоге мне так и не удалось получить в данном бенчмарке результат при AA4x, причем как на драйверах версии 72.01, так и версии 76.50.

Теперь оценим, насколько изменятся результаты тестирования после разгона процессора на 25%.

GeForce 6800 SLI (425/855MHz) & AMD Athlon 64 3200+ @2500MHz
Benchmark’s & Games Resolution Quality + AF16x Quality + AF16x + AA4x
AFR SFR AFR SFR
3DMark 2003 1024x768 15 890 15 900 11 488 11 484
3DMark 2005 8 545 8 508 8 472 8 484
Aquamark 3 79 78.9 76.9 76.9
Far Cry 1024x768 80.4 80.4 80.3 80
1280x1024 79.5 80.1 72.2 72.3
DOOM 3 1024x768 113.3 113.4 96.5 96.4
1280x1024 105.5 107.2 61.2 61.2
Half-life 2 1024x768 100.3 110.2 103.5 103.9
1280x1024 96.9 97.2 81.6 81.9
The Chronicles of Riddick: EFBB 1024x768 127.7 127.6 72.4 72.4
1280x1024 91.6 91.5 48 48
* – полужирным шрифтом отмечены лучшие результаты.

Очень незначительное, но все же преимущество рендеринга с разделением кадра (SFR). При этом обратите внимание, что результаты The Chronicles of Riddick: EFBB режимов AFR и SFR выровнялись. Я специально проверил логи тестов, не перепутаны ли в таблицах колонки AFR и SFR, но оказалось все правильно.

Теперь несколько слов о рендеринге с чередованием кадра (AFR). Пришлось отказаться от выбора данного режима работы SLI в дальнейших тестах в силу его большей глючности по сравнению с SFR. При использовании AFR картинка частенько просто рвется, в играх нередко наблюдаются рывки и артефакты. Не замечено дефектов изображения только в 3DMark 2003, в Unreal Tournament 2004 и Splinter Cell (результаты тестов последних двух не привожу, вследствие их очень высокой процессорозависимости). Кроме того, оба режима были проверены в играх Ил-2 Штурмовик: Пёрл Харбор и Brothers in Arms. В итоге при проведении дальнейших тестов было решено остановиться на использовании рендеринга с разделением кадра (SFR), как наиболее стабильном и не уступающем в скорости конкуренту в лице AFR. Остается надеяться, что более перспективный AFR-режим в скором времени все же получит "допинг" в виде новых исправленных и быстрых драйверов Force Ware.

Прирост производительности режима SLI платформ на базе AMD и Intel

Заранее необходимо сказать, что задачи сравнить производительность процессоров AMD и Intel в контексте данного тестирования не стоит, говориться в статье об этом не будет и обсуждению в соответствующей ветке конференции так же не подлежит. Главное в сегодняшнем тестировании – оценить, на какой платформе режим SLI работает эффективнее и где прирост производительности от перехода к использованию связки из двух разогнанных GeForce 6800 выше. В тестах вне конкурса также принимает участие уже знакомый Вам ранее MSI Radeon X850XT разогнанный до 555/1250MHz (GPU/memory) с использованием драйверов Catalyst 5.4 и всеми активированными оптимизациями в них.

Дабы не загружать Вас лишними диаграммами и, учитывая, что разрешение 1280 x1024 является наиболее показательным и менее зависимым от скорости центрального процессора, ниже будут приведены только диаграммы с результатами тестирования в играх в разрешении 1280x1024. Тем не менее, линки на диаграммы в разрешении 1024x768 я буду приводить в каждом разделе тестов. Так как оба 3DMark-а и Aquamark 3 тестировались только в разрешении 1024x768, то результаты в данных синтетических и полусинтетических бенчмарках будут приведены именно в этом разрешении.

3DMark 2003

При тестировании был использован последний build 3.6.0 бенчмарка. Тесты в данном синтетическом пакете были проведены только в одном разрешении – 1024x768, при активированной анизотропной фильтрации уровня 16x и затем, в дополнение к ней, еще и полноэкранного сглаживания уровня 4x. Посмотрим, что получилось:

Как в режиме с активированным полноэкранным сглаживанием, так и без него небольшое преимущество в приросте производительности от перехода к режиму SLI находится на стороне платформы Intel (0.9%-2.1%).

3DMark 2005

Так же как и в предыдущем случае 3DMark был пропатчен до последней на момент написания статьи версии 1.2.0. Одно разрешение – 1024x768 и аналогичные 3DMark 2003 режимы качества графики:

В 3DMark 2005 мы уже можем наблюдать иную картину: SLI работает эффективнее на платформе на базе процессора AMD Athlon 64, причем преимущество в обоих режимах качества графики составляет здесь уже около 12%.

Aquamark 3

В Aquamark 3 сохраняется паритет, очевидного преимущества нет ни у одной платформы.

Переходим к результатам тестирования в играх и их анализу в разрешении 1280x1024.

Far Cry

В качестве тестовой демки была выбрана демо-запись "Training" уровня с одноименным названием от Ubisoft. Версия игры – 1.31 (build 1337), максимальная детализация, два последовательных прогона бенчмарка. Технологии "Geometry Instancing" и сжатия карт нормалей ("Normal-maps compression") во время тестирования были активированы.

Far Cry v.1.31 1024x768
Quality + AF16x Quality + AF16x + AA4x

Как и в 3DMark 2005, в Far Cry режим SLI чуть больше благосклонен к платформе AMD. Прирост производительности от перехода к совместной работе двух видеокарт при использовании анизотропной фильтрации уровня 16x на платформе с процессором AMD Athlon 64 превышает на 2.3% прирост производительности на платформе с процессором Intel. При активации полноэкранного сглаживания этот разрыв увеличивается до 3.6%. Здесь необходимо учесть, что в абсолютных показателях система с процессором Intel Pentium 4 и DDR2 оперативной памятью показывает более высокую производительность. Можно предположить, что при равной производительности платформ преимущество в приросте производительности от перехода к режиму SLI еще несколько вырастет в пользу AMD.

DOOM 3

Для тестов использовалось стандартное демо "demo1" при детализации графики в самой игре – "Ultra Quality" и, также как и в Far Cry, двойном прогоне демо-записи.

DOOM 3 1024x768
Quality + AF16x Quality + AF16x + AA4x

Довольно интересные результаты можно наблюдать в DOOM 3. Когда полноэкранное сглаживание не используется, SLI эффективнее работает на платформе с процессором AMD: +28.4FPS (+36.4%) против +21.8FPS (+27.5%) на Intel Pentium 4 (сказывается всем известное преимущество в скорости в играх процессора AMD). Но стоит только включить AA4x, увеличив тем самым нагрузку на графическую подсистему, как впереди уже оказывается Intel: +29.9FPS (+69.4%) против +23.6FPS (+59.9%) на AMD – разрыв достигает 10%.

Half-life 2

Все тесты проводились на демо-записи d1_town_01 и при максимальных настройках графики в самой игре.

Half-life 2 1024x768
Quality + AF16x Quality + AF16x + AA4x

В Half-life 2 небольшое преимущество в обоих режимах качества графики на стороне платформы на базе процессора AMD Athlon 64. Вновь в данной игре отлично смотрится Radeon X850XT.

The Chronicles of Riddick: EFBB

Максимальная детализация, Shader 2.0, demo_ducche.

The Chronicles of Riddick: EFBB 1024x768
Quality + AF16x Quality + AF16x + AA4x

В The Chronicles of Riddick: EFBB прирост производительности на обеих платформах одинаков, разница находится в пределах погрешности.

Подведем итоги.

Заключение

Посмотрим на результаты прироста производительности при переходе к режиму SLI всех бенчмарков и игр в двух разрешениях и двух режимах качества графики на платформах на базе процессоров AMD Athlon 64 и Intel Pentium 4 в одной таблице*:

Benchmark’s & Games Resolution Quality + AF16x Quality + AF16x + AA4x
AMD Athlon 64 3200+ @ 2500 MHz Intel Pentium 4 3.2 GHz @ 4000 MHz AMD Athlon 64 3200+ @ 2500 MHz Intel Pentium 4 3.2 GHz @ 4000 MHz
3DMark 2003 1024x768 64.9% 65.8% 71.3% 73.4%
3Dmark 2005 85.1% 73.1% 85.2% 73.9%
Aquamark 3 21.2% 23.2% 33.0% 32.9%
Far Cry 1024x768 6.1% 6.2% 24.0% 21.1%
1280x1024 31.0% 28.7% 54.4% 50.8%
DOOM 3 1024x768 11.9% 4.6% 56.1% 47.6%
1280x1024 36.4% 27.5% 59.9% 69.4%
Half-life 2 1024x768 7.4% 1.5% 25.0% 19.9%
1280x1024 37.6% 32.9% 49.2% 46.1%
The Chronicles of Riddick: EFBB 1024x768 71.7% 63.2% 82.4% 82.1%
1280x1024 80.3% 80.5% 85.5% 85.6%
Average % (games only) 1024x768 24.3% 18.9% 46.8% 42.7%
1280x1024 46.3% 42.4% 62.3% 63.0%
* – полужирным шрифтом отмечены лучшие результаты.

В большинстве случаев платформа на базе процессора AMD Athlon 64 работает с режимом SLI эффективнее своего конкурента. Нельзя сказать, что разница критична, но уж то, что заметна – это точно. Добавлю еще раз – здесь необходимо учитывать, что в контексте данного тестирования платформа AMD оказалась немного медленнее, чем Intel ("лакмусовой бумажкой" являются результаты разогнанного Radeon X850XT). Тем не менее, это не помешало ей обойти грозного соперника в приросте производительности от перехода к использованию связки из двух GeForce 6800. Думаю, что при равной производительности платформ преимущество AMD должно еще немного вырасти.

В заключение нельзя не сказать о том, что на сегодня производительность режима SLI в большей степени зависит от корректности работы драйверов NVIDIA, которые, как при использовании метода рендеринга AFR так и SFR, оставляют желать лучшего. С другой стороны – когда есть что оптимизировать и улучшать на программном уровне, это интереснее и дешевле чем менять что-то аппаратно :). Судя по появляющейся в последнее время чуть ли не каждый день в новостной ленте информации о технологии компании ATI Multi-Rendering, являющейся конкурентом режима SLI от NVIDIA, тонкостей и "подводных камней" в ней будет не меньше...

Ваши замечания и предложения по сегодняшней статье предлагаю обсудить в соответствующей ветке конференции.

Сергей Лепилов aka Jordan

Оцените материал →

PowerColor
RadeOn HD 7970
DVI HDMI HDCP
2 x mini DisplayPort

цена 17'429 руб.

MSI GTX 580
2xDVI HDMI HDCP

цена 15'853 руб.

Edifier S550
280 Вт

цена 16'492 руб.

Apple iPad 2
WiFi + 3G 64Gb

цена 29'941 руб.

MSI
RadeOn HD 7970
DVI HDMI HDCP
2 x mini DisplayPort

цена 16'818 руб.

Sapphire
RadeOn HD 7970
DVI HDMI HDCP
2 x mini DisplayPort

цена 17'470 руб.

HP Quadro 6000
6Gb 3000MHz
DVI, 2x DisplayPort

цена 166'228 руб.