NVIDIA PhysX от А до Я
Оглавление
- Введение
- Тестовая конфигурация
- Инструментарий и методика тестирования
- Глава 1. Одиночные видеокарты GeForce
- Глава 2. Видеокарты GeForce в паре с GeForce GTX 480
- Глава 3. Видеокарты GeForce в паре с Radeon HD 6970
- Глава 4. Влияние PCI-Express на производительность видеокарты
- Глава 5. Видеокарты в SLI тандеме и не только
- Глава 6. Производительность процессоров
- Выводы
Введение
На подготовку данного проекта и реализацию задуманного ушло больше года. В рамках материала я постарался рассмотреть насущные вопросы, а именно:
- 1. Одиночные видеокарты GeForce
- 2. Видеокарты GeForce в паре с GeForce GTX 480
- 3. Видеокарты GeForce в паре с Radeon HD 6970
- 4. Влияние PCI-Express на производительность видеокарты
- 5. Видеокарты в SLI тандеме и не только
- 6. Производительность процессоров
Сам обзор построен таким образом, что все упомянутые вопросы рассмотрены в отдельных главах. По идее, статью можно было разбить на несколько частей, но я специально реализовал ее именно так, чтобы наши читатели могли почерпнуть нужную им информацию из одного источника.
Тестовые конфигурации
Так получилось, что тесты героев обзора в приложениях, поддерживающих NVIDIA PhysX, совпали по времени с тестами для материала по исследованию данной технологии. Поэтому в обзоре было применено два стенда: первый для тестов "классических" игр и второй для NVIDIA PhysX.
Стенд №1:
- Процессор: Phenom II X6 1090T ВЕ (Thuban, L3 6 Мб), 1.34 В, Turbo Core - off - 3200 @ 4100 МГц (1.5 В)
- Материнская плата: GigaByte GA-890FXA-UD7, BIOS F4
Стенд №2:
- Процессор: Intel Core i5 760 (Lynnfield, L3 8 Мб), 1.11 В, Turbo Boost - off - 2800 @ 4000 МГц (1.38 В)
- Материнская плата: ASRock P55 Extreme, BIOS v2.70
Остальные компоненты:
- Оперативная память: 2 x 2048 Мбайт DDR3 Corsair (Spec: 1600 МГц / 8-8-8-20-1t / 1.65 В)
- Система охлаждения CPU: Cooler Master V8 (~1100 об/мин)
- Дисковая подсистема: SATA-II 500 Гбайт, WD 5000KS, 7200 об/мин, 16 Мбайт
- Блок питания: Thermaltake Toughpower 1200 Ватт (штатный вентилятор: 140-мм на вдув)
- Корпус: открытый тестовый стенд
- Монитор: 30" DELL 3008WFP (Wide LCD, 2560x1600 / 60 Гц)
Видеокарты:
- GeForce GTX 570 1280 Mбайт - 732/732/3800 МГц (Zotac)
- GeForce GTX 560 Ti 1024 Мбайт - 822/1644/4008 МГц (MSI)
- GeForce GTX 550 Ti 1024 Мбайт - 900/1800/4100 МГц (Innovision)
- GeForce GTX 480 1536 Mбайт - 700/1400/3696 МГц (Gainward)
- GeForce GTX 470 1280 Mбайт - 608/1215/3348 МГц (Palit) x 2 шт.
- GeForce GTX 465 1024 Mбайт - 608/1215/3208 МГц (MSI)
- GeForce GTX 460 1024 Мбайт - 675/1350/3600 МГц (Innovision)
- GeForce GTX 460 SE 1024 Мбайт - 650/1300/3400 МГц (Gainward)
- GeForce GTX 460 768 Мбайт - 675/1350/3600 МГц (Gainward)
- GeForce GTS 450 1024 Мбайт - 550/1340/3400 МГц (Gainward)
- GeForce GTX 285 1024 Mбайт - 648/1476/2480 МГц (GigaByte)
- GeForce GTX 275 896 Mбайт - 633/1402/2320 МГц (MSI)
- GeForce GTX 260 896 Mбайт - 576/1242/2000 МГц (ASUS)
- GeForce GTS 250 1024 Mбайт - 738/1836/2200 МГц (XFX)
- GeForce 9800 GT 512 Mбайт - 600/1500/1800 МГц (Zotac)
- GeForce 9600 GT 512 Mбайт - 650/1625/1800 МГц (Zotac)
- GeForce GT 240 512 Mбайт - 650/1625/1800 МГц (Innovizion)
- Radeon HD 6970 2048 Мбайт - 880/880/5500 МГц (GigaByte)
Программное обеспечение:
- Операционная система: Windows 7 x64 SP1
- Драйверы видеокарты: GeForce 270.61 WHQL и Catalyst 11.5 WHQL
- PhysX-mod-1.04ff
Инструментарий и методика тестирования
Для более наглядного сравнения систем все игры, используемые в качестве тестовых приложений, запускались в разрешениях 1024х768, 1280х1024 и 1920х1080.
В следующих играх использовались средства измерения быстродействия - встроенные бенчмарки, утилиты FRAPS v3.2.1 build 11425 и AutoHotkey v1.0.48.05:
- Batman Arkham Asylum (Бенчмарк)
- Cryostasis (Техническое демо)
- Dark Void (Бенчмарк)
- Darkest of Days (Бенчмарк)
- FluidMark
- Mafia 2 (Бенчмарк)
- Metro 2033 (Бенчмарк)
- Mirror's Edge (FlybyFlight бенчмарк)
- Nurien
- Particle Fluid
- Sacred 2 Ice & Blood (Тилизий)
- Warmonger (Первый уровень)
Во всех приложениях замерялись минимальные и средние значения FPS.
В тестах, в которых отсутствовала возможность замера минимального FPS, это значение измерялось утилитой FRAPS.
VSync при проведении тестов был отключен.
Чтобы избежать ошибок и минимизировать погрешности измерений, все тесты производились по три - пять раз. При вычислении среднего FPS за итоговый результат бралось среднеарифметическое значение результатов всех прогонов (трех не "холостых"). В качестве минимального FPS выбиралось минимальное значение показателя по результатам трех прогонов.
Настройки в играх
FluidMark
- Версия 1.2.2
Particle Fluid
- Версия 1.0
Nurien
- Версия 1.0
Batman Arkham Asylum (Бенчмарк)
- Версия 1.1
- DirectX 9
- полноэкранное сглаживание (AA) 4
- детализация - очень высокая
- свечение - вкл.
- динамические тени - вкл.
- эффект размытия движения - вкл.
- искажения - вкл.
- объемный туман - вкл.
- освещение техникой сферических гармоник - вкл.
- освещение отраженным светом - вкл.
Cryostasis (Техническое демо)
- Версия 1.0
- DirectX 10
- анизотропная фильтрация (AF) 16
- качество текстур - высокое
- карта нормалей - высокая
- карта зеркал - высокая
- тени - высокие
- размытие движений - вкл.
- размытие движений в камере - вкл.
- эффекты воды - вкл.
Dark Void (Бенчмарк)
- Версия 1.0
- DirectX 9
- качество текстур - высокое
- качество моделей - высокое
- отличительные знаки - вкл.
- динамические тени - вкл.
Darkest of Days (Бенчмарк)
- Версия 1.03
- DirectX 9
- полноэкранное сглаживание (AA) 4
- анизотропная фильтрация (AF) 16
- детализация графики - очень высокая
- имитация глобального освещения - вкл.
Mafia 2 (Бенчмарк)
- Версия Update 3
- DirectX 9
- полноэкранное сглаживание (AA) - вкл.
- анизотропная фильтрация (AF) 16
- уровень качества теней - высокий
- размытие окружения - вкл.
- уровень детализации геометрии - высокий
- APEX PhysX - вкл.
Metro 2033 (Бенчмарк)
- Версия 1.2
- DirectX 10
- полноэкранное сглаживание (АА) AAA
- анизотропная фильтрация (AF) 16
- качество - очень высокое
- тесселяция - вкл.
- DOF - выкл.
- NVIDIA Advanced PhysX - вкл.
- размытие движения - камера + объекты (DX10+)
- тени - рассеиваемые
- рельефное текстурирование - точное
- мягкие частицы - вкл.
- резолюция теней - 9.43 МПикс
- взаимодействия света с материалами - нормальное
- детализация геометрии - очень высокая
- детализация текстур - вкл.
- сложное затенение - предвычисление + SSAO
- отображение пост-процессинга - полное
- parallax mapping - вкл. с затенением
- фильтрация теней - очень высокая
- аналитическое полноэкранное сглаживание - вкл.
- объемные текстуры - полное качество, в том числе солнце
Mirror's Edge (FlybyFlight бенчмарк)
- Версия 1.1
- DirectX 9
- полноэкранное сглаживание (AA) 4
- детализация текстур - очень высокая
- качество изображения - очень высокая
Sacred 2 Ice & Blood (Тилизий)
- Версия 2.64.0
- DirectX 9
- полноэкранное сглаживание (AA) 4
- детализация теней - очень высокая
- детализация рендеринга - очень высокая
- детализация земли - очень высокая
- детализация эффектов - высокая
- детализация травы - очень высокая
- погода - вкл.
Warmonger (Первый уровень)
- Версия 1.0
- DirectX 9
- детализация текстур - очень высокая
- детализация мира - очень высокая
- детализация эффектов - очень высокая
- детализация теней - очень высокая
- детализация света - очень высокая
- качество пост-процессинга - высокое
Видеоролики тестовых участков с разными уровнями активации/деактивации NVIDIA PhysX
FluidMark
Particle Fluid
Nurien
Batman Arkham Asylum (Бенчмарк)
Cryostasis (Техническое демо)
Dark Void (Бенчмарк)
Darkest of Days (Бенчмарк)
Mafia 2 (Бенчмарк)
Metro 2033 (Бенчмарк)
Mirror's Edge (FlybyFlight бенчмарк)
Sacred 2 Ice & Blood (Тилизий)
Warmonger (Первый уровень)
Перейдем непосредственно к тестам.
Глава 5. Видеокарты в SLI тандеме и не только
В данной главе будут рассмотрены вопросы эффективности SLI тандема, при включении технологии NVIDIA PhysX. В ней рассматриваются:
- одиночная видеокарта;
- две видеокарты (когда одна обрабатывает изображение, а вторая физические эффекты);
- два GPU в SLI тандеме (когда в драйверах выбор графического ускорителя под PhysX выставлен по умолчанию);
- SLI тандем плюс видеокарта под расчет физических эффектов.
Тестовая конфигурация:
- Процессор: Intel Core i5 760 (Lynnfield, L3 8 Мб), 1.11 В, Turbo Boost - off - 2800 @ 4000 МГц (1.38 В)
- Материнская плата: ASRock P55 Extreme, BIOS v2.70
- Оперативная память: 2 x 2048 Мбайт DDR3 Corsair (Spec: 1600 МГц / 8-8-8-20-1t / 1.65 В)
- Система охлаждения CPU: Cooler Master V8 (~1100 об/мин)
- Дисковая подсистема: SATA-II 500 Гбайт, WD 5000KS, 7200 об/мин, 16 Мбайт
- Блок питания: Thermaltake Toughpower 1200 Ватт (штатный вентилятор: 140-мм на вдув)
- Корпус: открытый тестовый стенд
- Монитор: 30" DELL 3008WFP (Wide LCD, 2560x1600 / 60 Гц)
Видеокарта, обрабатывающая изображение:
- GeForce GTX 470 1280 Mбайт - 608/1215/3348 МГц (Palit) - 2 шт.
Видеокарты, обрабатывающая физические эффекты:
- GeForce GTX 470 1280 Mбайт - 608/1215/3348 МГц (Palit)
- GeForce GTX 460 1024 Мбайт - 675/1350/3600 МГц (Innovision)
FluidMark
Включите JavaScript, чтобы видеть графики
Наращивание количества видеокарт привело к приблизительно равномерному росту производительности во всех синтетических приложениях и демках.
Particle Fluid
Включите JavaScript, чтобы видеть графики
Nurien
Включите JavaScript, чтобы видеть графики
Batman Arkham Asylum (Бенчмарк)
1280х1024
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX Medium
Включите JavaScript, чтобы видеть графики
PhysX High
Включите JavaScript, чтобы видеть графики
1920х1080
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX Medium
Включите JavaScript, чтобы видеть графики
PhysX High
Включите JavaScript, чтобы видеть графики
В принципе, в игре Batman Arkham Asylum для обеспечения комфортной производительности оказалось достаточно и одной GeForce GTX 470. Две видеокарты GeForce GTX 470 в SLI тандеме немного опередили такую же связку, в которой второй GPU обрабатывал PhysX. Добавление в SLI дуэт видеокарт под "физику" заметно увеличило производительность, особенно в разрешении 1920х1080.
Cryostasis (Техническое демо)
1280х1024
Включите JavaScript, чтобы видеть графики
1920х1080
Включите JavaScript, чтобы видеть графики
Постепенное наращивание количества видеокарт в системе привело к значительному росту результатов, особенно в разрешении 1920х1080.
Dark Void (Бенчмарк)
1280х1024
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX Low
Включите JavaScript, чтобы видеть графики
1920х1080
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX Low
Включите JavaScript, чтобы видеть графики
В игре Dark Void при увеличении количества видеокарт в конфигурации наблюдается не такой заметный рост результатов, как в Cryostasis. Возможно, производительность графических ускорителей ограничил процессор.
Darkest of Days (Бенчмарк)
1280х1024
PhysX Low
Включите JavaScript, чтобы видеть графики
PhysX Medium
Включите JavaScript, чтобы видеть графики
PhysX High
Включите JavaScript, чтобы видеть графики
1920х1080
PhysX Low
Включите JavaScript, чтобы видеть графики
PhysX Medium
Включите JavaScript, чтобы видеть графики
PhysX High
Включите JavaScript, чтобы видеть графики
Единственной конфигурацией, обеспечившей комфортную производительность при high настройке NVIDIA PhysX в игре Darkest of Days, стала связка из SLI тандема GeForce GTX 470 и GeForce GTX 460 1024 Мбайт.
Mafia 2 (Бенчмарк)
1280х1024
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX Medium
Включите JavaScript, чтобы видеть графики
PhysX High
Включите JavaScript, чтобы видеть графики
1920х1080
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX Medium
Включите JavaScript, чтобы видеть графики
PhysX High
Включите JavaScript, чтобы видеть графики
Игра Mafia 2 оказалась не по зубам для всех участников тестов. Даже самое мощное трио GPU обеспечило только приемлемую производительность.
Metro 2033 (Бенчмарк)
1280х1024
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX On
Включите JavaScript, чтобы видеть графики
1920х1080
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX On
Включите JavaScript, чтобы видеть графики
В оставшихся играх все варианты без особых проблем обеспечили комфортную производительность.
Mirror's Edge (FlybyFlight бенчмарк)
1280х1024
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX On
Включите JavaScript, чтобы видеть графики
1920х1080
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX On
Включите JavaScript, чтобы видеть графики
Sacred 2 Ice & Blood (Тилизий)
1280х1024
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX On
Включите JavaScript, чтобы видеть графики
1920х1080
PhysX Off
Включите JavaScript, чтобы видеть графики
PhysX On
Включите JavaScript, чтобы видеть графики
Warmonger (Первый уровень)
1280х1024
Включите JavaScript, чтобы видеть графики
1920х1080
Включите JavaScript, чтобы видеть графики
Глава 6. Производительность процессоров
В этой главе рассматривается производительность процессоров Phenom II X6 1090T ВЕ и Core i5 760 при обработке физических эффектов в сравнении с видеокартой GeForce GTS 250.
Стенд №1:
- Процессор: Phenom II X6 1090T ВЕ (Thuban, L3 6 Мб), 1.34 В, Turbo Core - off - 3200 @ 4100 МГц (1.5 В)
- Материнская плата: GigaByte GA-890FXA-UD7, BIOS F4
Стенд №2:
- Процессор: Intel Core i5 760 (Lynnfield, L3 8 Мб), 1.11 В, Turbo Boost - off - 2800 @ 4000 МГц (1.38 В)
- Материнская плата: ASRock P55 Extreme, BIOS v2.70
Остальные компоненты:
- Видеокарта: GeForce GTS 250 1024 Mбайт - 738/1836/2200 МГц (XFX)
- Оперативная память: 2 x 2048 Мбайт DDR3 Corsair (Spec: 1600 МГц / 8-8-8-20-1t / 1.65 В)
- Система охлаждения CPU: Cooler Master V8 (~1100 об/мин)
- Дисковая подсистема: SATA-II 500 Гбайт, WD 5000KS, 7200 об/мин, 16 Мбайт
- Блок питания: Thermaltake Toughpower 1200 Ватт (штатный вентилятор: 140-мм на вдув)
- Корпус: открытый тестовый стенд
- Монитор: 30" DELL 3008WFP (Wide LCD, 2560x1600 / 60 Гц)
Для того, чтобы процессоры обрабатывали физические эффекты в панели управления драйверов GeForce/ION вручную был установлен пункт расчета PhysX на CPU.
Вполне ожидаемо видеокарта GeForce GTS 250 уверенно опередила процессоры в большинстве игр и приложений. В противостоянии Phenom II X6 1090T ВЕ и Core i5 760 была зафиксирована боевая ничья.
FluidMark
Включите JavaScript, чтобы видеть графики
Particle Fluid
Включите JavaScript, чтобы видеть графики
Nurien
Включите JavaScript, чтобы видеть графики
Batman Arkham Asylum (Бенчмарк)
1280х1024
PhysX Medium
Включите JavaScript, чтобы видеть графики
PhysX High
Включите JavaScript, чтобы видеть графики
Cryostasis (Техническое демо)
Включите JavaScript, чтобы видеть графики
Dark Void (Бенчмарк)
Включите JavaScript, чтобы видеть графики
Darkest of Days (Бенчмарк)
1280х1024
PhysX Medium
Включите JavaScript, чтобы видеть графики
PhysX High
Включите JavaScript, чтобы видеть графики
Mafia 2 (Бенчмарк)
1280х1024
PhysX Medium
Включите JavaScript, чтобы видеть графики
PhysX High
Включите JavaScript, чтобы видеть графики
Metro 2033 (Бенчмарк)
1280х1024
PhysX off
Включите JavaScript, чтобы видеть графики
PhysX on
Включите JavaScript, чтобы видеть графики
Mirror's Edge (FlybyFlight бенчмарк)
Включите JavaScript, чтобы видеть графики
Sacred 2 Ice & Blood (Тилизий)
Включите JavaScript, чтобы видеть графики
Warmonger (Первый уровень)
Включите JavaScript, чтобы видеть графики
Выводы
Глава 1. Одиночные видеокарты GeForce.
В таких играх, как Warmonger, Mirror's Edge и Dark Void несмотря на включенную технологию NVIDIA PhysX все участники тестирования продемонстрировали комфортную или близкую к ней производительность.
В играх Metro 2033 и Sacred 2 Ice & Blood активация NVIDIA PhysX незначительно снижала результаты видеокарт, хотя уровень производительности некоторых испытуемых был далек от комфортного. Но в данных проектах видеокарты были больше загружены обработкой графики, чем расчетами физических эффектов.
В игре Mafia 2 ни один GPU не смог достичь комфортного уровня производительности при medium и high настройках NVIDIA PhysX. Такая же ситуация наблюдалась и в игре Darkest of Days при high настройках NVIDIA PhysX.
В играх Batman Arkham Asylum и Cryostasis старшие графические ускорители без особых проблем показали комфортную производительность.
В большинстве игр и приложений разрыв в результатах между аутсайдерами и лидерами составил около 40% - 130%.
Глава 2. Видеокарты GeForce в паре с GeForce GTX 480.
В большинстве тестовых приложений для обеспечения комфортной производительности "под физику" достаточно младших видеокарт GeForce 9800 GT, GeForce 9600 GT, GeForce GT 240.
Исключением стали игры Darkest of Days и Mafia 2, в которых для обеспечения приемлемой и комфортной производительности потребовались графические ускорители выше среднего уровня.
Глава 3. Видеокарты GeForce в паре с Radeon HD 6970.
При работе связки Radeon HD 6970 в паре с видеокартами NVIDIA основные тенденции аналогичны таковым во второй главе.
Глава 4. Влияние PCI-Express на производительность видеокарты.
FluidMark оказался единственным приложением, в котором тип разъема PCI-Express существенно повлиял на производительность видеокарты, отвечающей за физические эффекты. Во всех остальных играх и приложениях переустановка графического ускорителя в разные слоты PCI-Express приводила либо к незначительному изменению результатов, либо ничего не меняла.
Глава 5. Видеокарты в SLI тандеме и не только.
SLI тандем из двух GeForce GTX 470 1280 Mбайт обеспечил комфортную производительность в большинстве игр и приложений. Исключением стала игра Mafia 2, в которой добавленная для обработки физических расчетов видеокарта GeForce GTX 460 1024 Мбайт смогла "вытянуть" результаты тандема только до приемлемых.
Глава 6. Производительность процессоров.
В противостоянии процессоров Phenom II X6 1090T ВЕ и Core i5 760 победителя выявлено не было, при этом они оба были заметно медленнее видеокарты GeForce GTS 250 в большинстве тестовых приложений.
