NVIDIA PhysX от А до Я

22 мая 2011, воскресенье 12:30



Оглавление



Введение

На подготовку данного проекта и реализацию задуманного ушло больше года. В рамках материала я постарался рассмотреть насущные вопросы, а именно:

  • 1. Одиночные видеокарты GeForce
  • 2. Видеокарты GeForce в паре с GeForce GTX 480
  • 3. Видеокарты GeForce в паре с Radeon HD 6970
  • 4. Влияние PCI-Express на производительность видеокарты
  • 5. Видеокарты в SLI тандеме и не только
  • 6. Производительность процессоров

Сам обзор построен таким образом, что все упомянутые вопросы рассмотрены в отдельных главах. По идее, статью можно было разбить на несколько частей, но я специально реализовал ее именно так, чтобы наши читатели могли почерпнуть нужную им информацию из одного источника.



Тестовые конфигурации

Так получилось, что тесты героев обзора в приложениях, поддерживающих NVIDIA PhysX, совпали по времени с тестами для материала по исследованию данной технологии. Поэтому в обзоре было применено два стенда: первый для тестов "классических" игр и второй для NVIDIA PhysX.

Стенд №1:

  • Процессор: Phenom II X6 1090T ВЕ (Thuban, L3 6 Мб), 1.34 В, Turbo Core - off - 3200 @ 4100 МГц (1.5 В)
  • Материнская плата: GigaByte GA-890FXA-UD7, BIOS F4

Стенд №2:

  • Процессор: Intel Core i5 760 (Lynnfield, L3 8 Мб), 1.11 В, Turbo Boost - off - 2800 @ 4000 МГц (1.38 В)
  • Материнская плата: ASRock P55 Extreme, BIOS v2.70

Остальные компоненты:

  • Оперативная память: 2 x 2048 Мбайт DDR3 Corsair (Spec: 1600 МГц / 8-8-8-20-1t / 1.65 В)
  • Система охлаждения CPU: Cooler Master V8 (~1100 об/мин)
  • Дисковая подсистема: SATA-II 500 Гбайт, WD 5000KS, 7200 об/мин, 16 Мбайт
  • Блок питания: Thermaltake Toughpower 1200 Ватт (штатный вентилятор: 140-мм на вдув)
  • Корпус: открытый тестовый стенд
  • Монитор: 30" DELL 3008WFP (Wide LCD, 2560x1600 / 60 Гц)

Видеокарты:

  • GeForce GTX 570 1280 Mбайт - 732/732/3800 МГц (Zotac)
  • GeForce GTX 560 Ti 1024 Мбайт - 822/1644/4008 МГц (MSI)
  • GeForce GTX 550 Ti 1024 Мбайт - 900/1800/4100 МГц (Innovision)

  • GeForce GTX 480 1536 Mбайт - 700/1400/3696 МГц (Gainward)
  • GeForce GTX 470 1280 Mбайт - 608/1215/3348 МГц (Palit) x 2 шт.
  • GeForce GTX 465 1024 Mбайт - 608/1215/3208 МГц (MSI)
  • GeForce GTX 460 1024 Мбайт - 675/1350/3600 МГц (Innovision)
  • GeForce GTX 460 SE 1024 Мбайт - 650/1300/3400 МГц (Gainward)
  • GeForce GTX 460 768 Мбайт - 675/1350/3600 МГц (Gainward)
  • GeForce GTS 450 1024 Мбайт - 550/1340/3400 МГц (Gainward)

  • GeForce GTX 285 1024 Mбайт - 648/1476/2480 МГц (GigaByte)
  • GeForce GTX 275 896 Mбайт - 633/1402/2320 МГц (MSI)
  • GeForce GTX 260 896 Mбайт - 576/1242/2000 МГц (ASUS)
  • GeForce GTS 250 1024 Mбайт - 738/1836/2200 МГц (XFX)

  • GeForce 9800 GT 512 Mбайт - 600/1500/1800 МГц (Zotac)
  • GeForce 9600 GT 512 Mбайт - 650/1625/1800 МГц (Zotac)
  • GeForce GT 240 512 Mбайт - 650/1625/1800 МГц (Innovizion)

  • Radeon HD 6970 2048 Мбайт - 880/880/5500 МГц (GigaByte)

Программное обеспечение:

  • Операционная система: Windows 7 x64 SP1
  • Драйверы видеокарты: GeForce 270.61 WHQL и Catalyst 11.5 WHQL
  • PhysX-mod-1.04ff



Инструментарий и методика тестирования

Для более наглядного сравнения систем все игры, используемые в качестве тестовых приложений, запускались в разрешениях 1024х768, 1280х1024 и 1920х1080.

В следующих играх использовались средства измерения быстродействия - встроенные бенчмарки, утилиты FRAPS v3.2.1 build 11425 и AutoHotkey v1.0.48.05:

  • Batman Arkham Asylum (Бенчмарк)
  • Cryostasis (Техническое демо)
  • Dark Void (Бенчмарк)
  • Darkest of Days (Бенчмарк)
  • FluidMark
  • Mafia 2 (Бенчмарк)
  • Metro 2033 (Бенчмарк)
  • Mirror's Edge (FlybyFlight бенчмарк)
  • Nurien
  • Particle Fluid
  • Sacred 2 Ice & Blood (Тилизий)
  • Warmonger (Первый уровень)

Во всех приложениях замерялись минимальные и средние значения FPS.

В тестах, в которых отсутствовала возможность замера минимального FPS, это значение измерялось утилитой FRAPS.

VSync при проведении тестов был отключен.

Чтобы избежать ошибок и минимизировать погрешности измерений, все тесты производились по три - пять раз. При вычислении среднего FPS за итоговый результат бралось среднеарифметическое значение результатов всех прогонов (трех не "холостых"). В качестве минимального FPS выбиралось минимальное значение показателя по результатам трех прогонов.



Настройки в играх


FluidMark

  • Версия 1.2.2

Particle Fluid

  • Версия 1.0

Nurien

  • Версия 1.0

Batman Arkham Asylum (Бенчмарк)

  • Версия 1.1
  • DirectX 9
    • полноэкранное сглаживание (AA) 4
    • детализация - очень высокая
    • свечение - вкл.
    • динамические тени - вкл.
    • эффект размытия движения - вкл.
    • искажения - вкл.
    • объемный туман - вкл.
    • освещение техникой сферических гармоник - вкл.
    • освещение отраженным светом - вкл.

Cryostasis (Техническое демо)

  • Версия 1.0
  • DirectX 10
    • анизотропная фильтрация (AF) 16
    • качество текстур - высокое
    • карта нормалей - высокая
    • карта зеркал - высокая
    • тени - высокие
    • размытие движений - вкл.
    • размытие движений в камере - вкл.
    • эффекты воды - вкл.

Dark Void (Бенчмарк)

  • Версия 1.0
  • DirectX 9
    • качество текстур - высокое
    • качество моделей - высокое
    • отличительные знаки - вкл.
    • динамические тени - вкл.

Darkest of Days (Бенчмарк)

  • Версия 1.03
  • DirectX 9
    • полноэкранное сглаживание (AA) 4
    • анизотропная фильтрация (AF) 16
    • детализация графики - очень высокая
    • имитация глобального освещения - вкл.

Mafia 2 (Бенчмарк)

  • Версия Update 3
  • DirectX 9
    • полноэкранное сглаживание (AA) - вкл.
    • анизотропная фильтрация (AF) 16
    • уровень качества теней - высокий
    • размытие окружения - вкл.
    • уровень детализации геометрии - высокий
    • APEX PhysX - вкл.

Metro 2033 (Бенчмарк)

  • Версия 1.2
  • DirectX 10
    • полноэкранное сглаживание (АА) AAA
    • анизотропная фильтрация (AF) 16
    • качество - очень высокое
    • тесселяция - вкл.
    • DOF - выкл.
    • NVIDIA Advanced PhysX - вкл.
    • размытие движения - камера + объекты (DX10+)
    • тени - рассеиваемые
    • рельефное текстурирование - точное
    • мягкие частицы - вкл.
    • резолюция теней - 9.43 МПикс
    • взаимодействия света с материалами - нормальное
    • детализация геометрии - очень высокая
    • детализация текстур - вкл.
    • сложное затенение - предвычисление + SSAO
    • отображение пост-процессинга - полное
    • parallax mapping - вкл. с затенением
    • фильтрация теней - очень высокая
    • аналитическое полноэкранное сглаживание - вкл.
    • объемные текстуры - полное качество, в том числе солнце

Mirror's Edge (FlybyFlight бенчмарк)

  • Версия 1.1
  • DirectX 9
    • полноэкранное сглаживание (AA) 4
    • детализация текстур - очень высокая
    • качество изображения - очень высокая

Sacred 2 Ice & Blood (Тилизий)

  • Версия 2.64.0
  • DirectX 9
    • полноэкранное сглаживание (AA) 4
    • детализация теней - очень высокая
    • детализация рендеринга - очень высокая
    • детализация земли - очень высокая
    • детализация эффектов - высокая
    • детализация травы - очень высокая
    • погода - вкл.

Warmonger (Первый уровень)

  • Версия 1.0
  • DirectX 9
    • детализация текстур - очень высокая
    • детализация мира - очень высокая
    • детализация эффектов - очень высокая
    • детализация теней - очень высокая
    • детализация света - очень высокая
    • качество пост-процессинга - высокое



Видеоролики тестовых участков с разными уровнями активации/деактивации NVIDIA PhysX


FluidMark



Particle Fluid



Nurien



Batman Arkham Asylum (Бенчмарк)

PhysX Off

PhysX Medium

PhysX High



Cryostasis (Техническое демо)



Dark Void (Бенчмарк)

PhysX Off

PhysX Low



Darkest of Days (Бенчмарк)

PhysX Low

PhysX Medium

PhysX High



Mafia 2 (Бенчмарк)

PhysX Off

PhysX Medium

PhysX High



Metro 2033 (Бенчмарк)

PhysX Off

PhysX On



Mirror's Edge (FlybyFlight бенчмарк)

PhysX Off

PhysX On



Sacred 2 Ice & Blood (Тилизий)

PhysX Off

PhysX On



Warmonger (Первый уровень)



Технические характеристики видеокарт

Перейдем непосредственно к тестам.



Глава 5. Видеокарты в SLI тандеме и не только

В данной главе будут рассмотрены вопросы эффективности SLI тандема, при включении технологии NVIDIA PhysX. В ней рассматриваются:

  • одиночная видеокарта;
  • две видеокарты (когда одна обрабатывает изображение, а вторая физические эффекты);
  • два GPU в SLI тандеме (когда в драйверах выбор графического ускорителя под PhysX выставлен по умолчанию);
  • SLI тандем плюс видеокарта под расчет физических эффектов.
На графиках ниже соответственно GeForce GTX 470, GeForce GTX 470 + GeForce GTX 470, SLI 2 x GeForce GTX 470, SLI 2 x GeForce GTX 470 + GeForce GTX 460 1024 Мбайт.

Тестовая конфигурация:

  • Процессор: Intel Core i5 760 (Lynnfield, L3 8 Мб), 1.11 В, Turbo Boost - off - 2800 @ 4000 МГц (1.38 В)
  • Материнская плата: ASRock P55 Extreme, BIOS v2.70
  • Оперативная память: 2 x 2048 Мбайт DDR3 Corsair (Spec: 1600 МГц / 8-8-8-20-1t / 1.65 В)
  • Система охлаждения CPU: Cooler Master V8 (~1100 об/мин)
  • Дисковая подсистема: SATA-II 500 Гбайт, WD 5000KS, 7200 об/мин, 16 Мбайт
  • Блок питания: Thermaltake Toughpower 1200 Ватт (штатный вентилятор: 140-мм на вдув)
  • Корпус: открытый тестовый стенд
  • Монитор: 30" DELL 3008WFP (Wide LCD, 2560x1600 / 60 Гц)

Видеокарта, обрабатывающая изображение:

  • GeForce GTX 470 1280 Mбайт - 608/1215/3348 МГц (Palit) - 2 шт.

Видеокарты, обрабатывающая физические эффекты:

  • GeForce GTX 470 1280 Mбайт - 608/1215/3348 МГц (Palit)
  • GeForce GTX 460 1024 Мбайт - 675/1350/3600 МГц (Innovision)



FluidMark


1920х1080

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS

Наращивание количества видеокарт привело к приблизительно равномерному росту производительности во всех синтетических приложениях и демках.



Particle Fluid


1024х768

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Nurien


1024х768

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Batman Arkham Asylum (Бенчмарк)



1280х1024


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX Medium

Включите JavaScript, чтобы видеть графики

PhysX High

Включите JavaScript, чтобы видеть графики

1920х1080


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX Medium

Включите JavaScript, чтобы видеть графики

PhysX High

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS

В принципе, в игре Batman Arkham Asylum для обеспечения комфортной производительности оказалось достаточно и одной GeForce GTX 470. Две видеокарты GeForce GTX 470 в SLI тандеме немного опередили такую же связку, в которой второй GPU обрабатывал PhysX. Добавление в SLI дуэт видеокарт под "физику" заметно увеличило производительность, особенно в разрешении 1920х1080.



Cryostasis (Техническое демо)



1280х1024

Включите JavaScript, чтобы видеть графики

1920х1080

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS

Постепенное наращивание количества видеокарт в системе привело к значительному росту результатов, особенно в разрешении 1920х1080.



Dark Void (Бенчмарк)



1280х1024


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX Low

Включите JavaScript, чтобы видеть графики

1920х1080


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX Low

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS

В игре Dark Void при увеличении количества видеокарт в конфигурации наблюдается не такой заметный рост результатов, как в Cryostasis. Возможно, производительность графических ускорителей ограничил процессор.



Darkest of Days (Бенчмарк)



1280х1024


PhysX Low

Включите JavaScript, чтобы видеть графики

PhysX Medium

Включите JavaScript, чтобы видеть графики

PhysX High

Включите JavaScript, чтобы видеть графики

1920х1080


PhysX Low

Включите JavaScript, чтобы видеть графики

PhysX Medium

Включите JavaScript, чтобы видеть графики

PhysX High

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS

Единственной конфигурацией, обеспечившей комфортную производительность при high настройке NVIDIA PhysX в игре Darkest of Days, стала связка из SLI тандема GeForce GTX 470 и GeForce GTX 460 1024 Мбайт.



Mafia 2 (Бенчмарк)



1280х1024


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX Medium

Включите JavaScript, чтобы видеть графики

PhysX High

Включите JavaScript, чтобы видеть графики

1920х1080


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX Medium

Включите JavaScript, чтобы видеть графики

PhysX High

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS

Игра Mafia 2 оказалась не по зубам для всех участников тестов. Даже самое мощное трио GPU обеспечило только приемлемую производительность.



Metro 2033 (Бенчмарк)



1280х1024


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX On

Включите JavaScript, чтобы видеть графики

1920х1080


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX On

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS

В оставшихся играх все варианты без особых проблем обеспечили комфортную производительность.



Mirror's Edge (FlybyFlight бенчмарк)



1280х1024


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX On

Включите JavaScript, чтобы видеть графики

1920х1080


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX On

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Sacred 2 Ice & Blood (Тилизий)



1280х1024


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX On

Включите JavaScript, чтобы видеть графики

1920х1080


PhysX Off

Включите JavaScript, чтобы видеть графики

PhysX On

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Warmonger (Первый уровень)



1280х1024

Включите JavaScript, чтобы видеть графики

1920х1080

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS




Глава 6. Производительность процессоров


В этой главе рассматривается производительность процессоров Phenom II X6 1090T ВЕ и Core i5 760 при обработке физических эффектов в сравнении с видеокартой GeForce GTS 250.

Стенд №1:

  • Процессор: Phenom II X6 1090T ВЕ (Thuban, L3 6 Мб), 1.34 В, Turbo Core - off - 3200 @ 4100 МГц (1.5 В)
  • Материнская плата: GigaByte GA-890FXA-UD7, BIOS F4

Стенд №2:

  • Процессор: Intel Core i5 760 (Lynnfield, L3 8 Мб), 1.11 В, Turbo Boost - off - 2800 @ 4000 МГц (1.38 В)
  • Материнская плата: ASRock P55 Extreme, BIOS v2.70

Остальные компоненты:

  • Видеокарта: GeForce GTS 250 1024 Mбайт - 738/1836/2200 МГц (XFX)
  • Оперативная память: 2 x 2048 Мбайт DDR3 Corsair (Spec: 1600 МГц / 8-8-8-20-1t / 1.65 В)
  • Система охлаждения CPU: Cooler Master V8 (~1100 об/мин)
  • Дисковая подсистема: SATA-II 500 Гбайт, WD 5000KS, 7200 об/мин, 16 Мбайт
  • Блок питания: Thermaltake Toughpower 1200 Ватт (штатный вентилятор: 140-мм на вдув)
  • Корпус: открытый тестовый стенд
  • Монитор: 30" DELL 3008WFP (Wide LCD, 2560x1600 / 60 Гц)

Для того, чтобы процессоры обрабатывали физические эффекты в панели управления драйверов GeForce/ION вручную был установлен пункт расчета PhysX на CPU.

Вполне ожидаемо видеокарта GeForce GTS 250 уверенно опередила процессоры в большинстве игр и приложений. В противостоянии Phenom II X6 1090T ВЕ и Core i5 760 была зафиксирована боевая ничья.


FluidMark


1920х1080

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Particle Fluid


1024х768

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Nurien


1024х768

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Batman Arkham Asylum (Бенчмарк)



1280х1024


PhysX Medium

Включите JavaScript, чтобы видеть графики

PhysX High

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Cryostasis (Техническое демо)


1280х1024

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Dark Void (Бенчмарк)


1280х1024

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Darkest of Days (Бенчмарк)



1280х1024


PhysX Medium

Включите JavaScript, чтобы видеть графики

PhysX High

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS


Mafia 2 (Бенчмарк)



1280х1024


PhysX Medium

Включите JavaScript, чтобы видеть графики

PhysX High

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Metro 2033 (Бенчмарк)



1280х1024


PhysX off

Включите JavaScript, чтобы видеть графики

PhysX on

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Mirror's Edge (FlybyFlight бенчмарк)


1280х1024

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Sacred 2 Ice & Blood (Тилизий)


1280х1024

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Warmonger (Первый уровень)


1280х1024

Включите JavaScript, чтобы видеть графики
Минимальный и средний FPS



Выводы

Глава 1. Одиночные видеокарты GeForce.

В таких играх, как Warmonger, Mirror's Edge и Dark Void несмотря на включенную технологию NVIDIA PhysX все участники тестирования продемонстрировали комфортную или близкую к ней производительность.

В играх Metro 2033 и Sacred 2 Ice & Blood активация NVIDIA PhysX незначительно снижала результаты видеокарт, хотя уровень производительности некоторых испытуемых был далек от комфортного. Но в данных проектах видеокарты были больше загружены обработкой графики, чем расчетами физических эффектов.

В игре Mafia 2 ни один GPU не смог достичь комфортного уровня производительности при medium и high настройках NVIDIA PhysX. Такая же ситуация наблюдалась и в игре Darkest of Days при high настройках NVIDIA PhysX.

В играх Batman Arkham Asylum и Cryostasis старшие графические ускорители без особых проблем показали комфортную производительность.

В большинстве игр и приложений разрыв в результатах между аутсайдерами и лидерами составил около 40% - 130%.

Глава 2. Видеокарты GeForce в паре с GeForce GTX 480.

В большинстве тестовых приложений для обеспечения комфортной производительности "под физику" достаточно младших видеокарт GeForce 9800 GT, GeForce 9600 GT, GeForce GT 240.

Исключением стали игры Darkest of Days и Mafia 2, в которых для обеспечения приемлемой и комфортной производительности потребовались графические ускорители выше среднего уровня.

Глава 3. Видеокарты GeForce в паре с Radeon HD 6970.

При работе связки Radeon HD 6970 в паре с видеокартами NVIDIA основные тенденции аналогичны таковым во второй главе.

Глава 4. Влияние PCI-Express на производительность видеокарты.

FluidMark оказался единственным приложением, в котором тип разъема PCI-Express существенно повлиял на производительность видеокарты, отвечающей за физические эффекты. Во всех остальных играх и приложениях переустановка графического ускорителя в разные слоты PCI-Express приводила либо к незначительному изменению результатов, либо ничего не меняла.

Глава 5. Видеокарты в SLI тандеме и не только.

SLI тандем из двух GeForce GTX 470 1280 Mбайт обеспечил комфортную производительность в большинстве игр и приложений. Исключением стала игра Mafia 2, в которой добавленная для обработки физических расчетов видеокарта GeForce GTX 460 1024 Мбайт смогла "вытянуть" результаты тандема только до приемлемых.

Глава 6. Производительность процессоров.

В противостоянии процессоров Phenom II X6 1090T ВЕ и Core i5 760 победителя выявлено не было, при этом они оба были заметно медленнее видеокарты GeForce GTS 250 в большинстве тестовых приложений.

Дмитрий Прилепских aka Phoenix