Оптимизация драйверов видеокарт под их работу с многоядерными процессорами

11 февраля 2010, четверг 01:21

Оглавление

  • Вступление
  • Тестовая конфигурация
  • Инструментарий и методика тестирования
  • Результаты тестов: сравнение производительности
  • Сравнение производительности процессоров
  • Заключение
  • Вступление

    В начале 2009 года, во время выпуска новой версии драйверов для видеокарт, компания AMD упомянула среди нововведений поддержку процессоров с количеством ядер более двух. Эта новость всколыхнула многие форумы, породив множество споров о способности видеокарт Radeon работать с трех - и четырехъядерными процессорами.

    Этот вопрос волнует многих и до сих пор, поэтому сегодня мы решили проверить его на практике.

    Тестовая конфигурация

    Тесты проводились на следующем стенде:

    • Процессор: Intel Core i7 920 (Bloomfield, D0, L3 8 Мб), 1.18 В, Turbo Boost - on, Hyper Threading - off/on - 2660 @ 4000 МГц
    • Материнская плата: GigaByte GA-EX58-UD5, BIOS F5
    • Система охлаждения CPU: Cooler Master V8 (~1100 об/мин)
    • Оперативная память: 2 x 2048 Мбайт DDR3 Corsair TR3X6G1600C7 (Spec: 1528 МГц / 8-8-8-20-1t / 1.5 В) , X.M.P. - off
    • Дисковая подсистема: SATA-II 500 Гбайт, WD 5000KS, 7200 об/мин, 16 Мбайт
    • Блок питания: Thermaltake Toughpower 1200 Ватт (штатный вентилятор: 140-мм на вдув)
    • Корпус: открытый тестовый стенд
    • Монитор: 24" BenQ V2400W (Wide LCD, 1920x1200 / 60 Гц)

    Видеокарты:

    • Zotac GeForce GTX 260 896 Mбайт (576/1242/2000 МГц)
    • Leadtek GeForce GTX 260 896 Mбайт (576/1242/2000 МГц)
    • Sapphire Radeon HD 4870 1024 Мбайт (750/750/3600 МГц) - 2 шт.

    Программное обеспечение:

    • Операционная система: Windows 7 build 7600 RTM x86
    • Драйверы видеокарт: NVIDIA Display Driver 196.34 и ATI Catalyst 10.1
    • RivaTuner 2.24c
    • MSI AFTERBURNER 1.5.0

    Инструментарий и методика тестирования

    Для проверки оптимизации драйверов видеокарт под работу с многоядерными процессорами мы вновь использовали процессор Core i7 i920, работающий на частоте 4000 МГц. Через БИОС материнской платы были отключены одно и два ядра, чтобы съэмулировать двух-, трех - и четырехъядерный процессоры.

    Графическая подсистема состояла из одиночных видеокарт GeForce GTX 260 896 Мбайт и Radeon HD 4870 1024 Мбайт, и SLI/CrossFireX тандемов, основанных на этих же графических ускорителях. Сделано это было, чтобы выявить работоспособность мультипроцессорных графических технологий в играх и исследовать оптимизацию драйверов для работы с процессорами с различным числом ядер, как у одиночных видеокарт, так и у тандемов.

    Все игры тестировались в разрешении 1280х1024.

    В следующих играх использовались средства измерения быстродействия (бенчмарк):

    • Batman: Arkham Asylum
    • Colin McRae: DIRT 2
    • Crysis Warhead (ambush)
    • Far Cry 2 (ranch small)
    • Lost Planet: Colonies (area1)
    • Resident Evil 5 (scene 1)
    • Tom Clancy's H.A.W.X.
    • S.T.A.L.K.E.R.: Call of Pripyat (SunShafts)
    • Street Fighter 4
    • World in Conflict: Soviet Assault

    Игра, в которой производительность замерялась путем загрузки демо сцен:

    • Left 4 Dead 2

    В данных играх производительность измерялась с помощью утилиты FRAPS v3.0.3 build 10809:

    • Anno 1404
    • Bionic Commando
    • Borderlands
    • Call of Duty 4: Modern Warfare 2
    • Dragon Age: Origin
    • Fallout 3: Broken Steel
    • FUEL
    • Gears of War
    • Grand Theft Auto 4
    • Mass Effect
    • Mirrors Edge
    • Need for Speed: SHIFT
    • Operation Flashpoint: Dragon Rising
    • Overlord 2
    • Prototype
    • Race Driver: GRID
    • Red Faction: Guerrilla
    • Risen
    • Sacred 2: Fallen Angel

    Во всех играх замерялись минимальные и средние значения FPS.

    В тестах, в которых отсутствовала возможность замера min fps, это значение измерялось утилитой FRAPS.

    VSync при проведении тестов был отключен.

    Чтобы избежать ошибок и минимизировать погрешности измерений, все тесты производились по три раза. При вычислении avg fps за итоговый результат бралось среднеарифметическое значение результатов всех прогонов. В качестве min fps выбиралось минимальное значение показателя по результатам трех прогонов.

    Перейдем непосредственно к тестам.

    Сравнение производительности процессоров

    Среднегеометрическая производительность процессора в тридцати играх

    GeForce GTX 260

    Включите JavaScript, чтобы видеть графики

    SLI 2 x GeForce GTX 260

    Включите JavaScript, чтобы видеть графики

    Radeon HD 4870

    Включите JavaScript, чтобы видеть графики

    CrossFireX 2 x Radeon HD 4870

    Включите JavaScript, чтобы видеть графики
    минимальный и средний FPS

    Сегодняшнее тестирование показало, что в большинстве игр одиночная видеокарта становится узким местом системы. В результате активация ядер CPU у платформ с GeForce GTX 260 и Radeon HD 4870 привела к незначительному росту производительности.

    Активация ядер процессора на системе с двумя Radeon HD 4870 повысила производительность больше, чем у платформы с двумя GeForce GTX 260.

    По этим результатам сложно судить о том, драйверы какого производителя видеокарт лучше оптимизированы для работы с многоядерными процессорами. Попробуем более детально рассмотреть ситуацию. Начнем с анализа производительности платформ по среднему FPS.

    Сводная диаграмма производительности процессора, с активированными двумя, тремя и четырьмя ядрами (за 100% взят результат двухъядерного процессора)

    Средний FPS

    три и четыре активированных ядра
    Anno 1404

    Включите JavaScript, чтобы видеть графики

    Batman: Arkham Asylum

    Включите JavaScript, чтобы видеть графики

    Bionic Commando

    Включите JavaScript, чтобы видеть графики

    Borderlands

    Включите JavaScript, чтобы видеть графики

    Call of Duty: Modern Warfare 2

    Включите JavaScript, чтобы видеть графики

    Colin McRae: DIRT 2

    Включите JavaScript, чтобы видеть графики

    Crysis Warhead

    Включите JavaScript, чтобы видеть графики

    Dragon Age: Origin

    Включите JavaScript, чтобы видеть графики

    Fallout 3: Broken Steel

    Включите JavaScript, чтобы видеть графики

    Far Cry 2

    Включите JavaScript, чтобы видеть графики

    FUEL

    Включите JavaScript, чтобы видеть графики

    Gears of War

    Включите JavaScript, чтобы видеть графики

    Grand Theft Auto 4

    Включите JavaScript, чтобы видеть графики

    Left 4 Dead 2

    Включите JavaScript, чтобы видеть графики

    Lost Planet: Colonies

    Включите JavaScript, чтобы видеть графики

    Mass Effect

    Включите JavaScript, чтобы видеть графики

    Mirrors Edge

    Включите JavaScript, чтобы видеть графики

    Need for Speed: SHIFT

    Включите JavaScript, чтобы видеть графики

    Operation Flashpoint: Dragon Rising

    Включите JavaScript, чтобы видеть графики

    Overlord 2

    Включите JavaScript, чтобы видеть графики

    Prototype

    Включите JavaScript, чтобы видеть графики

    Race Driver: GRID

    Включите JavaScript, чтобы видеть графики

    Red Faction: Guerrilla

    Включите JavaScript, чтобы видеть графики

    Resident Evil 5

    Включите JavaScript, чтобы видеть графики

    Risen

    Включите JavaScript, чтобы видеть графики

    S.T.A.L.K.E.R.: Call of Pripyat

    Включите JavaScript, чтобы видеть графики

    Sacred 2: Fallen Angel

    Включите JavaScript, чтобы видеть графики

    Street Fighter 4

    Включите JavaScript, чтобы видеть графики

    Tom Clancy: HAWX

    Включите JavaScript, чтобы видеть графики

    World in Conflict: Soviet Assault

    Включите JavaScript, чтобы видеть графики

    Тестирование показало, что:

    • после активации трех и четырех ядер CPU у платформы с одной GeForce GTX 260 производительность осталась неизменной в 26 играх
    • после активации трех ядер CPU у платформы с одной GeForce GTX 260 производительность возросла более 5% в 4 играх
    • после активации четырех ядер CPU у платформы с одной GeForce GTX 260 производительность возросла по сравнению с трехъядерным CPU более 5% в 1 игре
    • после активации трех и четырех ядер CPU у платформы с одной Radeon HD 4870 производительность осталась неизменной в 26 играх
    • после активации трех ядер CPU у платформы с одной Radeon HD 4870 производительность возросла по сравнению с трехъядерным CPU более 5% в 4 играх
    • после активации четырех ядер CPU у платформы с одной Radeon HD 4870 производительность возросла более 5% в 1 игре
    • после активации трех и четырех ядер CPU у платформы с двумя GeForce GTX 260 производительность осталась неизменной в 11 играх
    • после активации трех ядер CPU у платформы с двумя GeForce GTX 260 производительность возросла более 5% в 19 играх
    • после активации четырех ядер CPU у платформы с двумя GeForce GTX 260 производительность возросла по сравнению с трехъядерным CPU более 5% в 5 играх
    • после активации трех и четырех ядер CPU у платформы с двумя Radeon HD 4870 производительность осталась неизменной в 11 играх
    • после активации трех ядер CPU у платформы с двумя Radeon HD 4870 производительность возросла более 5% в 19 играх
    • после активации четырех ядер CPU у платформы с двумя Radeon HD 4870 производительность возросла по сравнению с трехъядерным CPU более 5% в 6 играх

    Получается, что драйверы обоих производителей видеокарт одинаково хорошо оптимизированы под многоядерные процессоры, как при наличии в системе одного GPU, так и двух видеокарт. В случае с четырехъядерными процессорами незначительное преимущество на стороне AMD.

    Сводная диаграмма производительности процессора, с активированными двумя, тремя и четырьмя ядрами (за 100% взят результат двухъядерного процессора)

    Минимальный FPS

    три и четыре активированных ядра
    Anno 1404

    Включите JavaScript, чтобы видеть графики

    Batman: Arkham Asylum

    Включите JavaScript, чтобы видеть графики

    Bionic Commando

    Включите JavaScript, чтобы видеть графики

    Borderlands

    Включите JavaScript, чтобы видеть графики

    Call of Duty: Modern Warfare 2

    Включите JavaScript, чтобы видеть графики

    Colin McRae: DIRT 2

    Включите JavaScript, чтобы видеть графики

    Crysis Warhead

    Включите JavaScript, чтобы видеть графики

    Dragon Age: Origin

    Включите JavaScript, чтобы видеть графики

    Fallout 3: Broken Steel

    Включите JavaScript, чтобы видеть графики

    Far Cry 2

    Включите JavaScript, чтобы видеть графики

    FUEL

    Включите JavaScript, чтобы видеть графики

    Gears of War

    Включите JavaScript, чтобы видеть графики

    Grand Theft Auto 4

    Включите JavaScript, чтобы видеть графики

    Left 4 Dead 2

    Включите JavaScript, чтобы видеть графики

    Lost Planet: Colonies

    Включите JavaScript, чтобы видеть графики

    Mass Effect

    Включите JavaScript, чтобы видеть графики

    Mirrors Edge

    Включите JavaScript, чтобы видеть графики

    Need for Speed: SHIFT

    Включите JavaScript, чтобы видеть графики

    Operation Flashpoint: Dragon Rising

    Включите JavaScript, чтобы видеть графики

    Overlord 2

    Включите JavaScript, чтобы видеть графики

    Prototype

    Включите JavaScript, чтобы видеть графики

    Race Driver: GRID

    Включите JavaScript, чтобы видеть графики

    Red Faction: Guerrilla

    Включите JavaScript, чтобы видеть графики

    Resident Evil 5

    Включите JavaScript, чтобы видеть графики

    Risen

    Включите JavaScript, чтобы видеть графики

    S.T.A.L.K.E.R.: Call of Pripyat

    Включите JavaScript, чтобы видеть графики

    Sacred 2: Fallen Angel

    Включите JavaScript, чтобы видеть графики

    Street Fighter 4

    Включите JavaScript, чтобы видеть графики

    Tom Clancy: HAWX

    Включите JavaScript, чтобы видеть графики

    World in Conflict: Soviet Assault

    Включите JavaScript, чтобы видеть графики

    Теперь проанализируем производительность платформ по минимальному FPS.

    Тестирование показало, что:

    • после активации трех и четырех ядер CPU у платформы с одной GeForce GTX 260 производительность осталась неизменной в 3 играх
    • после активации трех ядер CPU у платформы с одной GeForce GTX 260 производительность возросла более 5% в 27 играх
    • после активации четырех ядер CPU у платформы с одной GeForce GTX 260 производительность возросла по сравнению с трехъядерным CPU более 5% в 1 игре
    • после активации трех и четырех ядер CPU у платформы с одной Radeon HD 4870 производительность осталась неизменной в 24 играх
    • после активации трех ядер CPU у платформы с одной Radeon HD 4870 производительность возросла более 5% в 6 играх
    • после активации четырех ядер CPU у платформы с одной Radeon HD 4870 производительность возросла по сравнению с трехъядерным CPU более 5% в 2 играх
    • после активации трех и четырех ядер CPU у платформы с двумя GeForce GTX 260 производительность осталась неизменной в 16 играх
    • после активации трех ядер CPU у платформы с двумя GeForce GTX 260 производительность возросла более 5% в 14 играх
    • после активации четырех ядер CPU у платформы с двумя GeForce GTX 260 производительность возросла по сравнению с трехъядерным CPU более 5% в 4 играх
    • после активации трех и четырех ядер CPU у платформы с двумя Radeon HD 4870 производительность осталась неизменной в 15 играх
    • после активации трех ядер CPU у платформы с двумя Radeon HD 4870 производительность возросла более 5% в 15 играх
    • после активации четырех ядер CPU у платформы с двумя Radeon HD 4870 производительность возросла по сравнению с трехъядерным CPU более 5% в 8 играх

    По минимальному FPS мы вновь наблюдаем паритет между обоими производителями видеокарт в оптимизации драйверов для работы с многоядерными процессорами как при наличии в системе двух-, трех-, четырехъядерного процессоров и одного графического ускорителя, так и двух-, трехъядерных процессоров и двух видеокарт. В случае с платформой, основанной на четырехъядерном процессоре и двух видеокартах объективное преимущество на стороне AMD.

    Заключение

    Сегодняшнее тестирование показало, что NVIDIA и AMD одинаково хорошо оптимизируют драйвера видеокарт под работу с многоядерными процессорами. При эксплуатации в системе с двумя видеокартами четырехъядерного процессора нами было зафиксировано незначительное преимущество AMD. Также некоторое влияние на итоговый результат оказала неработоспособность технологий SLI и CrossFireX в некоторых играх, но количество этих проектов слишком незначительно, чтобы серьезно исказить общую картину.

    Дмитрий Прилепских aka Phoenix_