Обзор видеокарты MSI GTX 480 Lightning (часть 1)

13 декабря 2010, понедельник 16:52

Оглавление

Вступление

Lightning и MSI – практически синонимы для мира компьютерных комплектующих. Едва ли не каждый, кто хоть раз задавался целью найти лучшее среди равнозначных видеокарт, обращал внимание на оригинальные вещи, например, серию карт Lightning. Быть нестандартным, передовым, сгустком современных технологий в одном лице сложно, но возможно. Таковым видели инженеры одно свое творение. Но, как говорится, не быстро и не сразу пришли они к формуле удачи. Путь был однозначно тернист, а поначалу мы увидели первый «блин», и, честно говоря, я бы назвал его «комом».

Прохладной весной 2009 года увидели свет две «Молнии», основанные на ядре nVidia G200-103-B2 (GTX 260). Как полагается, сразу в исполнении 55 нм и с 216 потоковыми процессорами, с более чем полутора гигабайтами памяти и повышенными частотами. В общем, по всем канонам сообщества оверклокеров.

300x300  19 KB 300x300  16 KB

Первая видеокарта с 10-тью фазами для GPU, точками мониторинга основных напряжений и эффективной системой охлаждения. Во втором варианте использовалась внешняя панель, подключаемая к USB.

500x430  37 KB. Big one: 1024x881  93 KB

Она должна была служить гидом для начинающего энтузиаста и хорошим помощником бывалому «профи». Обе поставлялись с революционным программным обеспечением, способным на лету менять частоту, напряжение Vgpu и скорость вращения вентилятора. Все бы хорошо, если бы не последующие мелкие огрехи в глобальной связи между всеми компонентами. Когда «софт» не умеет или не запускается в современной операционной системе. Когда применяемые параметры никоим образом не воздействуют физически, и таких «нехороших» примеров было предостаточно. Верящие в MSI, затаив дыхание, ждали «заплаток», обновлений, исправлений, ведь сами видеокарты были сделаны на высшем уровне, а благодаря своей «начинке» не раз поднимались на призовые места в международных соревнованиях.

Буквально через считанные месяцы в разгар лета MSI выпускает последователя. На этот раз используется GPU G200-105-B2 (GTX 275).

500x400  46 KB

Посчитав ненужной, внешнюю панель убрали. А утешать покупателей была призвана заново разработанная система охлаждения, далее названная TwinFrozr. Дизайн печатной платы обзавелся следующим порядковым номером: V180 ver1.0 -> V180 ver2.1.

300x138  20 KB. Big one: 1200x552  161 KB 300x133  17 KB. Big one: 1200x532  153 KB

Вместо неудобных площадок замера напряжений появились небольшие направляющие, добавили танталовых конденсаторов, но в целом подход оставался на прежнем уровне с присущем ему недостатками.

Чуть позже, осенью MSI делает первые стратегически важные шаги на пути улучшения программной составляющей Lightning’ов - доверяет Алексею Николайчуку, он же Unwinder, разработку универсальной оболочки для всех видеокарт MSI. А в качестве бонуса MSI Afterburner получила поддержку разгона и мониторинга сторонних карт.

Никто и не догадывался, что на протяжении почти полугода в недрах компании готовился R5870 Lightning. Весной 2010 года анонсировали саму видеокарту, а буквально через месяц она появилась в свободной продаже.

500x400  43 KB. Big one: 1000x800  112 KB

Старания MSI сделать что-то стоящее из Cypress не прошли даром. При разработке также были учтены просьбы энтузиастов и проделана работа над ошибками.

300x163  16 KB. Big one: 1500x817  178 KB 300x174  16 KB. Big one: 1500x869  220 KB

300x168  18 KB. Big one: 1500x841  257 KB 300x171  20 KB. Big one: 1500x857  274 KB

С «технической стороны» на видеокарте размещено 6 сдвоенных фаз GPU (6x2) и 3 фазы питания памяти. Применена схема адаптивной подстройки количества используемых фаз, два 8 штырьковых разъема питания, в цепях питания установлены танталовые конденсаторы и полимерные пленочные NEC Proadlizer. Разъемы V-check наконец обзавелись «хвостиками» под щупы мультиметра, но все еще «разбросаны» по печатной плате. В остальном получилась уникальная карта, если бы не врожденная болезнь Radeon’ов «умирать» от статического напряжения, случайно попадавшего на видеовыходы.

Чуть позже вышел самый передовой графический адаптер среди Lightnin’гов – GTX 480.

500x400  41 KB. Big one: 1000x800  106 KB

Речь о нем пойдет в обзоре.

Таблица характеристик и цен

Для визуальной оценки характеристик и расстановки среди конкурентов проще всего взглянуть в таблицу и сравнить видеокарты. Корректировку предлагаю произвести, основываясь на реальных розничных московских ценах. До момента поступления в свободную продажу MSI GTX 480 Lightning судить о перспективности пока что рано. К тому же, учитывая снятие с производства GPU GF100, судьба «Молнии» остается под большим вопросом. Готов предположить, что дизайн PCB спокойно мигрирует для следующей версии под названием MSI GTX 580 Lightning без существенных переделок.

Характеристики
HD 5850
HD 5870
HD 5970
HD 6870
GTX 465
GTX 470
GTX 480
GTX 580
Кодовое имя
Cypress Pro
Cypress XT
Hemlock
Barts XP
GF100
GF100
GF100
GF110
Техпроцесс, нм
40
40
40
40
40
40
40
40
Размер ядра/ядер, мм2
334
334
334 x2
255
~500
~500
~500
~530
Количество
транзисторов, млн шт.
2154
2154
2154 x2
1800
3200
3200
3200
3300
Частота ядра 2D,
МГц
157
157
157
100
50 / 100
50 / 100
50 / 100
50 / 100
Частота ядра 3D,
МГц
725
850
725
900
607 / 1215
607 / 1215
701 / 1402
772 / 1544
Частота ядра
OC, МГц
1000
1050
950
950
750 / 1500
800 / 1600
800 / 1600
850 / 1700
Напряжение на
ядре 2D, В
0,95
0,95
0,95
0,95
0,9
0,9
0,96
0,95
Напряжение на
ядре 3D, В
1,1
1,15
1,1
1,21
1,05
1,00
1,00
1,00
Число шейдеров,
шт. (PS)
1440
1600
1600 x2
1120
352
448
480
512
Число блоков,
растеризации шт. (ROP)
32
32
32 x2
32
32
40
48
48
Число текстурных
блоков, шт. (TMU)
72
80
80 x2
56
44
56
60
64
Максимальная скорость,
закраски Гпикс/сек
23,2
27,2
46,4
28,8
19,5
24,3
33,6
37,1
Максимальная скорость
выборки текстур,
Гтекс/сек
52,2
68
58
50,4
26,7
32,4
42,1
49,4
Версия
пиксельных/вертексных
шейдеров
5.0 / 5.0
5.0 / 5.0
5.0 / 5.0
5.0 / 5.0
5.0 / 5.0
5.0 / 5.0
5.0 / 5.0
5.0 / 5.0
Тип памяти
GDDR5
GDDR5
GDDR5
GDDR5
GDDR5
GDDR5
GDDR5
GDDR5
Эффективная
частота памяти 2D, МГц
1200
1200
1200
300
67
67
67
67
Эффективная
частота памяти 3D, МГц
4000
4800
4000
4200
3206
3360
3700
4008
Эффективная
частота памяти OC, МГц
4800
5200
4400
4800
3500
3600
3900
4100
Напряжение на
памяти 2D, В
1,6
1,6
1,6
1,6
1,57
1,57
1,57
1,57
Напряжение на
памяти 3D, В
1,6
1,6
1,6
1,6
1,6
1,6
1,6
1,58
Объём памяти,
Мбайт
1024
1024 / 2048
1024 х2
1024
1024
1280
1536
1536
Шина памяти,
бит
256
256
256 х2
256
256
320
384
384
Пропускная способность
памяти, Гбайт/сек
128
153,6
128 х2
134,4
102,6
133,9
177,4
192,4
Потребляемая
мощность 2D, Ватт
27
27
42
19
нд
нд
нд
нд
Потребляемая
мощность 3D, Ватт
170
188
294
151
200
215
250
244
Crossfire/Sli
да
да
да
да
да
да
да
да
Размер карты,
ДхШхВ, мм
244х100х37
282х100х38
340х100х38
248х100х37
270x100x38
270x100x38
270x100x38
270x100x39
Рекомендованная
цена, $
299
399
599
239
279 (229)
349 (259)
499
499

567x355  10 KB

Архитектура GF100/110

Для того чтобы понять, как nVidia смогла разумно распределить и настроить свою основную архитектуру Fermi, нужно всего лишь один раз показать вам это наглядно. Базой для всех GPU послужила собирательная структура слова «Fermi». Основной подход моделирования ядер сильно отличается от «кухни» AMD. Если nVidia «шлифует» и оптимизирует блоки, старается максимально адаптироваться под современные требования, то AMD копирует, клонирует и размножает удачные составляющие. К тому же не грех будет сказать, что существенных улучшений у AMD давно не видно. И сравнивая обоих конкурентов, становится видно, как диаметрально противоположны философии строительства успешного GPU.

Я не брал в расчет графические ядра медленнее GTX 460 (GF104). У AMD рассмотрим всех, кто быстрее Cypress LE, в том числе обе новинки Barts.

Начнем с самой примитивной части графического процессора. В случае AMD это суперскалярный процессор, у nVidia – Cuda Core.

Видеокарта
Название GPU
Схематичный вид
HD 5870
Cypress
235x143  9 KB
HD 6870
Barts
235x143  8 KB
HD 6970*
Cayman*
235x143  8 KB
GTX 460
GF104
477x143  15 KB
GTX 570*
GF114*
477x143  15 KB
GTX 480
GF100
235x143  10 KB
GTX 580
GF110
235x143  10 KB

Cypress – 1 SFU, 4 FMAD, в том числе умеющие выполнять операции с двойной точностью.

За один такт может обработать:

  • 4x 32-битных FP MAD,
  • 2x 64-битных FP MUL или ADD,
  • 1x 64-битный FP MAD,
  • 4x 24-битных Int MUL или ADD SFU,
  • 1x 32-битный FP MAD.

Barts – 1 SFU, 4 FMAD, без поддержки двойной точности.

За один такт может обработать:

  • 4x 32-битных FP MAD,
  • 4x 24-битных Int MUL или ADD SFU,
  • 1x 32-битный FP MAD.

GF104 – 1 FMAD, 2 типа CUDA-ядер, с двойной и с одинарной точностью, в соотношении 1 к 2. Блоки SFU вынесены за пределы Cuda-ядра.

За один такт может обработать:

  • 1x 32-битных FP MAD,
  • 1x 64-битных FP MUL или ADD,
  • 1x 64-битный FP MAD,
  • 1x 24-битных Int MUL,
  • 1x 32-битный FP MAD.

GF100 – 1 FMAD, в том числе умеющий выполнять операции с двойной точностью. Блоки SFU вынесены за пределы Cuda-ядра.

За один такт может обработать:

  • 1x 32-битных FP MAD,
  • 1x 64-битных FP MUL или ADD,
  • 1x 64-битный FP MAD,
  • 1x 24-битных Int MUL,
  • 1x 32-битный FP MAD.

GF110 – 1 FMAD, в том числе умеющий выполнять операции с двойной точностью. Блоки SFU вынесены за пределы Cuda ядра.

За один такт может обработать:

  • 1x 32-битных FP MAD,
  • 1x 64-битных FP MUL или ADD,
  • 1x 64-битный FP MAD,
  • 1x 24-битных Int MUL,
  • 1x 32-битный FP MAD.

SM и SIMD блоки:

Видеокарта
Название GPU
Схематичный вид
HD 5870
Cypress
237x367  24 KB
HD 6870
Barts
237x367  24 KB
GTX 460
GF104
326x335  47 KB
GTX 570*
GF114*
326x335  47 KB
GTX 480
GF100
326x335  46 KB
GTX 580
GF110
326x335  46 KB

Сразу видно, что SIMD ядро гораздо проще SM блока. AMD, в первую очередь, берет реванш у соперника за счет количества и простоты, а не качества исполнения. Суммарный объем кэшей и логических буферов у nVidia существенно больше чем у AMD. Предполагаемая схема Cayman’а позволит сократить удельную площадь на 1 суперскалярный юнит. Тип и количество текстурных блоков у SM GF104/114 отличается от таковых в GF100/110. Судя по всему, один SM в GF104/114 занимает большую площадь, чем в GF100/110, и если бы не ограничения в минимальных производственных нормах, мы бы вполне могли увидеть следующее поколение Fermi, основанное на SM от GF104/110.

Следующий шаг - сравнить GPU без вспомогательных модулей, так сказать, чистую математическую мощь.

Видеокарта
Название GPU
Схематичный вид:
HD 5870
Cypress
237x412  18 KB
HD 6870
Barts
237x412  17 KB
GTX 460
GF104
400x176  59 KB
GTX 570*
GF114*
400x176  64 KB
GTX 480
GF100
400x301  116 KB
GTX 580
GF110
400x301  122 KB

Эволюция от Cypress до предполагаемого Cayman’а логична. Огромное число SP юнитов постоянно требует работы, а равномерно и эффективно их «загружать» должен Ultra Threaded Dispatch Processor. Допустим, AMD решила, что в достаточной мере обеспечила беспрерывность вычислений с помощью двух процессоров по очереди, но по моделям тесселяции соперник все еще впереди. И судя по некоторым данным, можно считать, что в будущем Cayman’е поместят целых два блока тесселяции. Впрочем, думаю, что даже такая оптимизация не способна полностью раскрыть потенциал всего GPU.

500x128  54 KB

В nVidia проблему эффективности решают ювелирными модификациями, оснастив каждый SM по блоку тесселяции и геометрии. В итоге чистая производительность выше, чем у AMD, на несколько порядков.

Подход конфигурации контроллеров памяти и ROP практически идентичен у обоих вендоров. Только nVidia в который раз балует нас широкой шиной данных, но относительно низкой частотой. У AMD в этом плане застой, то ли дело в экономической нецелесообразности, то ли в сложности реализации, но прогресс замер на 256 bit. Правда, по эффективному уровню пропускной способности конкуренты находятся на приблизительно одинаковом уровне.

Видеокарта
Название GPU
Схематичный вид:
HD 5870 Cypress
237x247  10 KB
HD 6870 Barts
237x247  10 KB
HD 6970* Cayman*
237x247  10 KB
GTX 460 GF104
450x245  56 KB
GTX 570 GF114
450x245  56 KB
GTX 480 GF100
500x181  71 KB
GTX 580 GF110
500x181  71 KB

Из приведенных схем напрашиваются несколько выводов:

Для AMD математическая мощность GPU ограничивается искусственными факторами (неспособность блока распределения задач полностью загрузить работой суперскалярные процессоры). Ограниченное пространство GPU не может в себя вписать большее количество блоков тесселяции.

Для nVidia существующая модель архитектуры Fermi уникальна, но ей немного не повезло с размерами. Чтобы уместить все исполнительные элементы, потребовалось слишком большое пространство. А сильное тепловыделение (все CUDA-ядра работают на удвоенной частоте) не позволяет наращивать SM блоки. В итоге потребовалось внедрить дополнительный тип транзисторов на производстве, чтобы удержать тепловой пакет в расчетном значении.

Кстати, впервые промежуточные транзисторы были опробованы в GF104, а уже потом в GF110. Условно-упрощённо, сейчас используется несколько типов: высокой производительности (Hiprf подразделяются еще на 2 вида, высоковольтные и низковольтные), с низкими токами «утечки» (LoLeak подразделяются еще на 2 вида, высоковольтные и низковольтные), транзисторы для цепей ввода/вывода (IO низковольтные), и разработанные специально для решения проблем с Fermi «средневольтные» (MdVlt низковольтные).

Внешний вид

Оригинальный дизайн MSI предполагает незаурядный вид карты. В нотках общей концепции просматривается «предательский» красный цвет, несвойственный видеокартам на основе GPU nVidia.

400x151  13 KB. Big one: 1500x666  122 KB
400x178  13 KB. Big one: 1500x566  122 KB

Печатная плата

Вы боялись размеров GTX 295, HD 5970? Забудьте о них, взгляните на это «чудо»:

300x153  9 KB. Big one: 1500x766  125 KB

Мысленно возникает вопрос, кто за кем прячется. Размеры видеокарты поистине исполинские, как в длину, так и в ширину. До сих пор я поражался масштабам инженерной мысли в создании динозавроподобных видеокарт, но если большинство производителей изготавливало их только для устрашения конкурентов и привлечения взглядов посетителей выставок, то GTX 480 Lightning выпускается серийно!

283x163  14 KB. Big one: 1500x865  201 KB 300x163  11 KB. Big one: 1500x815  166 KB

После снятия системы охлаждения с обеих сторон вырисовываются массивы электронных компонентов, по-семейному сгруппированные на обширном плато под названием PCB:

300x161  18 KB. Big one: 1500x806  350 KB 300x164  19 KB. Big one: 1500x816  410 KB

Как видно по фотографиям, GPU и память занимают небольшую часть доступного места. Их расположение классическое. Чуть больше половины всей PCB отдано на современную схему питания. Начну, пожалуй, с вида спереди:

400x268  21 KB. Big one: 1000x669  104 KB

[+] Три разъема питания, нет, не верю своим глазам. Считаем вслух максимальную нагрузку 30 А + 30 А + 30 А = 90 А. Куда? Зачем? Если абстрагироваться от видеокарты и компьютеров, то представьте, столько же нужно средней иномарке, которая с двигателем внутреннего сгорания и на колесах.

400x308  32 KB. Big one: 400x308  34 KB

[+] Разъемы для отслеживания трех важных напряжений: Vgpu, Vmem, AUX. Помимо «косичек» MSI решила раз и навсегда избавиться от коротких замыканий и поставила простенькую защиту с предохранителями.

400x352  60 KB. Big one: 400x352  61 KB

[+] Две микросхемы BIOS’а, обе перезаписываемые. Изначально во втором лежит специальный образ, оптимизированный для сугубо отрицательных температур существования видеокарты.

400x187  17 KB. Big one: 1000x467  102 KB

[+-] Переключатель BIOS’ов отважно поместился в легкодоступной зоне, как для пальцев, так и для азота. Лучше все же его отнести подальше от GPU и подписать оба положения, например, 1-2. А то неровен час, на холодных азотных тестах дешевый «рубильник» вконец замерзнет и развалится или энтузиаст забудет, на какой версии BIOS’а запускать систему.

400x268  24 KB. Big one: 1000x669  128 KB

[-] Гирлянда разноцветных диодов актуальна в канун Нового года, не более того. В открытом стенде так и норовит засветить в глаза. Примечательно, что я ни разу не увидел отображения активности, а через непродолжительное время постоянное сияние стало раздражать. Надо срочно сделать утилиту управления, чтобы выключить такую «забавную» функцию.

400x220  37 KB. Big one: 400x220  38 KB

[+] Три DIP переключателя задействуют парами аппаратные бонусы. SW2 – повышают напряжение Vgpu (до 1,17 В); Vmem (до 1,65 В). SW4 – Снимает защиту по потребляемому току. Повышение напряжения PLL. SW5 – выбор частоты работы PWM с 266 до 350 МГц.

[+] Подсистема питания карты для GPU

400x400  60 KB. Big one: 400x400  59 KB

Управление осуществляется ШИМ-контроллером uPI uP6225AM. Задействовано 6 каналов, то есть фактически он управляет только шестью фазами. Естественно, поддерживает протокол I2C, и разнообразные софтвольтмоды ему понятны.

400x400  49 KB. Big one: 400x400  51 KB

Из шести, с помощью драйверов uP6282AD, фазы размножаются до 12 штук. Это аппаратное решение, и неверно считать фазы только по количеству каналов основного PWM контроллера.

400x194  24 KB. Big one: 400x194  25 KB

Далее ток протекает через силовые ключи IRF6725 и IRF6723, в относительно новом корпусе DirectFet. Они способны рассеивать значительное количество тепла непосредственно в саму плату и не страдают повышенной хрупкостью, как Volterr’ы.

400x400  52 KB. Big one: 400x400  53 KB

[+] Питание памяти реализовано за счет трехфазного ШИМ-контроллера uP6207AI. Оба PWM обладают обширным списком современных функций, таких как адаптивная коррекция используемых фаз, компенсация понижения напряжений (Vdrop), плавная регулировка частоты, защиты уровня потребления тока и так далее. В качестве ключей для памяти установили все те же сборки из пары IRF6725 и IRF6723.

400x268  34 KB. Big one: 1000x669  165 KB

[+] Все выходные напряжения фильтруются танталовыми и полимерными (три на питание GPU, один на память) конденсаторами.

Общий вид на систему питания:

400x383  48 KB. Big one: 1000x958  327 KB

Итого: 12 фаз для графического ядра плюс 3 для памяти. Примечательно, что три разъема питания используются раздельно, крайний правый снабжает электричеством только память, остальные два соответственно GPU.

И традиционные снимки на память.

400x400  42 KB. Big one: 400x400  43 KB

Микросхема упакована под теплораспределяющую крышку на 22 неделе 2010 года. Как и полагается: А3 ревизии, модель GF100-375.

221x400  38 KB. Big one: 221x400  39 KB

Маркировка памяти - Samsung K4G10325FE HC04, 5 ГГц, 1,5 В.

Система охлаждения

Судя по названию - Twin Frozr, но по внутреннему строению она подверглась сильной модификации со времён выпуска R5870 Lightning и получила индекс III.

400x367  28 KB. Big one: 1000x918  160 KB

На протяжении долгого времени подход конструирования остаётся однотипным. Берём квадратное основание, делаем бороздки под тепловые трубки. По-хорошему запаиваем их. Ещё лучше, если их количество больше, чем у любого конкурента. Используем все доступное пространство под радиатор и наконец устанавливаем пару вентиляторов. Казалось бы, идеальное решение лежит на поверхности, но сразу возникает куча условий, с которыми приходится считаться.

300x201  11 KB. Big one: 1000x669  95 KB 300x201  12 KB. Big one: 1000x669  89 KB

Во-первых, основание обязано быть ровным, с чем у GTX 480 Lightning проблем нет. Качество полировки оценить сложно, поскольку она отсутствует как класс. Вместо полировочной машинки азиатские рабочие применили инструмент под названием фреза. Естественно, я не буду разводить дифирамбы о полезности идеальной полировки. Практическую ценность зеркальная поверхность не несёт, разве что только эстетическую.

400x189  15 KB. Big one: 1000x472  92 KB

Две из пяти трубок в диаметре 8 мм, против 5 мм для остальных. Все наполовину спрятаны в основании. Визуально трудно определить, припаяны ли они. Больше похоже, что использовался какой-то эпоксидоподобный клей.

300x120  11 KB. Big one: 1000x401  88 KB 300x120  11 KB. Big one: 1000x485  91 KB

Сверху на радиаторе расположены два вентилятора размером 92 мм, мощностью в 0.55 А 12 В.

400x268  10 KB. Big one: 1000x669  66 KB

Много больших вентиляторов – это, конечно, хорошо, но мониторинг отслеживает скорость вращения только одного, который расположен над GPU, о чем говорит недостающий кабель в разъёме.

Модули памяти и силовые элементы DC-DC преобразования охлаждаются чёрной алюминиевой пластиной, контактирующей через термопрокладки.

400x206  15 KB. Big one: 1000x514  83 KB

С обратной стороны аналогичная пластина выполняет чисто декоративную роль.

Послушать систему охлаждения:

MSI GTX 480 Lightning [2281 KB]

AMD HD 5970 [2943 KB]

AMD HD 6850 [1707 KB]

AMD HD 6870 [2154 KB]

Продолжение тут.

Выражаем благодарность компании MSI за предоставленную на тестирование видеокарту MSI GTX 480 Lightning.