Подробности о процессоре Tegra K1

Редакция

Новости Hardware 9 янв. 2014, 13:21 Mindango

Версия на базе ядер Denver может заинтриговать.

В понедельник компания NVIDIA провела прямую трансляцию мероприятия, на котором публике был представлен процессор Tegra K1 с 192 ядрами CUDA (архитектура Kepler). В прошлом данное решение неоднократно упоминалось под кодовым именем Logan или Tegra 5, но NVIDIA решила отказаться от устоявшейся системы наименований и фактически начала нумерацию заново.

По словам Дженсена Хуана, "Tegra 5" было бы слишком прямолинейным названием. Здесь чувствуется некий замысел – Tegra K1 должен олицетворять эволюционный шаг на пути развития мобильных решений NVIDIA, а не очередной виток экстенсивного наращивания вычислительного быстродействия. Действительно, с этого момента все мобильные процессоры NVIDIA будут иметь графическую подсистему с архитектурой идентичной той, что применяется в настольных системах. Кроме того, Tegra K1 станет первой реализацией проекта Denver – собственного варианта архитектуры ARM компании NVIDIA.

Как мы знаем, Tegra K1 будет представлен в двух версиях. Производство первой стартовало в конце декабря, в этом квартале начнутся поставки OEM-производителям, а в первой половине текущего года появятся и серийные устройства на основе этого процессора. Эта конфигурация основана на четырёх вычислительных ядрах ARM Cortex-A15.

Никуда не делось и пятое ядро-компаньон, которое включается для обработки задач в фоновом режиме. Например, если устройство находится в режиме сна, компаньон будет проверять и обновлять электронную почту. Важно, что все пять ядер не могут работать одновременно – допускается активность не более четырёх, включая компаньон.

Так выглядит версия Tegra K1 с ядрами Cortex-A15

Кстати говоря, микроархитектура Cortex-A15 в Tegra K1 имеет версию r3p3, в то время как в Tegra 4 используется версия r2p1. ARM регулярно обновляет свои решения, исправляя ошибки и иногда улучшая быстродействие. В случае с Tegra K1 улучшения коснулись, главным образом, энергетической эффективности – ARM предусмотрела возможность отключения более мелких неиспользуемых цепей схемы (данная технология энергосбережения зовётся "Clock Gating").

В сочетании с переходом на новую технологию производства – 28 нм HMP – процессор Tegra K1 должен обеспечить лучшее быстродействие в сравнении с Tegra 4 при аналогичном уровне энергопотребления или аналогичное быстродействие при меньшем расходе питания. Максимальная частота вычислительных ядер в Tegra K1 увеличена с 1.9 до 2.3 ГГц (не зависит от количества активных ядер), прирост производительности при этом достигнет 20% над Tegra 4. Для ядра-компаньона определена максимальная частота 1 ГГц. Доступ к памяти осуществляется посредством 64-разрядного контроллера LPDDR3.

О ядрах Denver, которые используются во второй версии процессора Tegra K1, информации предоставлено немного. Интересно, что четыре ядра Cortex-A15 вместе с компаньоном были заменены двумя более крупными ядрами. Вероятно, они характеризуются намного более высоким показателем IPC ("инструкций за такт"). Для ядер заявлена максимальная частота 2.5 ГГц.

Ранние слухи называли Denver вариантом архитектуры x86 с использованием двоичной трансляции – эмуляции одного набора инструкций на другом. Считалось, что Denver может "понимать" инструкции x86 и переводить их в собственный формат. Что характерно, при использовании оптимизирующих механизмов скорость выполнения переведённого кода могла превосходить оригинал.

Авторы сайта AnandTech полагают, что основная идея Denver не изменилась, однако вместо x86 процессор научился понимать 64-разрядную версию ARMv8. С хорошим механизмом преобразования кода Denver может получать на исполнение команды, которые уже оптимизированы для максимальной параллельности, а за счёт этого можно добиться и увеличения быстродействия без наращивания числа ядер, и снижения энергопотребления, что особенно важно в случае с мобильными устройствами.

К сожалению, сама NVIDIA подробностями о Denver не разбрасывается, поэтому пока на эту тему можно вести лишь пространные рассуждения. Будем надеяться, что NVIDIA уложится в срок и начнёт поставки процессоров Tegra K1 с ядрами Denver во второй половине года. Кстати говоря, обе версии Tegra K1 будут совместимы на уровне выводов.

Графическая подсистема Tegra K1 в обоих случаях одинакова. Она насчитывает 192 ядра CUDA – это один полноценный блок SMX, перекочевавший из настольных графических решений поколения Kepler практически без изменений. Кстати, Дженсен Хуан давно говорил, что Kepler выйдет за пределы обычных видеокарт и найдёт применение в различных вещах вроде сверхтонких компьютеров и мобильных устройств.

Один блок SMX включает не только 192 ядра CUDA, но и 4 блока растеризации и 8 текстурных блоков (у настольной версии их 16). Возможно выполнение операций с плавающей запятой с числами двойной (FP64) и одинарной точности (FP16) – между ними наблюдается соотношение 1/24. Между тем, самые большие изменения коснулись межсоединений, осуществляющих взаимодействия между частями GPU.

Архитектура Kepler хорошо знакома нам по настольным видеокартам

Большие процессоры Kepler должны уметь эффективно перемещать данные между блоками растеризации, SMX и контроллерами памяти. С мобильном решении сложная сеть межсоединений не требуется, однако отказ от неё в Tegra K1 огранивает возможности масштабирования (впрочем, это трудно назвать недостатком). NVIDIA также поработала над улучшением работы механизма Clock Gating и провела некоторые другие оптимизации для снижения энергопотребления.

Текстурные блоки были награждены поддержкой технологии адаптивного масштабируемого сжатия текстур (ASTC). Это, как считает NVIDIA, необходимо для уменьшения зависимости быстродействия GPU от пропускной способности памяти, причём не только в трёхмерных приложениях, но и при отображении пользовательского интерфейса.

NVIDIA уверяет, что консольные и компьютерные игры могут работать на Tegra K1 без проблем. Более того, по вычислительной мощи этот процессор способен потягаться с приставками Xbox 360 и PlayStation 3. Во всяком случае, портированная версия Serious Sam 3 на Tegra K1 работала достаточно хорошо.

От основного блюда мы плавно переходим к соусам и приправам, которых в Tegra K1 в изобилии. Прежде всего, это улучшенный процессор обработки изображений (ISP) третьего поколения, которых в Tegra K1 встроено две штуки. Каждый ISP поддерживает камеры с разрешением до 100 мегапикселей и может обрабатывать до 600 мегапикселей в секунду (14-разрядный вход).

Поддерживается до 4096 точек фокусировки, составляющих массив 64 х 64, улучшены функции подавления шума, добавилась поддержка Chimera 2.0 – новой версии "вычислительной фотографии" – и многого другого.

Tegra K1 поддерживает кодирование и декодирование видео с разрешением 3840 на 2160 точек при 30 кадрах в секунду (кодек H.264), также заявлен H.265, однако он не поддерживается на аппаратном уровне полностью. Для вывода изображения на экран (максимальное разрешение составляет 3840 на 2160 точек) могут использоваться интерфейсы eDP 1.4, LVDS и HDMI 1.4b.

Наконец, Tegra K1 поддерживает большой набор коммуникационных интерфейсов. Есть 3 порта USB 2.0, 2 порта USB 3.0, eMMC 4.5.1 и четыре линии PCI Express.

Для подготовки заметки были использованы материалы сайта AnandTech, доступные на этой странице.

#nvidia #kepler #tegra k1

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные статьи