Процессор Terascale

Intel Tera-Scale от Intel был исследовательский проект с микропроцессором для разработки с сотнями ядер. Такая архитектура - аналогично многоядерной архитектуре - называется « многоядерной ».

Процессор терамасштабирования был организован в виде плиток, так называемых плиток, при этом большинство плиток выполняли общие арифметические задачи. В терамасштабном процессоре было около 100 миллионов транзисторов, каждая ячейка содержала около 1,2 миллиона транзисторов. Он был представлен в 2007 году.

Структура плитки

Каждая плитка имела механизм обработки (PE) и переключатель на перекладине . Механизм обработки взял на себя арифметические задачи с помощью двух модулей FMAC и модуля с плавающей запятой . Кроме того, процессор имел 5  КБ локальной памяти. Переключатель перекладины использовался для связи с соседними плитками.

Принципиальная принципиальная схема движка обработки
Специализированная плитка в терашкале

Некоторые дополнительные плитки были оптимизированы для специальных задач, таких как обработка видео высокой четкости , шифрование , цифровая обработка сигналов , ускорение физики или трехмерная компьютерная графика . Эти специализированные плитки работали более эффективно в соответствующей области задач, то есть быстрее и экономнее, чем неспециализированные плитки.

Структура памяти

Одна проблема, которая возникла с Terascale, заключалась в том, что большое количество ядер очень затрудняло подключение к памяти, поскольку, с одной стороны, необходимо было совместно использовать соединение для передачи данных, а с другой стороны, необходимо было координировать доступ к памяти. Для этой цели Intel использовала иерархическую кэш-память. Каждое ядро ​​имеет собственный кэш L1 от 16 до 64 КБ. Кэш L2 размером от 256 КБ до 1 МБ совместно использовался небольшой группой ядер. Кэш L3 был доступен для всех основных групп процессора.

Кроме того, в Terascale использовался кэш L4 из памяти DRAM , который, однако, располагался не на одном кристалле процессора, а производился на собственном кристалле.

Затем кэш L4 был установлен в конструкции MCP рядом с процессором или в виде многослойной конструкции. Кроме того, программам был присвоен приоритет QoS, чтобы память могла быть зарезервирована для важных приложений. Объем памяти, который может использовать приложение, определялся динамически монитором ресурсов , который позволял операционной системе перемещать приложения в оптимальные блоки кэша.

скорость

Терамасштабный процессор достиг скорости более одного терафлопа в секунду, что сравнимо с суперкомпьютером ASCI Red 1996 года, который состоял из 10 000 процессоров Pentium Pro с тактовой частотой 200  МГц и общей мощностью 500 киловатт электроэнергии. потребление.

Тактовая частота
в гигагерцах
Напряжение ядра
в вольтах
Потребляемая мощность
в ваттах
Пропускная способность
в терабит / с
Вычислительная мощность
в терафлопах
3,16 0,95 062 1,62 1.01
5.10 1.20 175 2,61 1,63
5,70 1,35 265 2,92 1,81

Смотри тоже

Индивидуальные доказательства

  1. Дж. Хелд, Дж. Баутиста, С. Кёль: От нескольких ядер ко многим: Обзор исследований в области тера-масштабных вычислений . (PDF) Intel 2006 г.