Процессор Terascale
Intel Tera-Scale от Intel был исследовательский проект с микропроцессором для разработки с сотнями ядер. Такая архитектура - аналогично многоядерной архитектуре - называется « многоядерной ».
Процессор терамасштабирования был организован в виде плиток, так называемых плиток, при этом большинство плиток выполняли общие арифметические задачи. В терамасштабном процессоре было около 100 миллионов транзисторов, каждая ячейка содержала около 1,2 миллиона транзисторов. Он был представлен в 2007 году.
Структура плитки
Каждая плитка имела механизм обработки (PE) и переключатель на перекладине . Механизм обработки взял на себя арифметические задачи с помощью двух модулей FMAC и модуля с плавающей запятой . Кроме того, процессор имел 5 КБ локальной памяти. Переключатель перекладины использовался для связи с соседними плитками.
Некоторые дополнительные плитки были оптимизированы для специальных задач, таких как обработка видео высокой четкости , шифрование , цифровая обработка сигналов , ускорение физики или трехмерная компьютерная графика . Эти специализированные плитки работали более эффективно в соответствующей области задач, то есть быстрее и экономнее, чем неспециализированные плитки.
Структура памяти
Одна проблема, которая возникла с Terascale, заключалась в том, что большое количество ядер очень затрудняло подключение к памяти, поскольку, с одной стороны, необходимо было совместно использовать соединение для передачи данных, а с другой стороны, необходимо было координировать доступ к памяти. Для этой цели Intel использовала иерархическую кэш-память. Каждое ядро имеет собственный кэш L1 от 16 до 64 КБ. Кэш L2 размером от 256 КБ до 1 МБ совместно использовался небольшой группой ядер. Кэш L3 был доступен для всех основных групп процессора.
Кроме того, в Terascale использовался кэш L4 из памяти DRAM , который, однако, располагался не на одном кристалле процессора, а производился на собственном кристалле.
Затем кэш L4 был установлен в конструкции MCP рядом с процессором или в виде многослойной конструкции. Кроме того, программам был присвоен приоритет QoS, чтобы память могла быть зарезервирована для важных приложений. Объем памяти, который может использовать приложение, определялся динамически монитором ресурсов , который позволял операционной системе перемещать приложения в оптимальные блоки кэша.
скорость
Терамасштабный процессор достиг скорости более одного терафлопа в секунду, что сравнимо с суперкомпьютером ASCI Red 1996 года, который состоял из 10 000 процессоров Pentium Pro с тактовой частотой 200 МГц и общей мощностью 500 киловатт электроэнергии. потребление.
Тактовая частота в гигагерцах |
Напряжение ядра в вольтах |
Потребляемая мощность в ваттах |
Пропускная способность в терабит / с |
Вычислительная мощность в терафлопах |
---|---|---|---|---|
3,16 | 0,95 | 62 | 1,62 | 1.01 |
5.1 | 1.2 | 175 | 2,61 | 1,63 |
5,7 | 1,35 | 265 | 2,92 | 1,81 |
Смотри тоже
Индивидуальные доказательства
- ↑ Дж. Хелд, Дж. Баутиста, С. Кёль: От нескольких ядер ко многим: Обзор исследований в области тера-масштабных вычислений . (PDF) Intel 2006 г.