Logo Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware
Обучение от Mail.Ru Group.
Онлайн-университет
для программистов с
гарантией трудоустройства.
Набор открыт!
2006 г.

Intel Core 2 Extreme в действии

Евгений Рудометов, Виктор Рудометов
"IT News"

С развитием полупроводниковых технологий и совершенствованием внутренней архитектуры вычислительные возможности процессоров в сравнительно короткий срок возросли в десятки тысяч раз. Важнейшая же их характеристика — производительность — зависит от тактовой частоты, на которой работает ядро.

Ограничения частотного роста

С точки зрения пользователя, быстродействие процессора характеризуется временем выполнения определенного набора команд, последовательность которых образует компьютерную программу. Чем оно меньше, тем выше производительность. Иными словами:

производительность= (количество микрокоманд за такт) ×(тактовая частота)

Модели процессоров одного семейства, имеющие более высокие показатели тактовых частот, обладают и большей производительностью. Именно поэтому на протяжении сравнительно длительного времени повышение производительности процессора достигалось путем увеличения тактовых частот, на которых работают полупроводниковые ядра процессоров.

Однако безудержному росту тактовых частот препятствуют объективные физические законы, определяющие работу элементов уже нанометровых размеров. В ряду таких элементов нужно назвать прежде всего полупроводниковые транзисторы, изготовленные по технологии КМОП (CMOS). Параметры этих транзисторов (десятки миллионов которых составляют основу ядер процессоров) в значительной степени зависят от типоразмеров.

Изменение размеров определяется эволюцией технологических процессов, в соответствии с которыми осуществляется выпуск процессоров. Среди параметров, характеризующих техпроцесс, одним из основных выступают габариты полупроводниковых элементов (уменьшаемые каждые два года).

Совершенствование технологии и постепенное уменьшение размеров транзисторов способствуют улучшению их параметров, важнейшими из которых являются скоростные свойства. Благодаря уменьшению длины затвора в М раз пропорциональным образом возрастают частотные параметры и плотность размещения транзисторов.

Параметры Коэффициент
Длина затвора (X) 1/M
Ширина затвора (Y) 1/M
Толщина затвора (Z) 1/M
Плотность размещения M*M
Частота работы M
Напряжение 1/M

Таблица 1. Масштабирование транзисторов

Однако работающие на высоких частотах транзисторы, десятки миллионов которых расположены на очень малой площади полупроводникового кристалла, оказывают друг на друга негативное влияние. Это влияние можно легко проиллюстрировать на примере расположенных рядом проводников, соединяющих элементы в ядре процессора (рис. 1).

Рис. 1. Взаимное влияние проводников, соединяющих элементы в ядре

Данные проводники обладают взаимной емкостью, которая, как известно, зависит от расстояния между проводниками и площади обращенных друг к другу сторон и вычисляется по известной формуле:

C = k × S / d,

где С — емкость, S — площадь, d — расстояние, k — коэффициент диэлектрической проницаемости среды.

Взаимная емкость способствует появлению неконтролируемых токов: на высоких частотах образованный проводниками конденсатор обладает проводимостью. Оценивая поведение приведенной схемы на высоких частотах, нельзя не заметить, что размеры проводников малы, но мало и расстояние между ними.

Учитывая же величины частот, а также количество таких проводников, составляющее многие миллионы, можно утверждать, что их влиянием на частотные свойства внутренних структур процессорного ядра нельзя пренебрегать. Особенно если принять во внимание то обстоятельство, что каждый проводник обладает еще и активным сопротивлением, и индуктивностью (рис. 1). Остается добавить, что и активные (резисторы), и реактивные (емкости, индуктивности) составляющие полного импеданса являются распределенными по всей длине проводников, что многократно усложняет описание и поведение подобных систем на высоких частотах.

Однако ситуация является еще более сложной, особенно если вспомнить, что описанная система находится не в вакууме, а между проводниками находятся вещества, обладающие определенными диэлектрическими свойствами, влияющими на величины взаимных емкостей.

Из приведенного рисунка должно быть понятно, почему конструкторы стремятся использовать для изоляции элементов полупроводниковых микросхем материалы с меньшей величиной диэлектрической проницаемости (k). Кроме топологии проводников, необходимо учитывать и влияние самих транзисторов. Каждый из них, обладая собственными емкостными и индуктивными характеристиками, искажает высокочастотные сигналы и способствует росту токов утечки.

Кроме того, транзисторы являются активными элементами: оказывая электромагнитное воздействие на близлежащие элементы, они, в свою очередь, сами испытывают аналогичное влияние от соседних цепей. Входящие же в состав транзисторов p-n-переходы способны осуществлять непредусмотренное детектирование наведенных токов, их усиление и последующую передачу.

Общая картина многократно усложняется, если учесть, что размеры транзисторов уже достигли тех значений, когда все большее влияние начинают оказывать квантовые эффекты. Миниатюризация полупроводниковых элементов, работающих на сверхвысоких частотах в условиях значительных электромагнитных помех, обусловливает стремительный рост неуправляемой составляющей токов в электронных схемах.

Здесь следует напомнить, что для сохранения устойчивости работы электронных схем токи, контролируемые работающими элементами, должны быть больше неуправляемых токов утечки. В результате негативных явлений, порождаемых процессами миниатюризации, неуправляемые токи, основу которых составляют токи утечки, а также паразитные токи, связанные с ростом частоты переключения транзисторов, препятствуют снижению теплообразования процессоров за счет миниатюризации элементов. Это означает, что ожидаемого существенного снижения теплообразования не происходит, несмотря на уменьшение напряжения питания, достигнутое благодаря уменьшению типоразмеров транзисторов.

Доля указанной неконтролируемой части электрического тока, и без того довольно значительная, еще более увеличивается с ростом частоты.

Однако обратная сторона частотного роста — опять же сравнительно быстрое увеличение теплообразования процессоров. Учитывая же тот факт, что площадь кристалла процессора практически остается постоянной, рост теплообразования способствует увеличению плотности энергии. Высокая же мощность теплообразования сопровождается перегревом внутренних структур процессора, что негативно сказывается на работоспособности, а также усиливает и ускоряет процессы деградации полупроводников.

Регулирование энергопотребления

В попытках решить проблему снижения энергопотребления своих изделий, конструкторы принялись встраивать в ядра специальные цепи (их функционирование поддержано системным программным обеспечением), которые регулируют работу процессоров и обеспечивают, в зависимости от вычислительной нагрузки и условий эксплуатации, установку оптимальных электрических и частотных режимов. То есть в случае снижения вычислительной нагрузки происходит уменьшение тактовой частоты работы ядра.

Кстати, при снижении тактовой частоты процессора ниже штатной величины напряжение питания его ядра может быть соответствующим образом снижено без нарушения устойчивости работы системы, и это позволяет снизить теплообразование процессора. Будучи стандартными для портативных компьютеров, такие операции, выполняемые в автоматическом режиме аппаратно-программным обеспечением, предназначены для экономии энергии батарей. Однако понижение напряжения и частоты уже используется и для моделей серверного сектора, и сектора настольных компьютеров, что позволяет не только уменьшить энергопотребление, но и существенно снизить тепловую нагрузку на полупроводниковые кристаллы ядер процессоров.

Для оценки эффективности подобных технологий для снижения тепловой нагрузки на ядро процессора целесообразно воспользоваться следующей формулой:

P ≈ C × V2 × F,

где P — тепловая мощность процессора, С — коэффициент, учитывающий взаимную емкость элементов ядра процессора и зависящий от архитектуры его ядра (обычно возрастает с увеличением плотности размещения элементов на кристалле микросхемы), V — напряжение питания ядра, F — тактовая частота.

Данное выражение легко приводится к следующему виду:

В этом уравнении, связывающем основные характеристики теплообразования, переменные с индексом k обозначают соответствующие параметры изменяемых режимов, а переменные с нулевым индексом — параметры штатного режима.

Приведенная формула показывает, что уменьшение тактовой частоты и, как следствие, возможность уменьшения напряжения питания обеспечивают значительное снижение мощности теплообразования.

Так, например, 20%-ное уменьшение тактовой частоты и напряжения уменьшает теплообразование в два раза. Снижение же производительности можно компенсировать использованием нескольких ядер.

В результате, как показывают расчеты и практическая реализация, замена верхних моделей на процессоры с несколькими ядрами способна обеспечить существенный прирост производительности при приемлемом теплообразовании. (Первые такие процессоры, ориентированные на сектор настольных компьютеров и созданные на основе архитектуры NetBurst, вывела на рынок Intel.)

Дальнейшего снижения энергопотребления можно достичь простым переходом на архитектуру процессоров Intel Pentium M или более совершенную Intel Core Duo с соответствующим увеличением тактовых частот до уровня производительности Intel Pentium 4.

Но конструкторы корпорации Intel пошли другим путем.

Intel Core Microarchitecture

Специалисты Intel предложили новую архитектуру, обеспечивающую эффективное снижение показателя Energy per Instruction (энергии, затраченной на выполнение одной инструкции). Данная архитектура, предоставляющая возможность реализации производительных экономичных многоядерных процессоров, получила наименование Intel Core Microarchitecture. Создана она группой конструкторов, ранее разработавших архитектуру ядра Banias. И хотя новинка, по мнению многих специалистов, ведет свою родословную от архитектуры P6, реализованной в Intel Pentium Pro и Pentium II/III, она является отдельной разработкой (рис. 2).

Рис. 2. Эволюция архитектуры x86

В продуктах, созданных на основе Intel Core Microarchitecture, нашли свое воплощение многие инновационные технологии, в частности Intel Wide Dynamic Execution, Intel Advanced Smart Cache, Intel Smart Memory Access, Intel Advanced Digital Media Boost, Intel 64 Technology, Intel Intelligent Power Capability. Данная архитектура стала основой для двухъядерных процессоров всех сегментов рынка ПК — настольных (Conroe), ноутбуков (Merom) и серверов (Woodcrest).

Conroe

На основе Intel Core Microarchitecture для рынка настольных компьютеров корпорация недавно выпустила ряд моделей двухъядерных процессоров, получивших наименование Intel Core 2 Duo (ранее известных как Conroe). Основные компоненты ядер процессора Intel Core 2 Duo представлены на рис. 3.

Рис. 3. Основные компоненты ядер процессора Intel Core 2 Duo

Intel Core 2 Duo — уже третье поколение двухъядерных процессоров Intel для ПК (напомним, что к первому поколению относятся модели Intel Pentium D, разработанные для настольных решений, а ко второму — Intel Core Duo для мобильных ПК).

Все выпущенные в настоящее время процессоры Intel Core 2 Duo, ориентированные на рынок настольных систем, созданы по технологии 65 нм и работают с процессорной шиной, унаследованной от своих предшественников. Для новых процессоров тактовая частота шины составляет 266 МГц, что обеспечивает передачу данных с частотой 1066 МГц и пиковый поток 8,5 Гбайт/с.

За исключением процессоров начального уровня, все модели оснащены 4 Мбайт кэш-памяти второго уровня (L2). Весь объем памяти доступен обоим ядрам, интегрированным в состав каждого из процессоров. Кэш-память первого уровня (L1) у всех моделей одинакова и составляет 32 Кбайт для инструкций (L1 Code) и 32 Кбайт для данных (L1 Data). Все модели поддерживают 64-битные расширения Intel Enhanced Memory 64 Technology (EM64T), SIMD инструкции SSE, SSE2 и SSE3, технологию виртуализации — Intel Virtualization Technology (VT) и бит Execute Disable, участвующий в системе информационной защиты. И, кроме того, поддерживают технологии управления энергопотреблением Enhanced Intel SpeedStep, Thermal Monitor 2. Основные параметры недавно выпущенных моделей для настольных систем представлены в таблице 2.

Модели процессоров Тактовая частота ядра, ГГц Частота системной шины, ГГц Кэш-память L2, Мбайт
Intel Core 2 Extreme X6800 2,93 1066 4
Intel Core 2 Duo E6700 2,66 1066 4
Intel Core 2 Duo E6600 2,40 1066 4
Intel Core 2 Duo E6400 2,13 1066 2
Intel Core 2 Duo E6300 1,86 1066 2

Таблица 2. Процессоры архитектуры Intel Core Microarchitecture для настольных ПК

Процессоры Intel Core 2 Duo, разработанные для настольных ПК, поддерживаются рядом наборов микросхем системной логики (чипсетами), среди которых семейство Intel 965 и Intel 975X.

Семейство наборов микросхем Intel 965 Express, ориентированное на массовые компьютеры (Mainstream Desktop), включает в себя варианты с графическим решением GMA3000, поддерживающим технологию Intel Clear Video.

Чипсет Intel 975X, разработанный для высокопроизводительных систем (Performance Desktop), поддерживает частоту передачи данных 1066 МГц, технологии повышения производительности подсистемы оперативной памяти и две видеокарты PCI Express x8/x16, способные работать параллельно. Данные наборы микросхем соответствуют требованиям ОС Microsoft Windows Vista Premium.

Производительность

Новая процессорная архитектура, реализующая перечисленные выше технологии, обеспечивает двухъядерным процессорам высокий уровень производительности при значительном сокращении энергопотребления, а следовательно, и теплообразования. В материалах, представленных на весенних сессиях Intel Developer Forum, фигурирует 40-процентное повышение производительности при таком же снижении теплообразования.

Теплообразование, как известно, определяется показателем TDP (Thermal Design Power — максимальная мощность теплообразования микросхемы). Для верхней модели в настоящее время он соответствует 75 Вт, для остальных — 60 Вт. Эти значения существенно ниже аналогичных показателей двухъядерных предшественников, в которых TDP достигал 130 Вт.

Что же касается производительности, обеспечиваемой процессорами с новой архитектурой, то ее оценку целесообразно осуществить в процессе тестирования. В качестве объекта тестирования была использована модель Intel Core 2 Extreme X6800, обеспечивающая наивысший уровень производительности среди процессоров Intel, выпущенных в настоящее время для сектора настольных компьютеров.

В роли эталона в исследовании выступил Intel Pentium D 820 на базе архитектуры NetBurst, относящийся к предыдущему поколению двухъядерных процессоров, разработанных для настольных компьютеров. Эта модель входит в группу продуктов с кодовым именем Smithfield и создана по технологии 90 нм. Тактовая частота работы ядер — 2,8 ГГц, кэш-память L1 Data имеет объем 16 Кбайт, L1 Trace — 12 Kuops, L2 — 1024 Кбайт.

В качестве основы тестовой системы использована материнская плата Intel D975XBX, созданная на основе «топового» чипсета Intel 975X. Основные параметры данной платы приведены в таблице 3.

Элементы и подсистемы Параметры
Процессор Intel Core 2 Extreme / Duo, Pentium Extreme Edition / D / 4 c LGA775 и шиной 1066/800 МГц
Чипсет Northbridge: Intel 82975X (MCH); Southbridge: Intel 82801GR (ICH7R)
Оперативная память Два канала, четыре DIMM DDR2 667/533 SDRAM, ECC/non-ECC.
Максимальный объем — до 8 Гбайт
Видео 1–3 видеоадаптера в слотах стандарта PCI Express x16
(электрические — x16/x8, x8, x4), поддержка ATI CrossFire
Аудио HD Audio, до восьми каналов
IDE Один порт IDE (два устройства) с UltraDMA 100/66/33
Serial ATA Четыре порта Serial ATA II (300 Мбайт/с) c поддержкой RAID;
четыре порта Serial ATA (150 Мбайт/с) c поддержкой RAID
USB 2.0 Восемь портов USB 2.0/1.1 (четыре — через кабель)
IEEE1394 Два порта IEEE1394a (один — через кабель)
LAN Gigabit (10/100/1000 Mбит/c) LAN с реализацией посредством Intel 82573L Gigabit Ethernet Controller
Порты задней панели Порты PS/2 клавиатуры и мыши; один параллельный порт LPT; один последовательный порт COM; четыре порта USB 2.0/1.1; один порт IEEE 1394a; один порт RJ45; один Coaxial Digital Line Out; один Optical Digital Line Out; пять разъемов аудио
Слоты Три слота конструктива PCI Express x16; два слота PCI
Форм-фактор ATX, размеры платы: 305×244 мм

Таблица 3. Основные параметры материнской платы Intel D975XBX

В ходе тестирования оба процессора — исследуемый Intel Core 2 Extreme X6800 и эталонный Intel Pentium D 820 — корректно опознавались как двухъядерные процессоры.

Результаты выполнения теста 3DMark06 (CPU score) представлены в таблице 4 и на рис. 4.

Модели процессоров 3DMark06 (CPU score)
Intel Pentium D 820 1326
Intel Core 2 Extreme X6800 2468

Таблица 4. Результаты тестов 3DMark06 (CPU score)

Рис. 4. Результаты тестов 3DMark06 (CPU score)

Одно из важных достоинств систем с двухъядерными процессорами — возможность одновременной работы с несколькими программами. В преимуществах новой архитектуры и созданных на ее основе моделей процессоров можно убедиться на примере теста CPUmark99. Это исследование позволяет запустить несколько копий и загрузить оба ядра каждого из применяемых процессоров.

Результаты выполнения нескольких копий теста CPUmark99 процессором Intel Core 2 Extreme X6800 приведены в таблице 5, процессором Intel Pentium D 820 — в таблице 6.

Intel Core 2 Extreme X6800 CPUmark99 № 1 CPUmark99 № 2 CPUmark99 № 3 CPUmark99 № 4 Сумма
1×CPUmark99 403       403
2×CPUmark99 375 407     782
3×CPUmark99 220 378 212   810
4×CPUmark99 210 221 190 195 816

Таблица 5. Результаты выполнения 1—4 копий теста CPUmark99 процессором Intel Core 2 Extreme X6800

Intel Pentium D 820 CPUmark99 № 1 CPUmark99 № 2 CPUmark99 № 3 CPUmark99 № 4 Сумма
1×CPUmark99 154       154
2×CPUmark99 135 165     300
3×CPUmark99 165 71,3 72,7   309
4×CPUmark99 135 66,8 58,7 57,5 318

Таблица 6. Результаты выполнения 1—4 копий теста CPUmark99 процессором Intel Pentium D 820

Значения сумм в графическом виде представлены на рис. 5.

Рис. 5. Результаты выполнения нескольких копий теста CPUmark99

Приведенные результаты тестирования иллюстрируют преимущества Intel Core Microarchitecture над предшествующей архитектурой NetBurst. Действительно, модель Intel Core 2 Extreme X6800 при превышении на 4,6 % внутренней тактовой частоты по сравнению с Intel Pentium D 820 в тесте 3DMark06 (CPU score) демонстрирует на 86 % большую производительность в сравнении с предшественником.

Не менее интересны результаты одновременного выполнения нескольких копий CPUmark99. В случае запуска одной копии превышение составляет 162%, при двух — 161%. С ростом числа копий теста CPUmark99 преимущество в производительности процессора новой архитектуры сохраняется.

В заключение необходимо напомнить, что в тестах использовался инженерный сэмпл модели Intel Core 2 Extreme X6800, а, как показывает опыт, по мере совершенствования технологии и внутренней архитектуры параметры процессоров улучшаются.

Остается добавить, что процессоры, созданные по новой архитектуре, характеризуются весьма низким теплообразованием, что позволяет создавать на их базе компьютеры с низким уровнем акустического шума.

Процессор Intel Core 2 Extreme X6800
и материнская плата Intel D975XBX
предоставлены московским офисом корпорации Intel

Новости мира IT:

Архив новостей

Последние комментарии:

Релиз ядра Linux 4.14  (6)
Пятница 17.11, 16:12
Apple запустила Pay Cash (2)
Четверг 09.11, 21:15
Loading

IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей PR-акции, размещение рекламы — adv@citforum.ru,
тел. +7 985 1945361
Пресс-релизы — pr@citforum.ru
Обратная связь
Информация для авторов
Rambler's Top100 TopList liveinternet.ru: показано число просмотров за 24 часа, посетителей за 24 часа и за сегодня This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2015 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...