Среднестатистический пользователь - тот самый, покупающий компьютер в магазине, при выборе процессора обычно обращает внимание лишь на его торговую марку, тактовую частоту, ну и еще, быть может, на объем кэша. Нельзя сказать, будто это неправильно - просто за бесконечными анонсами и представлениями новых моделей процессоров мы забываем, что любой из них является сложнейшим электронным устройством, за которым стоит не один год кропотливой работы многих исследователей, ученых и разработчиков.
Если обратиться к Большой Советской Энциклопедии, то в ней говорится, что "микропроцессор - это электронное устройство, выполненное в виде интегральной микросхемы и состоящее из цепей управления, регистров, сумматоров, счетчиков команд, а также очень быстрой памяти малого объема". Данное определение, несмотря на свой почтенный возраст, согласитесь, остается вполне актуальным. В этой статье мы расскажем о технологиях производства микропроцессоров, а также о тех достижениях, без которых современный процессор в вашем компьютере не был бы таким, какой он есть.
Его величество транзистор
Ключевое словосочетание в определении из БСЭ - "интегральная микросхема", ведь именно возможность создавать высокоинтегрированные электронные схемы позволила вычислительной технике развиваться столь стремительными темпами. Многим известно, что до применения транзисторов существовали ламповые компьютеры, но их габариты, сложность обслуживания и быстродействие было на абсолютно доисторическом уровне. В любом случае, появлению полупроводниковых устройств мы обязаны в первую очередь общепризнанным изобретателям транзистора - исследователям Bell Labs - Джону Бардену, Уолтеру Брэттэну и Уильяму Шокли (J.Barden, W.Brattain, W.B.Shockley). Почему "общепризнанным"? Дело в том, что за много лет до того, в 1922 году, наш соотечественник, радиолюбитель из Нижнего Новгорода - 19-летний Олег Лосев создал первый в мире полупроводниковый усилитель! И это еще не все - после недолгих экспериментов молодой Левша сконструировал на основе своего изобретения приемник и назвал его "кристадин" (от слова кристалл). Важным моментом в этой истории является тот факт, что изобретение Лосева не было незамеченным - о его кристадинах в те времена писала вся научная пресса, называя новое изобретение не иначе как "переворот в радиоэлектронике, вытесняющий вакуумную лампу". Поэтому к вкладу в становление основ современной микроэлектроники в немалой степени причастны и российские исследователи. Впрочем, важность открытия ученых из лаборатории Bell тоже нельзя недооценивать, ведь переворот, о котором так много писали в 1930-е годы, свершился только через четверть века, когда физика твердого тела доросла до уровня кристадина и смогла объяснить суть явлений, происходивших в нем.
Революционное значение транзистора - в его малых размерах, ведь объединение большого числа транзисторов на единой подложке позволило сначала создавать отдельные функциональные узлы, чуть позже процессоры, а теперь и законченные интегрированные устройства. Одновременно уменьшались габариты вычислительных машин, и возрастала их производительность.
Для того чтобы наглядно представлять принцип работы современных процессоров, что называется "из сердца", стоит рассказать, как они производятся. Поэтому мы кратко коснемся технологии выращивания микросхем.
Главный материал при полупроводниковом производстве - кремний, самый распространенный полупроводник на Земле. Именно из него создают подложки современных микросхем. Для этой цели применяется химически чистый кремний, который переплавляется в большие цилиндрические заготовки. После множества дополнительных химических чисток монокристалл кремния разрезается на тончайшие пластины - именно они в будущем и послужат подложкой для изготовления кристаллов процессоров.
До недавнего времени стандартом при производстве кремниевых пластин являлся типоразмер 200 мм, однако сейчас все больше компаний переходит на заготовки с диаметром 300 мм. Необходимо отметить, что использование 300-мм заготовок выгодно, в первую очередь, с экономической точки зрения, так как в этом случае сокращается производственный цикл - указанные стадии для одного и того же количества создаваемых процессоров производятся реже. Кроме того, переход от 200-мм пластин к 300-мм, дает увеличение их эффективной площади на 240%.
По данным компании Intel, одна только экономия воды, задействованной при шлифовке и полировке кремниевых пластин, достигает 40%. Экономия электроэнергии также довольно высока. В целом, ввод в эксплуатацию оборудования, рассчитанного на использование увеличенных пластин, сказывается на себестоимости готовой продукции, позволяя экономить около 30% на технологических ресурсах и около 50% - на снижении трудозатрат. Поэтому многие компании активно переориентируют свое производство под новый типоразмер.
Однако вернемся к процессу производства микросхем. Одним из первых этапов производства микропроцессоров является воздействие на заготовку кислородом, которое происходит под высокой температурой. Таким образом, на поверхности заготовки создается тончайший слой диоксида кремния. Затем на полученную механически защищенную пластину наносят специальные обозначения, по которым позже пластина будет позиционироваться в экспонирующих аппаратах. Следующий наносимый слой - фоторезист (светочувствительное вещество, которое при облучении становится растворимым в определенных веществах). Именно это его свойство используется для того, чтобы "открыть" слой кремния в необходимых местах для последующей обработки.
Полученная фоточувствительная заготовка устанавливается, по нанесенным заранее разметкам, в специальный экспонометр, с помощью которого на пластине формируется первичное изображение. Негативом в экспонометре служит прецизионная маска, она обычно больше пластины и создается отдельно для каждого слоя микропроцессоров (их несколько). В основе ее создания лежит эффект отрыва электронов с поверхности металла, позволяющий бомбардировкой электронов создавать на кварцевом стекле хромовые рисунки, служащие впоследствии негативом.
В результате засвеченный слой, чьи структура и химические свойства изменились под действием излучения, а также находящийся под ним слой диоксида кремния могут быть удалены с помощью химикатов, методом травления (каждый слой - своим химикатом). Так изготовляются профили, где каждый выступ представляет собой одну из составных частей интегральной микросхемы - транзисторов, формирующих логические блоки создаваемого процессора.
В наиболее современных процессорах компании Intel, на базе ядра Prescott применяется семь слоев металлизации (в Northwood - шесть), которые организуют необходимые электрические связи между блоками процессора. Наведения электрических связей в кристалле также производятся методом фотолитографии - в пластине производятся новые выемки, куда закладывают алюминий или медь. Медь является более выгодным электрическим и термопроводящим элементом, однако на пути ее внедрения в микропроцессор возникла определенная проблема, давшая почву для размышлений о скором конце кремниевой технологии. Суть проблемы в том, что в нормальных условиях медь не образует электрический контакт с кремнием. Однако после более глубоких исследований ученым удалось найти способ соединения с применением сверхтонкой полимерной разделительной области между кремниевой подложкой и медными проводниками, предотвращающей диффузию этих материалов.
Чтобы отделить готовый слой от создаваемого, на первичное изображение микросхемы напыляется новый слой диоксида кремния. После этого на него наносится еще один слой поликристаллического кремния и новый фотослой. Далее при помощи следующей фотомаски создается рельеф второго слоя, который путем высвечивания фоторезиста и последующего его травления организует на микросхеме рабочие элементы "второго этажа". Потом на микросхему вновь наносится слой металлизации, таким образом, цикл повторения замыкается и может продолжаться далее. При создании современных процессоров обычно наносится порядка 20 слоев.
Конечный этап при производстве процессоров - разрезание плиты кристаллов, монтировка их в корпуса, подключение к сокетным выводам, тесты и, наконец, упаковка.
Литография - скромный попутчик больших революций
Одним из способов увеличения стабильности работы чипа на более высоких частотах является переход к более низким проектным нормам. Сам по себе этот путь очень дорогой, и не только потому, что заключается в модернизации парка производственного оборудования, но и в виду сложных научных исследований, предшествующих ему. Не секрет, что, скажем, компания Intel тратит на развитие научной базы десятки миллионов долларов в год. Кроме, собственно, исследований полупроводниковых материалов и новых схеморешений ведутся разработки и в параллельных областях науки, например, в квантовой физике, так как если для фотолитографии при процессе 0,35 мк использовались ртутные лазеры с длиной волны 0,365 мк, то в технологии 0,25 мк принимали участие лазеры на основе ультрафиолета хлорида криптона с длиной волны 0,248 мк. Сегодня эти показатели еще больше приблизились к показателям рентгеновского излучения.
Для техпроцессов следующего за 90-нм технологией поколения - 65 нм, 45 нм и 32 нм - возникает необходимость использования более совершенного литографического оборудования. Дело в том, что применяемые в настоящее время литографические аппараты, при переходе к более тонким технологическим нормам, вряд ли смогут обеспечить необходимую "жесткость" излучения и должный уровень разрешающей способности при формировании проекции маски-шаблона. Длина волн 248 нм или 193 нм, которые применяются в сканерах и степперах для производства микросхем с уровнем детализации 90 нм, недостаточна для перехода к более тонким нормам. Поэтому изготовители литографического оборудования и их заказчики находятся в поиске рационального решения. Им приходится выбирать между весьма дорогостоящими инструментами нового поколения с длиной волны 157 нм и альтернативными методиками.
Само по себе внедрение 157-нм литографии сопряжено с рядом трудностей, в частности, с отсутствием методики синтеза качественного фторида кальция, из которого изготавливается литографическая оптика нового поколения, а также с проблемой фоторезистов, теряющих чувствительность в указанном спектре длин волн. Кроме того, как утверждают представители компании Intel, внедрение 157-нм литографии сопряжено с невозможностью найти разумный ценовой компромисс, поэтому сейчас рассматриваются альтернативные методики.
В частности, инженеры компании Intel изучают возможность использования литографии с применением жесткого ультрафиолета (EUV-литографии), о которой заговорили давно. Источником света для установок данного типа служат компактные газоразрядные лампы, представляющие собой цилиндр диаметром 0,5 мм и длиной несколько мм. В них применяется плотная плазма с температурой 200000-300000 0К, полученная с помощью полого катода, питаемого током около 10000 А. Лампы такого типа способны излучать электромагнитные волны в крайнем ультрафиолетовом диапазоне - порядка 13,5 нм и импульсами длительностью 30 нс. Срок службы таких ламп составляет до 100 млн пульсаций, при неизменной длине волн, что вполне приемлемо с экономической точки зрения.
Компания Intel является одним из сторонников литографии с применением жесткого ультрафиолета вместо 157-нм сканеров. В ее производственных планах использование данной технологии намечено на 2007 год. В то же время немецкая компания Infineon установила экспериментальное оборудование для получения световых волн EUV-спектра в своей лаборатории, для проведения исследований в области фоторезистов и других материалов, необходимых для литографии следующего поколения. А в Японии консорциум Extreme Ultraviolet Lithography System Development Association (EUVA) приступил к разработке первой EUV-установки. Появление рабочего прототипа системы ожидается в 2005 году. Интересно отметить, что в EUVA входят два известных производителя литографического оборудования - Canon и Nikon, давние конкуренты не только в области литографического оборудования. Обе компании будут заниматься совместной разработкой оптических систем для опытной EUV-установки, но несмотря на это, намерены выводить на рынок свои собственные конечные EUV-продукты.
Впрочем, EUV-литография - не единственная альтернатива. Сегодня все чаще обращают внимание на технологию импринт-литографии, которая во многом является развитием идеи EUV-литографии. В перспективе импринт-литография позволит применить наноскопическую печать на полимерах через маску масштаба 1:1 при использовании света в ультрафиолетовом диапазоне. Такие системы проецирования маски-шаблона значительно удешевят литографические системы, поскольку отпадает необходимость использования сложных и дорогих оптических систем, составляющих львиную долю современных литографических инструментов. В настоящее время для нанесения рисунка применяются маски масштаба 4:1, следовательно, для получения точной проекции рисунка маски требуется дорогостоящая оптика. Процесс нанесения рисунка на подложку до травления в импринт-литографии не зависит от качества применяемой оптики. Мономер, покрывающий поверхность кристалла, под действием ультрафиолетового излучения полимеризуется и застывает на поверхности. Он содержится в растворе и легко удаляется при необходимости, оставляя необходимый рисунок на поверхности подложки. При этом на формирование рисунка требуется всего несколько нанолитров вытравливающего реагента.
В 1997 году импринт-литографическую технологию, позволяющую создавать рельефы с шириной каналов 10 нм, уже демонстрировали исследователи из Принстонского университета. Но из-за того, что при использовании данной технологии долгое время не удавалось выровнять слои полупроводника, о технологии на некоторое время забыли. Сейчас, когда специалисты компании Nanonex добились неплохих результатов выравнивания слоев при использовании обратного сканирующего туннельного микроскопа, о перспективах импринт-литографии заговорили вновь. Основное преимущество импринт-литографии перед аналогами - низкая себестоимость производства микропроцессоров - подкрепляется тем, что производительность полупроводниковой линии может достигнуть небывалых показателей, ведь для нанесения одного слоя требуется всего 20-30 с. Таким образом, за час может быть обработано до 3000 пластин. Кроме того, импринт-литография откроет новые горизонты для молекулярной электроники, позволив печатать интегральные схемы с точностью до нескольких молекул мономера.
Миниатюрность прежде всего!
Главный попутчик роста производительности современных процессоров - миниатюризация их составных частей. Однако необходимо добавить, что желание разработчиков уменьшать процессорные компоненты является еще и главной сложностью на этом пути. Например, разрабатывая 90-нм технологии, которые должны обеспечить нормальное функционирование процессоров Prescott, инженеры Intel вынуждены были преодолевать немало препятствий. Важный момент в том, что природа этих преград не в недостаточном разрешении производственного оборудования, а в невозможности изготовления столь малых транзисторов по традиционным технологиям. Так, при толщине барьера из четырех-пяти атомов диоксида кремния (это толщина слоя диэлектрика между затвором и каналом при использовании 90-нм масок) дали о себе знать утечки заряда из этой области, из-за чего управлять транзистором стало невозможно. Дело в том, что при уменьшении толщины слоя диэлектрика его изоляционные свойства значительно ухудшаются, и ток утечки, которым можно пренебречь при больших габаритах элементов транзистора, становится недопустимо большим.
Кроме того, на границе с затвором наблюдается иное явление, выражающееся в значительном повышении порогового уровня напряжения, необходимого для изменения состояния проводимости канала транзистора. Решение было найдено в виде металлического затвора. Применив новый сплав для изготовления затвора, исследователи компании Intel продемонстрировали высокопроизводительные КМОП-транзисторы со стеками high-k/metal-gate. Последние имеют физическую длину затвора 80 нм и толщину изолятора около 1,4 нм. По мнению разработчиков, эта технология позволит осуществить переход на технологические нормы 45 нм.
Впрочем, применение металлических затворов несколько замедлило скорость срабатывания транзисторов, из-за чего на первом этапе дальнейшая миниатюризация техпроцесса была сомнительна. Но и эту проблему удалось решить. Так, например, Intel в своем 90-нм техпроцессе применяет технологию "напряженного кремния", идея которого в том, чтобы растянуть кристаллическую решетку транзистора для увеличения расстояния между атомами и тем самым облегчить прохождение тока. При этом инженеры разработали два независимых способа "растяжения" кремния для разных типов транзисторов. Напомним, что существует два типа CMOS-транзисторов: n-типа, обладающие электронной проводимостью, и p-типа - с дырочной проводимостью. В NMOS-устройствах поверх транзистора в направлении движения электрического тока наносится слой нитрида кремния (Si3N4), в результате кремниевая кристаллическая решетка "растягивается". В PMOS-устройствах "растяжение" достигается за счет нанесения слоя кремний-германия (SiGe) в зоне образования переносчиков тока - здесь решетка "сжимается" в направлении движения электрического тока, и потому "дырочный" ток течет свободнее. В обоих случаях прохождение тока значительно облегчается: в первом случае - на 10%, во втором - на 25%. Сочетание же обеих технологий дает 20-30%-ное ускорение протекания тока.
И все это ради мегагерц
Процессор является одним из тех устройств, в которых логика функционирования неразрывно связана с технологией производства. Подтверждает это и вторая часть определения из БСЭ, где говорится о логической структуре процессоров. О ней и пойдет речь дальше.
Микропроцессор состоит из нескольких структурных блоков, так или иначе представленных во всех современных процессорах. Среди них: кэш инструкций, кэш данных, предпроцессор и постпроцессор. Поскольку перечисленные блоки имеются во всех существующих сегодня процессорах, принцип обработки в них должен быть похожим. В общем случае его можно разделить на несколько этапов.
Первый из этапов - предварительная обработка данных, которая заключается в размещении их в оперативной памяти или кэше процессора. Далее идет стадия преобразования данных в код, понятный процессору. Этот процесс происходит в предпроцессоре, передающем данные преобразованного формата (внутренний формат процессора) в постпроцессор, где и происходит их обработка. Завершается работа четырехступенчатого конвейера обратной записью в кэш либо оперативную память.
Важно понимать, что любой ход процессора не может быть произведен раньше предыдущего, равно как и все операции происходят строго циклично, то есть тактуются. Это означает, что за один Герц процессор способен провести лишь один из этапов. Вот почему так важно, чтобы частота процессора была высокой. Впрочем, количество проработанных процессором тактовых импульсов не всегда равно числу обработанных им команд, ведь существуют инструкции, которые могут быть выполнены за разное количество тактов - как менее, так и более одного. В случае, когда разработчики говорят, что их процессор может обрабатывать более одной команды за такт, речь идет о том, что структурный блок, отвечающий за их выполнение, содержит свой собственный подконвейер - он-то и выполняет собственные подинструкции за единицу собственного тактования. Именно поэтому встретить процессор, длина конвейера которого равна четырем, невозможно. И это не так плохо, ведь длинный конвейер способствует росту частоты, а значит - числу инструкций, которые могут быть обработаны в единицу времени.
Но в том-то и дело, что это в идеале, ведь вычислительный конвейер процессора мало чем отличается от калькулятора, способного вычислить все, если вы правильно поставите ему задачу. Так и конвейер полностью полагается на работу других блоков процессора, в числе которых блок предсказания ветвлений, позволяющий обрабатывать данные спекулятивно, то есть заранее, не дожидаясь выполнения множественных циклов и других логических операторов, коими наполнен код любой программы.
Все задачи, исполняемые процессором, можно разделить на две большие части. Первая из них - целочисленные операции (как правило, офисные приложения) и операции с плавающей точкой (мультимедийные приложения). Первый тип обрекает нас на большое количество переходов, предсказание которых очень трудно, и коэффициент правильного предсказания в таких приложениях весьма низок. Как следствие, при их выполнении существует постоянная необходимость заполнения конвейера правильными инструкциями (как только осуществляется неверный переход, содержимое конвейера обнуляется и он загружается заново, что приводит к существенным временным потерям). И прежде чем мы получим результат первого вычисления, пройдет несколько десятков процессорных тактов (например, для Pentium 4 Prescott - 31), что при большом количестве таких ошибок пагубно отразится на производительности. В частности, на офисных приложениях новый процессор теряет до 20-30% своей производительности в сравнении с аналогичными моделями Pentium III.
Второй тип задач - мультимедийные приложения, напротив, характеризуется очень малым количеством переходов и высокой степенью их предсказания, и, как следствие, на них процессор с конвейером любой длины может реализовать всю свою мощь наилучшим образом.
Если учесть, что пользователю не столь важно ускорение работы офисных программ, которым зачастую достаточно производительности процессоров двух-, трехлетней давности, то процессоры с удлиненным конвейером видятся, пожалуй, наиболее перспективными разработками. Это отражают и характеристики современных процессоров - и в продукции компании Intel, и AMD (в меньшей степени) чувствуется все большая ориентация на мультимедийные приложения. Об этом могут говорить и постоянно удлиняющиеся конвейеры, и поддержка SIMD-инструкций (Single Instruction Multiple Data), позволяющих за один такт выполнять однотипные, часто встречающиеся в потоковых приложениях алгоритмы.