Logo Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware
Обучение от Mail.Ru Group.
Онлайн-университет
для программистов с
гарантией трудоустройства.
Набор открыт!

2006 г.

Radeon X1000: видеокарты нового поколения

Андрей Душко, "Комиздат"

Долгожданная премьера абсолютно новой серии графических адаптеров ATI Radeon X1000 состоялась. В общем итоге в продажу поступит семь моделей, из которых на данный момент нам удалось проверить четыре версии: самые быстрые (X1800 XT и XL), самые дешевые (X1300 PRO) и претендующие на прочные позиции в средней ценовой категории (X1600 XT). Полностью новая архитектура принесла хорошие результаты, хотя во многих случаях королем производительности продолжает оставаться GeForce 7800 GTX.

Ждать серию Х1000 и модели, ранее известные под кодовыми названиями R5xx и RV5xx, пришлось долго. Причиной задержки длиною в несколько месяцев стал небольшой конструктивный недостаток процессора, который инженеры не могли отыскать целых два месяца! Однако в итоге проблему удалось идентифицировать — и в результате мы стали свидетелями масштабнейшей премьеры, подготовленной ATI. В течение одного дня было объявлено о выходе сразу семи новых моделей графических адаптеров. Ранее такого не случалось. Стандартной ситуацией был выход первоначально самой лучшей, оснащенной всеми современными возможностями новинки — и лишь несколько месяцев спустя объявлялось о выводе на рынок следующих, более медленных версий на основе решений самой быстрой видеокарты.

Засим перейдем к сути дела — начнем "разбор полетов".

Скорость в семи вариантах

Radeon X1800 XT

Флагманская версия. Огромных размеров графическая карта, по длине соотносимая с GeForce 7800 GTX — но при этом имеющая вдвое больший модуль охлаждения. На видеокарте расположен дополнительный 6-пиновый разъем питания PCI Express. Модуль охлаждения напоминает устанавливаемый на модели Х850 ХТ, однако превосходит его по размерам.

Radeon X1800 XT оснащается 512 Мб памяти GDDR3, тактовая частота которой равна 1,5 ГГц — самый высокий показатель, с которым довелось сталкиваться. Ядро тоже работает с недостижимой ранее тактовой частотой — 625 МГц. При этом в продажу должна будет поступить более дешевая (на $50) версия с 256 Мб памяти.

Карта имеет 16 потоков рендеринга, 8 модулей обработки вершин и может обрабатывать 512 конвейеров одновременно. Конвейеры — это новый показатель в методике оценки производительности карты, о которых мы расскажем немного позже.

X1800 XL отличается от версии ХТ, прежде всего, другим модулем охлаждения, а также ядром и памятью, имеющими намного меньшую тактовую частоту. Охлаждение занимает всего лишь один слот, хотя вид имеет внушительный. Тактовая частота ядра достигает 500 МГц, памяти — 1 ГГц. Эта модель будет предлагаться исключительно с 256 Мб памяти на борту.

Radeon X1600

Эта карта получила 12 потоков рендеринга. Ее можно приобрести в двух различных версиях: XT и PRO. У обеих по 128 или 256 Мб памяти. У модели ХТ память и ядро работают с тактовой частотой, соответственно, 1,38 и 590 МГц. Аналогичные показатели модели PRO составляют 780 и 500 МГц.

Radeon X1300

Бюджетная версия имеет 4 Pixel Shader процессор. Карта будет доступна в трех вариантах: PRO, стандартном и HyperMemory. Версия PRO, которая подверглась тестированию, оснащается ядром с очень высокой тактовой частотой (600 МГц) и 256 Мб памяти DDR2, работающей с тактовой частотой 800 МГц. У стандартного варианта — 128 или 256 Мб памяти, имеющей тактовую частоту 500 МГц. Частота ядра — 450 МГц.

Вариант HyperMemory, скорее всего, не будет поступать в розничную продажу, распространяясь только среди сборщиков ПК. Карты такого рода оснащены 32 Мб памяти — однако благодаря технологии HyperMemory можно зарезервировать еще 96 Мб ОЗУ. Ядро работает с такой же тактовой частотой, что и стандартная версия, а память имеет тактовую частоту 1 ГГц.

Согласно планов ATI, к тому моменту, как вы будете читать эти строки, в массовую продажу попадут четыре модели карт: X1800 XL, X1800 XT, X1300 PRO и стандартная версия X1300. 30 ноября выйдут версии X1600 XT и PRO.

Инновации, инновации

X1000 — это серия карт, оснащенных целым рядом инновационных решений. ATI "с нуля" разработала большинство элементов архитектуры, а такие компании делают это нечасто — обычно раз в несколько лет. Нововведений действительно много. Рассмотрим хотя бы наиболее существенные из них, особенно заметно влияющие на производительность.

Все процессоры ATI, устанавливаемые на картах Х1000, выполнены по технологии 90 нм, благодаря чему на той же площади поверхности, что и у предыдущих серий, удалось поместить вдвое больше транзисторов. При этом снижена рабочая температура самого процессора (чтобы иметь аналогичную тактовую частоту). Впрочем, это не означает, что карты греются не так сильно, как их предшественники, а посему меньше шумят. Увы и ах — из-за возросшей тактовой частоты процессора и памяти этого не случилось. В итоге дешевые модели X1300 PRO, где частота процессора равна 600 МГц, практически "орут" — такой шум выдержит не каждый. Причем версия Х1800, оснащенная более массивными модулями охлаждения, работает намного тише, с вполне приемлемой громкостью. Вот такая вот аномалия.

ATI давно выступала против того, чтобы оснащать свои карты Shader Model 3.0. Компания nVidia ввела эту возможность еще в серии GeForce 6xxx. ATI же поясняла, что на рынке не так много игр, использующих столь "навороченные" функции. Что ж, де-факто игр с поддержкой Shader Model 3.0 и в самом деле не густо — но это именно те игры, позиции которых сильны. Например, Battlefield 2, The Cronicles of Riddick или Splintel Cell: Chaos Theory. Число таких игр постоянно растет — и канадцы уже не могут закрывать глаза на столь существенный элемент оснащения видеокарт. И теперь встраивают Shader Model 3.0 во все свои карты, начиная с серии Х1300 и заканчивая Х1800.


На схеме — новая архитектура Radeon X1800 XT.
Остальные модели — X1600 и X1300 — построены аналогично,
за исключением меньшего числа модулей оттенения и геометрической обработки

Shader Model 3.0 — это только верхушка айсберга новых возможностей измененной архитектуры. Одной из самых важных инноваций является специальный процессор Ultra-Threading Dispatch Processor, позволяющий поддерживать до 512 потоков одновременно. Каждое из ядер модуля оттенения разделено на четыре части. В результате получаем 16 модулей оттенения (в модели Х1800).

Ключевым элементом получения высокой производительности модулей оттенения является их максимальное использование. Если модуль оттенения должен искать тип текстуры, не находящийся в памяти текстур, необходимо обеспечить связь с памятью, установленной на видеокарте. А это, в свою очередь, может привести к сотням циклов задержек. Процессор многопоточности, инсталлированный в версии 512 конвейеров в моделях Х1800 или 128 конвейеров в остальных моделях должен постоянно обеспечивать примерно 90-процентную занятость модулей оттенения.

Еще одна важная особенность новой архитектуры — динамическое разделение (dynamic branching). Принцип работы этого механизма состоит в оптимизации диапазона обработки модифицируемых пикселей. В те моменты, когда определенные пиксели не должны обрабатываться, они, благодаря подсчетам, проведенным программой оттенения, пропускаются. Работа над пикселями разделяется процессором UTDP на сотни потоков, состоящих из маленьких блоков размером 4х4 пикселя. Эти точки могут выполнять тот же код оттенения. В тот момент, когда чип UDTP определяет, что он не полностью загружен (закончил задачу или ожидает данные), начинается определение новых задач для выполнения. Во время ожидания новых заданий модули ALU заполняются новыми потоками для выполнения. Каждый из процессоров оттенения Radeon X1800 за один такт может выполнять до двух векторных и скалярных операций. В итоге Radeon X1800 может выполнять до шести инструкций оттенения за один такт на 16 пикселях одновременно.

Восемь модулей обработки геометрии в свою очередь могут обрабатывать одной 128-битной векторной инструкцией и одной 32-битной скалярной за каждый такт. Эти модули поддерживают также функции динамического контроля инструкций, то есть зависимостей и циклов. Оттенение пикселей и вершин производится со 128-битной точностью.

Еще одним нововведением, очень важным с точки зрения производительности карты, стал новый контроллер памяти. Он создан на базе двух окружностей, данные по которым двигаются в противоположных направлениях, что позволяет сократить время задержек к данным. В центре "округлости" находится контроллер памяти, вокруг которого помещен перекрестный коммутатор, связанный, в том числе, и с восемью клиентами. Те же, в свою очередь, могут связываться через указанный коммутатор как с 256-битной внешней шиной данных, так и главным контроллером памяти. В тот момент, когда один из восьми клиентов выдает задание контроллеру памяти, данные, "бегающие" по окружностям, перехватываются ближайшим так называемым Ring Stop (всего их четыре). Что интересно, контроллер памяти программируется, так что они могут быть усовершенствованы с выходом очередных версий драйверов.

Это тем более важно, что этот контроллер поддерживает также и механизм установки важности, которые могут вноситься в код программистами. В результате каждый программист может написать код программы таким образом, чтобы он был максимально оптимизирован под новые карты ATI. По сравнению с моделью серии Х850 контроллер памяти был основательно переработан также и по количеству каналов. У карты-предшественницы было четыре 64-битных канала памяти, связывающихся с четырьмя банками модулей памяти. В версии Х1800 — восемь 32-битных каналов и 8 восемь новых модулей памяти. Благодаря такому "упорядочению" улучшается общий доступ к памяти. Оптимизации подверглась и кэш-память — теперь она может назначаться в любом месте во внутренней памяти графического адаптера.


Модуль оттенения в приближении.
Как видим, каждый двигатель разделен на четыре сегмента

Одним из самых популярных эффектов, используемых в современных играх, является High Dynamic Range — то есть демонстрация света высокой рассеянности и интенсивности. От этого в значительной степени зависит  реалистичность игр, однако ранее эта функция имела существенный недостаток — на картах nVidia не могла работать одновременно со сглаживанием кривых. Можно было запустить либо HDR, либо полноэкранное сглаживание — выбор зависел от пользователя. Правда, при включенном HDR соотношение контраста в отображаемых сценах заметно возрастает, так что "остроугольные" кривые видны лучше, чем при выключенном HDR.

ATI первой предоставила в новых картах одновременную поддержку HDR и сглаживания. Что ж, увидим, сможет ли nVidia с выходом следующего поколения драйверов улучшить свою систему. Если эта задача окажется чересчур сложной, ATI получит козырь в виде HDR с полным сглаживанием.

Назад в будущее

ATI вернулась к удачной идее адаптивного сглаживания кривых. Это замысел объединяет скорость, характерную для сглаживания методом большого количества проб (multisampling), с быстротой суперпроб (supersampling). Пользователь может выбирать между двумя рабочими режимами функции: качество и скорость.


Новый "округлый" контроллер памяти. Данные двигаются
в противоположных направлениях по двум 256-битным шинам памяти

Эта функция работает со всеми картами ATI, в том числе и более ранними,— однако запустить ее можно лишь используя приложение ATI Tray Tools (можно загрузить с сайта "ATI Radeon. Техподдержка") или с помощью специальных неавторизованных драйверов. Однако всегда следует учитывать, что на более ранних видеокартах запуск данной функции приводит к значительному — вплоть до 50% — снижению производительности. В новейших же моделях работа этой функции практически не ощущается, а качество отображаемых "трудных" текстур, таких как листья на деревьях, трава, сетки, существенно улучшено. Не стоит забывать и о том, что эта функция работает вместе с включенной опцией HDR.


По сравнению с моделями предыдущего поколения
увеличено количество каналов и модулей памяти

Качество текстур можно улучшить и при помощи новой функции анизотропного фильтрования, получившей название Area Anizo. Ее цель — обеспечить точность (precisicing) и четкость (sharpening) текстур.


Toy Shop — новая технологическая демонстрация ATI,
где карты серии Х1000 могут развернуться на полную мощность.
Выпуклая надпись — яркий пример использования
новых функций parallax occlusion mapping. На самом деле это простая плоская текстура


Скриншот из демо Toy Shop: качественная демонстрация дождя, а также
работа эффекта HDR при запущенном сглаживании кривых,
хорошо заметная на примере уличных фонарей


Сетка и амуниция из игры Half Life 2 — совершенный пример адаптивного
сглаживания кривых, благодаря которому с трудом поддающиеся
сглаживанию кривые значительно выигрывают в качестве

CrossFire в каждой версии

Все карты серии Х1000 готовы для работы в режиме CrossFire. К сожалению, сохраняется необходимость приобретения модели "материнской" видеокарты, оснащенной так называемым двигателем масштабирования (composting engine), который синхронизирует графику, генерируемую двумя картами одновременно. Зато удалось решить проблему ограничения разрешающей способности до 1600х1200 пикселей и 60 Гц обновления. Отныне в распоряжении пользователя возможность выбора более высоких разрешений и большей частоты обновления. Это важная информация — ведь те, кто будет приобретать два Radeon X1800 XT (а такие фанаты найдутся), вероятнее всего, захотят поиграть на своем почти наверняка широкоформатном экране или хотя бы на 21-дюймовом ЭЛТ-мониторе, где такие карты смогут продемонстрировать свои возможности.

Модели серии Х1300 могут работать в режиме CrossFire без необходимости соединения их внешним кабелем. Этот вариант чем-то сходен с режимом SLI на дешевых картах nVidia серии 6600/LE, где тоже необязательно применять специальный мост.

Новинка: программируемый двигатель масштабирования, который по мере разработки ATI новых функций (например, улучшающих качество изображения), может обновляться при установке свежих драйверов.

Разгон

В новых драйверах Catalyst ATI предоставлена возможность динамического разгона для всех новых видеоадаптеров серии Х1000. Температура контролируется с помощью специального, встроенного в процессор "термометра", так что перегреть чип вряд ли удастся. Так же как и nVidia, компания ATI предоставила режим 2D, в котором запускаются карты, не выполняющие сложных заданий в трехмерной графике. При таком двухмерном режиме снижаются показатели тактовой частоты у процессора и памяти, но обеспечивается пониженный уровень шума.

GPU в роли CPU

В ходе презентации карт ATI с весьма интересным докладом выступил Майк Хьюстон из университета Стэнфорд. Он занимается работами над альтернативным использованием вычислительной мощности чипов. Выступление этого ученого предвосхитило заявление производителя о том, что все заинтересованные смогут получить подробную информацию об архитектуре новых графических процессоров. Цель этот предприятия — привлечь всех желающих к работам над приложениями, которые могли бы воспользоваться колоссальной вычислительной мощностью процессоров 3D. Чип GPU может легко использоваться для таких задач, как, например, сложные вычисления в массивах или векторные вычисления, симуляция физики, распознавание языка, вычисления с базами данных и т.д.

Только представьте себе: если процессор P4 3,0 ГГц имеет производительность порядка 12 Гфлопс, то у Radeon X1800 XT этот показатель равняется целым 120 Гфлопс. Разумеется, GPU не может быть идеальным средством расчетов для всех типов задач, но при многих вычислениях он может существенно разгрузить центральный процессор. Те, кого заинтересовала возможность проверить "скорострельность" своего чипа, могут ознакомиться с соответствующим материалом на сайте Стэнфорда. Много интересной информации можно отыскать также по этому адресу.

Производительность

Конфигурация тестовой платформы:

  • процессор — AMD Athlon 64 3800+;
  • ОЗУ — 2x512 Mб DDR400;
  • материнская плата — Asus A8N-SLI Premium;
  • жесткий диск — Maxtor DiamondMax 9 Plus 80 Гб ATA133;
  • операционная система — Windows XP PRO SP2.

Результаты

Лучшей иллюстрацией производительности различных моделей является таблица с тестовыми результатами, которые сравниваются с показателями, которые были получены непосредственными конкурентами — картами nVidia.

В синтетических бенчмарках новые карты ATI намного вырываются вперед, да и в большинстве игр демонстрируют хорошую производительность. В игре FarCry карты ATI "рулят", а вот в Riddick проигрывают, причем довольно много. В Doom 3 модели Х1000 показывают себя во всей "красе".

Ну и в заключение, приведем рекомендуемую стоимость карт:

  • Radeon X1800 XT 512 MB $549
  • Radeon X1800 XT 256 MB $499
  • Radeon X1800 XL 256 MB $449
  • Radeon X1600 XT 256 MB $249
  • Radeon X1600 XT 128 MB $199
  • Radeon X1600 PRO 256 MB $199
  • Radeon X1600 PRO 128 MB $149
  • Radeon X1300 PRO 256 MB $149
  • Radeon X1300 256 MB $129
  • Radeon X1300 128 MB $99
  • Radeon X1300 HyperMemory 32 Мб/128 Мб HyperMemory $79

Новости мира IT:

Архив новостей

Последние комментарии:

Релиз ядра Linux 4.14  (9)
Среда 22.11, 19:04
Loading

IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей PR-акции, размещение рекламы — adv@citforum.ru,
тел. +7 985 1945361
Пресс-релизы — pr@citforum.ru
Обратная связь
Информация для авторов
Rambler's Top100 TopList liveinternet.ru: показано число просмотров за 24 часа, посетителей за 24 часа и за сегодня This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2015 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...