Выбрать главу
X-ящик номер 360 и графика DirectX.Next

Microsoft, как ни забавно, плавает гораздо мельче: в отличие от первой Xbox, усовершенствованная Xbox 360 на звание самого-самого революционного творения, увы, не тянет. Зато она прекрасно справляется со своей основной задачей - с играми следующего поколения.

Предмет законной гордости микрософтовского творения - графический процессор ATI Xenos (R500). Nvidia RSX - очень мощный по нынешним меркам GPU, однако основан он на старой, «классической» архитектуре с раздельными пиксельными и вершинными конвейерами. Фактически RSX - просто слегка усовершенствованная версия GPU G70 и (поскольку G70 - лишь «работа над ошибками» NV4x) непосредственный наследник линейки ускорителей GeForce 6xxx, разве что работающий примерно вдвое быстрее бывшего кумира - GeForce 6800 Ultra. А вот Xenos - совсем другое дело: это не просто принципиально иной чип для самой ATI, это еще и принципиально иная архитектура графических процессоров, следующее ее поколение. В Xenos (он же R500) вообще нет выделенных специализированных пиксельных или вершинных конвейеров, а вместо них - 48 (!) универсальных программируемых конвейеров, способных производить над данными произвольные вычисления и с одинаковой эффективностью выполнять любые шейдеры. То есть если в простой сцене для расчета геометрии достаточно четырех конвейеров, то оставшиеся 44 можно бросить на расчет сложных пиксельных шейдеров и наоборот - в сложной геометрической сцене с минимумом шейдеров можно задействовать большинство конвейеров для расчета геометрии, оставив для нужд пиксельных вычислений лишь необходимый минимум. В итоге неважно, какая сцена рендерится, - GPU загружен на полную мощность всегда. А гибкость этих программируемых конвейеров вполне достаточна, чтобы наконец-то реализовать поддержку Shader Model 3.0 и в графических чипах производства ATI.

Да что там шейдеры третьей версии! Unified Shader Architecture с ее универсальными вычислительными ресурсами графического процессора - это шаг вперед, от DirectX 9 (с которым мы живем вот уже больше трех лет, постепенно переходя от версии 9.0a к 9.0b и свежей 9.0c) к «десятому» поколению DirectX (более известному как DirectX.Next или Windows Graphics Foundation 2.0), которое должно лечь в основу ОС Longhorn. Причем объясняется этот «переход» отнюдь не маркетинговыми соображениями, а возможностью использования ускорителя архитектуры USA в качестве практически полноценного и самодостаточного программируемого процессора! Попросту говоря, Xenos позволяет за один такт исполнить до 48 произвольных скалярных и 48 произвольных векторных инструкций, а что за данные при этом обрабатываются - закрашивается ли треугольник, рассчитывается ли сложная геометрическая сцена или производится моделирование процессов сворачивания белка, - ему все равно. Все необходимые для подобного «нецелевого» использования библиотеки (ATI Modeling Engine) канадская компания разработчикам уже предоставила.

***

Еще одна интересная «фича» R500 - наличие 10 Мбайт интегрированной видеопамяти, играющей роль быстродействующего (256 Мбайт/с) объемистого кэша. ATI утверждает, что эти самые десять «быстрых» мегабайт позволят реализовывать на Xenus качественный полноэкранный антиалисинг ценой потери всего лишь… 1-5% скорости! Отнюдь не лишний бонус для приставки, предназначенной для совместной работы с телевизорами и мониторами высокого разрешения. Правда, 10 Мбайт кэш-памяти - это и весьма впечатляющее (несколько десятков миллионов) количество транзисторов, и здоровенный кусок кристалла GPU, так что в итоге кристалл и без того немаленького Xenos оказался столь громоздким, что технологи разделили его на два независимых чипа, ставящихся на одну подложку. «Базовый» чип - это собственно и есть сам R500 с его 48 универсальными конвейерами, обслуживающей их логикой и контроллером видеопамяти; существенно меньших размеров «дочерний» кристалл - те самые 10 Мбайт буфера видеопамяти и блоки растровых операций ROP (Raster Operations), которые выполняют запись рассчитанных графическими конвейерами данных во фрейм-буфер, ведают отсечением невидимых пикселов (z-test), смешением полупрозрачных цветов (блендингом) и тому подобными «вспомогательными» операциями. Пропускная способность шины, соединяющей чипы, - «всего лишь» 30 Гбайт/с, однако для передачи предварительно сжатых, еще «недообработанных» данных этого, видимо, достаточно.