Выбрать главу

Инженеры AMD не ограничились чисто количественными сокращениями SIMD-ядер, в Barts были внесены и качественные изменения. Главное из них — обновлённый аппаратный движок тесселяции 7-го поколения (по неким внутренним подсчётам AMD). Разработчики говорят об улучшенных механизмах управления потоками и буферизации и утверждают, что по геометрической производительности новый движок не уступает тесселятору чипов NVIDIA на архитектуре Fermi, ранее значительно опережавшему решения AMD. В качестве фактора тесселяции было выбрано значение в 16 пикселей: более «мелкие» полигоны способны лишь тормозить расчёты, не давая принципиального повышения качества изображения.

В Barts также доработаны алгоритмы анизотропной фильтрации и реализован новый механизм сглаживания Morphological Anti-Aliasing (MLAA). Фактически это программный фильтр пост-обработки для двухмерного изображения, рассчитывающий «полутоновые» переходы между пикселями и делающий картинку более естественной.

Из важнейших аппаратных изменений необходимо упомянуть также уницифированный модуль видеодекодера третьего поколения (UVD3), способный аппаратно декодировать не только традиционные форматы H.264 или MPEG-2, но и MPEG-4 (DivX/XviD) и Blu-ray, включая Blu-ray 3D. UVD3 реализован во всех чипах нового поколения, за исключением Radeon HD 6750 и HD 6770 на базе старых микросхем Juniper, где применяется UVD2. Поддерживаются самые свежие версии цифровых видеоинтерфейсов: DisplayPort 1.2 и HDMI 1.4a (с возможностью передачи 3D-видео).

На интерфейсах стоит остановиться отдельно, поскольку все карты серии Radeon HD 6000, включая самые доступные, поддерживают фирменную технологию AMD Eyefinity, позволяющей за счёт вывода нескольких каналов по шине DisplayPort подключать к одному разъёму сразу несколько мониторов. Пропускной способности интерфейса DisplayPort 1.2 достаточно для одновременного подключения к одному порту четырёх дисплеев. Возможны две конфигурации: использование специального хаба (разветвителя) оснащённого набором различных интерфейсов (DP, VGA, DVI или HDMI), либо последовательное соединение дисплеев, полностью совместимых с DisplayPort 1.2, то есть имеющих как входы, так и выходы DP.

Наконец, была переименована технология неграфических вычислений ATI Stream, которая теперь официально называется AMD Accelerated Parallell Processing. Принципиальных аппаратных доработок здесь нет, всё так же поддерживаются API OpenCL и DirectCompute.

Графический процессор Juniper не претерпел никаких изменений: это всё тот же урезанный Cypress с 10 SIMD-ядрами и видеодекодером UVD2, а чипы Radeon HD 6770 и HD 6750 в действительности представляют собой переименованные Radeon HD 5770 и 5770. Единственное отличие — поддержка HDMI 1.4, но неполная, без возможности работы с 3D-видео, которую даёт UVD3.

Бюджетный процессор Turks представляет собой серьёзно урезанный Barts: в нём 6 SIMD-ядер, в каждом из которых работают по 16 блоков потоковых процессоров с 5 ALU. Шина памяти сужена вдвое — до 128 бит. При этом в чипе реализованы все изменения, внесённые в Barts, включая улучшенный тесселятор, поддержку MLAA и видеодекодер UVD3. Младшая модификация Radeon HD 6570 может работать не только с видеопамятью GDDR5, но и с дешёвой памятью DDR3.

Чип начального уровня Caicos — предельно упрощённый Barts: в нём всего два SIMD-ядра и единственный 64-битный контроллер памяти. Производитель предлагает довольно широкий диапазон рабочих частот как процессора, так и видеопамяти, причём поддерживается оба варианта микросхем, как GDDR5, так и DDR3.

Графический процессор Cayman претерпел наибольшие изменения по сравнению с чипами Cypress предыдущего поколения, и они затронули не только чисто количественные показатели, но и саму архитектуру микросхемы. Для оптимизации энергопотребления и упрощения конструкции было принято решения отказаться от суперскалярной архитектуры VLIW5, в который каждый потоковый процессор оснащался пятью вычислительными блоками ALU: четыре из них были рассчитаны на выполнение простых арифметических операций, а пятый («трансцендентный») — на сложные алгебраические вычисления. Эта схема была разработана ещё инженерами ATI, но спустя годы стало очевидно, что она неоправданно усложняет чипы, не принося существенного прироста производительности.

В Cayman применяются потоковые процессоры нового типа на базе архитектуры VLIW4, состоящие из четырёх одинаковых вычислительных модулей ALU. При этом сложные операции выполняются тремя из четырёх модулей, что теоретически снижает общую производительность, однако заметно упрощает микросхему и уменьшает её площадь. Зато распределять задачи по одинаковым модулям значительно проще, а значит, и быстрее, в особенности при вычислениях с двойной точностью.