Выбрать главу

Прежде чем перейти к отличиям чипов на основе модифицированной микроархитектуры Fermi от микросхем первого поколения, напомним характерные особенности их конструкции.

Чипы на основе архитектуры Fermi относятся к классу MIMD (МКМД - вычислительная система со множественным потоком команд и множественным потоком данных). К ключевым особенностям Fermi относятся поддержка программного интерфейса DirectX 11 (включая шейдеры версии 5 и, самое главное, аппаратную тесселяцию), а также интерфейсов DirectCompute 11 и OpenCL 1.0, позволяющие использовать видеочип для общих (то есть, не графических) вычислений.

Для аппаратной поддержки тесселяции и алгоритма трассировки лучей в чипах используются параллельно работающие блоки растеризации и полиморфных движков, что позволило существенно поднять производительность рендеринга геометрии. Именно эту особенность можно считать главной, которая отличает ГП на основе микроархитектуры Fermi от микросхем предыдущего поколения.

Первые чипы с микроархитектурой Fermi получили индексы GF10x (GF расшифровывается как "Graphics Fermi"). "Полноформатный" графический процессор GF100 состоит из движка GigaThread, четырёх больших блоков Graphics Processing Clusters ("Кластеров графической обработки"), в каждый из которых входит по четыре мультипроцессора SM и выделенный движок растеризации. 16 мультипроцессоров, в свою очередь, объединяют 512 потоковых процессоров CUDA - по 32 в каждом SM, четыре текстурных модуля, полиморфный движок и 64 Кб кэш-памяти L1.

В мультипроцессоре установлены по два планировщика для группы CUDA (Warp Scheduler) и по два диспетчера инструкций. 48 блоков ROP сгруппированы в шесть модулей по восемь блоков, каждый из которых работает с одним из шести 64-разрядных контроллеров видеопамяти GDDR5 - общая ширина шины памяти составляет 384 бит. Объём кэш-памяти L2, подключённой к контроллерам кадрового буфера, - 768 Кб.

В чипах Fermi GF100 реализована система NVIDIA 3D Vision Surround, которую можно задействовать на двух видеокартах, работающих в режиме SLI. Благодаря этой технологии, можно выводить одновременно на три монитора трёхмерное изображение высокого разрешения 1920х1080 пикселей или двухмерную картинку с разрешением 2560х1600 точек. Для просмотра 3D, разумеется, потребуются затворные очки и стереодрайверы, способные "оживить" картинку в нескольких сотнях популярных видеоигр.

Несмотря на то, что в чипе GF100 изначально было заявлено 512 потоковых процессоров, такие микросхемы никогда не выпускались в рамках 400-й серии. Максимальным числом CUDA было 480 в кристаллах для видеокарт GeForce 480, хотя физически в чипе были реализованы все 512. Отключение 32 ядер было связано с недостаточной отработанностью 40-нм технологического процесса и слишком большим выходом некондиционных чипов с полным набором ядер. Сегодня эта проблема решена, а в конструкцию внесены изменения, позволяющие минимизировать возможность брака.

Новые ускорители серии 500 получили индекс GF11x и в топовых моделях (GF110) задействованы все 512 потоковых процессоров CUDA. Кроме того, в конструкцию транзисторов микросхемы внесены существенные изменения, что позволило минимизировать токи утечки и заметно снизить энергопотребление. К прочим ключевым конструктивным изменениям относятся доработанные блоки адресации и фильтрации текстур, обеспечивающие удвоенную скорость (за один такт, а не за два) обработки текселей в режимах вплоть до FP16, а также улучшенные алгоритмы обработки буфера глубины, в частности, отсечения перекрытых объектов (Z-culling), ускоряющие рендеринг картинки за счёт исключения невидимых (скрытых) объектов.

Аппаратно все чипы серии 500 поддерживают программный интерфейс OpenCL версии 1.1, но на момент написания этих строк драйверы NVIDIA обеспечивают поддержку лишь OpenCL версии 1.0.

Процессор NVIDIA GeForce 5xx состоит из более чем трёх миллиардов транзисторов. Тактовые частоты ядра и рабочие частоты универсальных процессоров в новых чипах были повышены по сравнению с микросхемами 400-й серии. Так, если максимальная штатная частота ядра чипов предыдущей серии составляла 810 МГц (GF108), то у нынешней она достигает 900 МГц (GF116), пиковая частота CUDA выросла с 1620 МГц (GF108) до 1800 МГц (GF116).

Как и ранее, производитель варьирует число блоков в микросхеме, что позволяет выпускать на основе одной базовой конструкции несколько вариантов чипа с различной производительностью. На данный момент в 500-е семейство входят бюджетные модели GeForce GT 520 (GF119),