Выбрать главу
***

Второй козырь нового степпинга - поддержка набора инструкций SSE3, впервые появившегося в Pentium 4 Prescott[И поэтому также известного как Prescott New Instructions (PNI)]. Тринадцать новых инструкций (из которых две - MONITOR и MWAIT, связанные с технологией HyperThreading, - выделены в особый «подблок» и процессорами AMD принципиально не поддерживаются) есть своеобразная «работа над ошибками»; инженеры Intel посчитали целесообразным добавить их по итогам практического использования действительно новаторских SSE/SSE2. Каждая такая инструкция фактически рассчитана на использование буквально в одной-двух ситуациях, когда традиционные схемы требуют «недостаточно быстрых» (как в случае с HADDPS, осуществляющей сложение компонентов внутри одного вектора) или «некрасивых решений» (в случае с FISTTP, округляющей число в сторону нуля, как того требует стандарт языка C, независимо от выбранного для сопроцессора режима округления). Потенциально все эти инструкции способны многократно повысить производительность некоторых участков кода; на практике[Подробности см. на www.anandtech.com/cpuchipsets/showdoc.aspx?i=2350] же такие участки встречаются сравнительно редко и с трудом поддаются «компиляторным» оптимизациям (программисту требуется либо использовать стандартные, вручную оптимизированные библиотеки, либо возиться с оптимизацией «критичных» участков кода на ассемблере, что требует сегодня очень высокой квалификации). Вдобавок для «неудачных» языковых конструкций (типа округления чисел с плавающей точкой в x87) давно найдены эффективные «обходные пути» с использованием «нетиповых» инструкций (PF2ID, CVTSS2SI или CVTPS2PI вместо стандартной FISTP). В итоге прирост производительности от поддержки SSE3 составляет всего пару процентов, лишь изредка доходя до 7-8%[В некоторых подтестах прирост производительности куда больший - до 25%, однако в целом даже в таких приложениях итоговая производительность увеличивается ненамного. Например, прирост скорости при кодировании видео в DivX - 0,26%]. Так что ожидать от SSE3 многого не приходится, однако «фича» это приятная.

Третье достоинство степпинга E - усовершенствованный контроллер памяти[По неофициальной информации, степпинг D имеет проблемы с интегрированным контроллером памяти: некоторые процессоры нестабильно работали даже на номинальных частотах. Правда, скорее всего, «бракованные» CPU были простой перемаркировкой своих менее дорогих и менее шустрых собратьев: тогда на рынке присутствовало много поддельных процессоров AMD, что даже вынудило компанию практически отказаться от треевых поставок в пользу боксовых (PIB) процессоров, надежно защищенных от подделок]. В основном изменения касаются улучшенной совместимости контроллера с «быстрыми» типами оперативной памяти - теперь можно использовать гораздо более быструю 1T-адресацию с одиночными (по одному на канал памяти, коих у Sempron один, а у Athlon 64 - два) модулями памяти практически любой организации (если сами модули, конечно, эту адресацию «вытянут») и с парами (для Athlon 64 это означает четыре модуля) односторонних модулей DDR400. Кроме того, появилась и долгожданная неофициальная поддержка нестандартной «быстрой» оперативной памяти стандартов DDR433, DDR466 и DDR500 без повышения тактовой частоты процессорной шины! Да-да, отныне преимуществами этих скоростных модулей смогут в полной мере насладиться не только оверклокеры, разгоняющие процессоры с риском для стабильности системы, но и добропорядочные пользователи, строго придерживающиеся спецификаций. Здесь, правда, следует сделать поправку на некоторые особенности архитектуры K8 (см. врезку); да и прирост производительности от 10-20% прибавки пропускной способности оперативной памяти не очень большой, однако в целом - штука чрезвычайно интересная. Для ее поддержки (чтобы появилась возможность выбрать «быстрые» разновидности оперативной памяти) требуется обновить BIOS; соответствующие апдейты к своим материнским платам многие производители уже выпустили. Правда, из-за того, что JEDEC (организация, занимающаяся выработкой стандартов на оперативную память) и DDR400-то стандартизировала «со скрипом», а о более быстрой памяти DDR пока и речи не идет, гарантировать, что свежекупленная «оверклокерская» память и процессор заработают на заявленных таймингах без проблем, вам никто не сможет.

Заявленное максимальное тепловыделение (TDP) осталось тем же, что и у «старичка» FX 55 (104 Вт): чуть ниже TDP новых двухъядерных процессоров (110 Вт), тоже основанных на степпинге E4. С полутора до 1,4-1,35 В снизилось напряжение питания ядра; слегка увеличился потребляемый при работе ток; однако проблем с совместимостью нового процессора со старыми схемами питания (VRM) возникнуть не должно[За исключением совсем уж дешевых или старых материнских плат, не обеспечивающих совместимости с FX55 и 90-нм процессорами]. По-прежнему разблокирован на повышение коэффициент умножения процессора; правда, разгоняется FX 57 пока довольно умеренно (с воздушным охлаждением можно заведомо рассчитывать разве что на 3,0 ГГц). Кстати, в отличие от тех времен, когда в линейке Athlon 64 FX фигурировал один и только один процессор, старый FX 55 будет выпускаться по-прежнему, но уже в 90-нм исполнении[Предыдущий вариант изготовлялся по старому 130-нм технологическому процессу, но якобы с некоторыми хитрыми «доработками» (выдвигались даже гипотезы о применении в FX 55 технологии DSL и частичном использовании 90-нм норм для критичных участков). Учитывая колоссальную стоимость разработки отдельного степпинга специально для ничтожного по объему выпуска FX 55, информация эта относится скорее к разряду мифических] и в степпинге E4. Вполне разумное решение, учитывая более приемлемую ($827) цену «младшей» модели и то, что «идеология» линейки FX (топовые и только топовые процессоры, лучшие в мире) при этом не нарушается: что FX55, что FX57 в своей «игровой» нише все равно конкурентов не имеют.

Модель: Airbus A380, Длина: 73 м, Высота: 24 м, Вес: 275 т (пустой), Максимальная скорость: 1050 км/ч, Крейсерская скорость: 1000 км/ч, Высота полета: 13000 м, Максимальная дальность полета: 13000 км, Двигатели: четыре двигателя Rolls-Royce Trent 900 или Engine Alliance, Количество посадочных мест: 555, Цена: $280 млн.

Тесты производительности

Ограниченность журнального пространства, к сожалению, не позволяет рассказать о полученных результатах подробнее. Так что просто смотрите в таблицу, а я постараюсь кратко прокомментировать самые интересные из них.

В играх Athlon 64 FX 57 просто нет равных. Причем чем новее и требовательнее к процессорным ресурсам игра, тем больше отрыв Athlon 64. В Half-Life 2 с его сложной реалистичной физикой (на движке Havok 2) отрыв FX 57 от лучшего решения Intel (Pentium 4 670) составляет, ни много ни мало, аж 36%! Причем обещанный в недалеком будущем FX 59 может довести этот разрыв до совсем уж неприличной полуторакратной (!) разницы; а никакого достойного «противовеса» в ближайшие несколько лет (!) Intel нам не обещает. Да, с появлением хорошо распараллеленных многопоточных игр ситуация может измениться; да, в играх с менее развитой (UT 2004 - 26%) и совсем неразвитой (Doom 3 -14%) физикой разница в производительности не столь значительна, однако то, что на ближайшие два года Athlon 64 FX будет безусловным лидером в играх, можно не сомневаться.

Вторая область, где FX безоговорочно лидирует, - это «интерактивные приложения». Буквально везде, где программа активно взаимодействует с пользователем, а не считает тихонечко чего-нибудь пару часов, Athlon 64 FX 57 без труда опережает всех преследователей.

***

Рендерить трехмерные сцены или кодировать видеофильмы пока, впрочем, лучше на процессорах Intel. Правда, на двухъядерных процессорах AMD это получается еще быстрее, но это уже совсем другая история. Однако положительные сдвиги у AMD есть и в этой области: например, в наших тестах FX 57 впервые сумел обогнать Pentium 4 670 при кодировании видео с помощью довольно популярного Windows Media Encoder 9. Да и в остальных тестах отставание не столь велико: скорее всего, заметной разницы вы здесь не почувствуете.