Второй козырь нового степпинга - поддержка набора инструкций SSE3, впервые появившегося в Pentium 4 Prescott[И поэтому также известного как Prescott New Instructions (PNI)]. Тринадцать новых инструкций (из которых две - MONITOR и MWAIT, связанные с технологией HyperThreading, - выделены в особый «подблок» и процессорами AMD принципиально не поддерживаются) есть своеобразная «работа над ошибками»; инженеры Intel посчитали целесообразным добавить их по итогам практического использования действительно новаторских SSE/SSE2. Каждая такая инструкция фактически рассчитана на использование буквально в одной-двух ситуациях, когда традиционные схемы требуют «недостаточно быстрых» (как в случае с HADDPS, осуществляющей сложение компонентов внутри одного вектора) или «некрасивых решений» (в случае с FISTTP, округляющей число в сторону нуля, как того требует стандарт языка C, независимо от выбранного для сопроцессора режима округления). Потенциально все эти инструкции способны многократно повысить производительность некоторых участков кода; на практике[Подробности см. на www.anandtech.com/cpuchipsets/showdoc.aspx?i=2350] же такие участки встречаются сравнительно редко и с трудом поддаются «компиляторным» оптимизациям (программисту требуется либо использовать стандартные, вручную оптимизированные библиотеки, либо возиться с оптимизацией «критичных» участков кода на ассемблере, что требует сегодня очень высокой квалификации). Вдобавок для «неудачных» языковых конструкций (типа округления чисел с плавающей точкой в x87) давно найдены эффективные «обходные пути» с использованием «нетиповых» инструкций (PF2ID, CVTSS2SI или CVTPS2PI вместо стандартной FISTP). В итоге прирост производительности от поддержки SSE3 составляет всего пару процентов, лишь изредка доходя до 7-8%[В некоторых подтестах прирост производительности куда больший - до 25%, однако в целом даже в таких приложениях итоговая производительность увеличивается ненамного. Например, прирост скорости при кодировании видео в DivX - 0,26%]. Так что ожидать от SSE3 многого не приходится, однако «фича» это приятная.
Третье достоинство степпинга E - усовершенствованный контроллер памяти[По неофициальной информации, степпинг D имеет проблемы с интегрированным контроллером памяти: некоторые процессоры нестабильно работали даже на номинальных частотах. Правда, скорее всего, «бракованные» CPU были простой перемаркировкой своих менее дорогих и менее шустрых собратьев: тогда на рынке присутствовало много поддельных процессоров AMD, что даже вынудило компанию практически отказаться от треевых поставок в пользу боксовых (PIB) процессоров, надежно защищенных от подделок]. В основном изменения касаются улучшенной совместимости контроллера с «быстрыми» типами оперативной памяти - теперь можно использовать гораздо более быструю 1T-адресацию с одиночными (по одному на канал памяти, коих у Sempron один, а у Athlon 64 - два) модулями памяти практически любой организации (если сами модули, конечно, эту адресацию «вытянут») и с парами (для Athlon 64 это означает четыре модуля) односторонних модулей DDR400. Кроме того, появилась и долгожданная неофициальная поддержка нестандартной «быстрой» оперативной памяти стандартов DDR433, DDR466 и DDR500 без повышения тактовой частоты процессорной шины! Да-да, отныне преимуществами этих скоростных модулей смогут в полной мере насладиться не только оверклокеры, разгоняющие процессоры с риском для стабильности системы, но и добропорядочные пользователи, строго придерживающиеся спецификаций. Здесь, правда, следует сделать поправку на некоторые особенности архитектуры K8 (см. врезку); да и прирост производительности от 10-20% прибавки пропускной способности оперативной памяти не очень большой, однако в целом - штука чрезвычайно интересная. Для ее поддержки (чтобы появилась возможность выбрать «быстрые» разновидности оперативной памяти) требуется обновить BIOS; соответствующие апдейты к своим материнским платам многие производители уже выпустили. Правда, из-за того, что JEDEC (организация, занимающаяся выработкой стандартов на оперативную память) и DDR400-то стандартизировала «со скрипом», а о более быстрой памяти DDR пока и речи не идет, гарантировать, что свежекупленная «оверклокерская» память и процессор заработают на заявленных таймингах без проблем, вам никто не сможет.
Заявленное максимальное тепловыделение (TDP) осталось тем же, что и у «старичка» FX 55 (104 Вт): чуть ниже TDP новых двухъядерных процессоров (110 Вт), тоже основанных на степпинге E4. С полутора до 1,4-1,35 В снизилось напряжение питания ядра; слегка увеличился потребляемый при работе ток; однако проблем с совместимостью нового процессора со старыми схемами питания (VRM) возникнуть не должно[За исключением совсем уж дешевых или старых материнских плат, не обеспечивающих совместимости с FX55 и 90-нм процессорами]. По-прежнему разблокирован на повышение коэффициент умножения процессора; правда, разгоняется FX 57 пока довольно умеренно (с воздушным охлаждением можно заведомо рассчитывать разве что на 3,0 ГГц). Кстати, в отличие от тех времен, когда в линейке Athlon 64 FX фигурировал один и только один процессор, старый FX 55 будет выпускаться по-прежнему, но уже в 90-нм исполнении[Предыдущий вариант изготовлялся по старому 130-нм технологическому процессу, но якобы с некоторыми хитрыми «доработками» (выдвигались даже гипотезы о применении в FX 55 технологии DSL и частичном использовании 90-нм норм для критичных участков). Учитывая колоссальную стоимость разработки отдельного степпинга специально для ничтожного по объему выпуска FX 55, информация эта относится скорее к разряду мифических] и в степпинге E4. Вполне разумное решение, учитывая более приемлемую ($827) цену «младшей» модели и то, что «идеология» линейки FX (топовые и только топовые процессоры, лучшие в мире) при этом не нарушается: что FX55, что FX57 в своей «игровой» нише все равно конкурентов не имеют.
Модель: Airbus A380, Длина: 73 м, Высота: 24 м, Вес: 275 т (пустой), Максимальная скорость: 1050 км/ч, Крейсерская скорость: 1000 км/ч, Высота полета: 13000 м, Максимальная дальность полета: 13000 км, Двигатели: четыре двигателя Rolls-Royce Trent 900 или Engine Alliance, Количество посадочных мест: 555, Цена: $280 млн.
Ограниченность журнального пространства, к сожалению, не позволяет рассказать о полученных результатах подробнее. Так что просто смотрите в таблицу, а я постараюсь кратко прокомментировать самые интересные из них.
В играх Athlon 64 FX 57 просто нет равных. Причем чем новее и требовательнее к процессорным ресурсам игра, тем больше отрыв Athlon 64. В Half-Life 2 с его сложной реалистичной физикой (на движке Havok 2) отрыв FX 57 от лучшего решения Intel (Pentium 4 670) составляет, ни много ни мало, аж 36%! Причем обещанный в недалеком будущем FX 59 может довести этот разрыв до совсем уж неприличной полуторакратной (!) разницы; а никакого достойного «противовеса» в ближайшие несколько лет (!) Intel нам не обещает. Да, с появлением хорошо распараллеленных многопоточных игр ситуация может измениться; да, в играх с менее развитой (UT 2004 - 26%) и совсем неразвитой (Doom 3 -14%) физикой разница в производительности не столь значительна, однако то, что на ближайшие два года Athlon 64 FX будет безусловным лидером в играх, можно не сомневаться.
Вторая область, где FX безоговорочно лидирует, - это «интерактивные приложения». Буквально везде, где программа активно взаимодействует с пользователем, а не считает тихонечко чего-нибудь пару часов, Athlon 64 FX 57 без труда опережает всех преследователей.
Рендерить трехмерные сцены или кодировать видеофильмы пока, впрочем, лучше на процессорах Intel. Правда, на двухъядерных процессорах AMD это получается еще быстрее, но это уже совсем другая история. Однако положительные сдвиги у AMD есть и в этой области: например, в наших тестах FX 57 впервые сумел обогнать Pentium 4 670 при кодировании видео с помощью довольно популярного Windows Media Encoder 9. Да и в остальных тестах отставание не столь велико: скорее всего, заметной разницы вы здесь не почувствуете.