Выбрать главу

Самое заметное новшество K10 состоит в том, что эта архитектура изначально рассчитана на четыре процессорных ядра, из чего следует добрая половина остальных изменений. Тогда как Intel сделала четырехъядерный Kents-field, упаковав в один конструктив два кристалла Conroe, AMD решила не плодить "сиамских близнецов": Phenom представляет собой более элегантное решение с единым камнем. Теоретически это должно давать ему преимущество в быстродействии (ядра избавлены от необходимости общаться через системную память), но, как однажды заметил по этому поводу представитель Intel, пользователю все равно, что находится под крышкой процессора, если он быстрее. Окажется ли Phenom быстрее - большой вопрос. В то же время раздельное производство "половинок" для четырехъядерного CPU гораздо выгоднее, так как годных чипов с конвейера выходит больше. У AMD с этим могут возникнуть трудности - "камень" огромный, состоит из 463 млн. транзисторов. При изготовлении используется техпроцесс 65 нм. В этом Intel пока безусловно впереди: обновленные процессоры Core 2 Duo под кодовым названием Penryn уже готовы к массовому выпуску на 45 нм, а Phenom перейдет на такое исполнение лишь в нынешнем году.

Так вот, первое следствие настоящего четырехъядерного дизайна Phenom и один из самых громких рекламных лозунгов AMD - это новая организация кэш-памяти. Фирма по-прежнему испытывает трудности с ее объемом и не может угнаться за Intel в искусстве выпускать крупные чипы с регулярно уменьшающимся техпроцессом: процессоры Penryn уже хвастаются памятью до 12 Мбайт! В прошлом ситуацию спасал чрезвычайно быстрый встроенный контроллер памяти, отчасти уменьшавший нужду в больших кэшах. Теперь же поневоле пришлось раскошелиться на дополнительные транзисторы: четыре ядра для эффективной работы обязаны обладать общим хранилищем данных. В четырехъядерных Core 2 эту задачу решает разделяемый кэш L2 в каждой паре ядер. AMD сочла такой дизайн слишком сложным и решила оставить иерархию памяти K8 как есть, лишь добавив надстройку в виде общего кэша L3. Кроме общих данных, в нем хранится и весь получаемый процессором код, а каждое из четырех ядер снабжено 64 килобайтами персонального кэша первого уровня и 512 килобайтами второго.

Сам контроллер памяти - конек всех последних процессоров AMD - стал еще более эффективным. Говоря точнее, их теперь две штуки: по одному на каждый канал. Многоядерному процессору это дает ощутимое преимущество, особенно в случае работы с разными потоками. Если же этого не требуется, контроллеры могут перейти в сгруппированный режим, имитируя один. Кроме того, устройство поумнело и научилось выжимать последнее из пропускной полосы памяти: операции записи теперь накапливаются в специальном буфере, и как только набираются в достаточном количестве, выполняются скопом. Заодно происходит слежка за всеми обращениями к оперативке, и потенциально нужные данные заранее скачиваются в "мини-кэш" контроллера. Такая предвыборка на общем уровне тоже приходится весьма кстати для многоядерного CPU. Однако на все эти хитрости AMD пошла не спроста, ведь в поддержке памяти Phenom пока ограничен DDR2 c частотой 1066 МГц, хотя и к работе с DDR3 потенциально готов. AMD снова скептически относится к новому типу памяти, предоставляя другим фирмам прокладывать дорогу прогрессивным стандартам, благо Intel всегда готова быть первопроходцем. Но на самом деле, DDR2 Phenom хватает за глаза, поскольку частота фронтальной шины у него так и не поднялась выше 800 МГц, тогда как Intel готовится удвоить этот показатель. Зато шина HyperTransport прогрессировала до версии 3.0 и теперь будет работать на частотах до 2 ГГц в каждую сторону в зависимости от модели процессора.

Архитектура K10 полна малозаметных по отдельности усовершенствований, копирующих некогда эксклюзивные качества Core 2 Duo. И память - лишь вершина айсберга; куда больше инженеры поработали над вычислительным ядром процессора. Если при работе с данными задержки уменьшает предвыборка, то для того, чтобы непрерывно работали исполнительные устройства, нужно предсказание ветвления кода программы. У K8 оно работало отлично, только в одном Intel была впереди. Pentium M, а затем и Pentium 4 с ядром Prescott обзавелись непрямым предсказателем ветвлений. Что это за устройство? Вместо предсказания конкретной инструкции он лишь указывает место в памяти, где она может оказаться. Prescott в свое время немало выиграл от такого блока, со своим конвейером непомерной длины. У Phenom такой проблемы нет, но AMD решила, что и ему новинка пойдет на пользу. Кроме того, и обычные предсказатели Phenom работают эффективнее, чем раньше. Еще у современных процессоров Intel есть такая важная особенность, как выполнение определенных инструкций загрузки заранее, в обход других команд, стоящих в очереди. В результате, вместо того чтобы дожидаться поступления данных, расчеты, для которых они нужны, получают их немедленно. Это неплохое подспорье для процессора, при том что загрузки составляют около трети всего кода в современном софте. У процессоров K8 таких возможностей не было, а у K10 - уже есть.