Определение персонального суперкомпьютера на сегодняшний день звучит примерно так. Это сравнительно недорогой аппарат, который можно разместить на столе или рядом со столом (не требующий специального помещения), подключить к обычной розетке электропитания и получить такую вычислительную мощь, которая позволяет не то чтобы сразу претендовать на место в Top500, но по крайней мере оказаться примерно в той же категории компьютерных систем.
Всем этим параметрам удовлетворяет, в частности, представленная на конференции в Остине разработка компании nVidia под названием Tesla Personal Supercomputer. Ключевые характеристики топовой версии таковы: 960 процессорных ядер, совместно обеспечивающих производительность почти в 4 терафлопса при заявленной цене компьютера десять тысяч долларов. Достигаются эти показатели благодаря применению четырех графических акселераторов Tesla GPU, каждый из которых содержит 240 ядер. По свидетельству специалистов, получивших возможность ознакомиться с новинкой, эта конструкция без всяких натяжек представляет собой настольный суперкомпьютер. Подобные системы могут представлять собой обычный ПК (в слот расширения которого вставлены видеоускорители Tesla GPU) или стандартные модули для размещения в серверной стойке.
На этом примере видно, как быстро меняется представление о том, что считать суперкомпьютером. Всего лишь пять лет назад Tesla занял бы место среди двадцати самых быстрых систем планеты. Однако сейчас его производительности не хватает даже на то, чтобы попасть в Top500. Нижний порог для вхождения в эту элитную группу составляет ныне 12,6 терафлопса.
Впрочем, это не помешало графическим процессорам nVidia Tesla продемонстрировать свои выдающиеся вычислительные возможности и занять в рейтинге достойное 30-е место благодаря японским конструкторам. В Токийском технологическом институте уже известной вычислительной системе TSUBAME недавно всего за неделю был сделан большой апгрейд - добавлены в качестве математических сопроцессоров новые блоки Tesla S1070, что подняло пиковую производительность машины выше 160 терафлопс. По сути, речь идет о специализированных версиях того же самого GPU-процессора, который nVidia продает геймерам. Как и их игровые собратья, процессоры Tesla программируются с помощью языка CUDA, а когда объединяются с процессором общего назначения, то превращаются в мощнейшую машину для быстрых параллельных вычислений с плавающей запятой.
Хотя успех TSUBAME - пока единственный пример появления чипов nVidia в Top500, на конференции было множество свидетельств тому, что персональные суперкомпьютеры на основе мощных графических процессоров очень быстро завоевывают популярность. Такие системы работают во множестве академических институтов и университетов, вроде американского МТИ, германского Института Макса Планка, Кембриджского университета в Британии и др. Подсчитано, что уже по меньшей мере 28 производителей суперкомпьютеров и рабочих станций используют nVidia GPU, включая гигантов Dell, Lenovo и Asus.
Взгляд изнутри
Мы попросили прокомментировать ситуацию в суперкомпьютерной отрасли эксперта компании НР по данной теме, системного архитектора Евгения Лагунцова. По его мнению, для индустрии HPC сейчас актуальны прежде всего следующие тренды:
"Блейдизация" суперкомпьютеров. Блейд-платформы все чаще используются для построения и систем начального уровня (так называемых персональных суперкомпьютеров), и машин класса Top500, что объясняется высокой экономической эффективностью блейд-решений, их компактностью, низким энергопотреблением и тепловыделением, масштабируемостью и простотой в обслуживании. Эти факторы важны как для небольшого исследовательского отдела, покупающего "суперкомпьютер в коробке", так и для крупных лабораторий, использующих тысячи вычислительных узлов. Самая популярная аппаратная платформа в ноябрьском списке Top500 - HP BladeSystem, на ее долю приходится 201 из 500 мощнейших вычислительных систем мира.
"Персонализация" вычислительных систем. Производители все больше внимания уделяют низшему сегменту рынка - системам для персонального пользования, которые можно поставить под стол или в угол комнаты исследовательского отдела, небольшой лаборатории. Например, HP Cluster Platform Workgroup System представляет собой "суперкомпьютер в коробке", занимающий площадь менее 0,5 кв. м., подключающийся к обычным электрическим розеткам и работающий под управлением Windows HPC Server 2008 или различными вариантами Linux. При этом система может включать до 128 процессорных ядер Intel Xeon, обладать пиковой производительностью более 1,5 Тфлопс и содержать до терабайта оперативной памяти. Особенно важно, что здесь используются те же самые технологии, что и в мощнейших суперкомпьютерах, благодаря чему открываются фантастические возможности для роста при сохранении абсолютной совместимости.