「京」TOP500 1位記念 スパコンのバックグラウンド

 事業仕分けとかそれに乗じて的外れのヒョーロンをしていた人々とは関係なく、中の人に近かった立場での感想。

画像


 TOP500は年2回(6月と11月)に世界一速い計算機を発表するサイトである。
今回めでたく京速コンピュータ「京」が世界1位に(富士通プレスリリース)になった。
京速コンピュータ「京」が世界1位に(理化学研究所プレスリリース)
プレスリリースで672筐体だったということは1筐体あたり102チップ搭載ということになる。(過去記事では98チップ)
また、プロセッサの動作周波数は2.0GHzだった。このあたりは前回プレエントリした時点でわかっていたはずなのだが見落としていた。
たくさんのプロセッサ(ノード)を接続するインターコネクトも重要。TofuについてはHot Chips 22 - 日米10PFlops級スパコンのインターコネクトの詳細が判明(マイコミジャーナル Hisa Ando)を参照。

 内訳を見てみよう。京も含めて上位はスカラー型の構成、XeonかOpteronで、GPU付きが目立つ。変わった構成は9位のRoadrunnerで、これはPowerXCell 8i 3.2GHz。まあ1位のSPARC64VIIIfxも変わってるが。
11位にBlueGene/PのPowerPC450 850MHz。そして遠く離れて67位に地球シミュレータ2(ES2)がいる。かつての王者(の後継)だ。TOP500中ES2のみベクトル型で、あと499台はスカラー型。
 京の勝因はなんといってもその物量。2位のTianhe-1Aのコア数の2.9倍だ。ただしGPUをコア数に含めているのかどうかはわからない。Rmax性能は3.2倍なので中国の本気度によっては次回追い越される可能性がある。
 67位のES2と比べてみよう。Rmax/コア数で1コアあたりの性能を単純比較すると、京は0.015、ES2は0.096になる。スカラー型と比べベクトル型の基本性能の高さがわかる。ただし、上位はもうスカラー型の物量による勝負になっている。

 当初、UNIXサーバは汎用機のリプレースとしてクライアント/サーバモデルで売り込んでいた。が、意外にもサーバ機は商用目的で作ったにも関わらず大学などからの引き合いが多かったのだ。
それは性能の高さだ。ワークステーションはSunを筆頭に普及していたし、HPのPA-RISC搭載ワークステーションはもっと速いということで導入されているケースもあった。HPはその後Itaniumで迷走することとなる。
 汎用プロセッサで生き残ったのはIBMのPOWER、富士通のSPARC64、IntelのXeon、AMDのOpteronだ。共通しているのはいずれのメーカーも自社でマイクロアーキを設計でき、最先端のプロセスで製造できる工場を持っていることだ。
浮動小数点に限って比較すると、演算のサイクル数はどのプロセッサでも変わらない。動作周波数が浮動小数点演算の基本的な性能を決める。
差があるとすればレジスタの本数だが、この中でSPARCアーキは32bit(V8arch)の頃から変わっていて、単精度ならば64本の浮動小数点レジスタが使えた。これはIA-64には敵わないが有利である。
あとは拡張性であるが、それを縛っているのは命令セットとそれを使うOSである。Xeon/OpteronはWindows,Linuxと縛りが多く簡単には拡張できない。SPARC64は大胆な拡張をした。倍精度浮動小数点レジスタを1コアあたり512本にした。
SPARCといえばレジスタウィンドウとディレイドスロットが悪名高いが、OutOfOrder実行でレジスタリネーミングすればレジスタウィンドウの煩雑さは物理レジスタに変換するときに隠蔽できるし、ディレイドスロット実行も投機的命令として扱えば問題ない。
 さて、SPARC64のHPCとしての源流はPRIMEPOWER HPC2500にある。2003年にTOP500デビューで、当時は地球シミュレータの陰に隠れていたが。以前から富士通はUNIXサーバにこれでもかというくらいのSMP化を行い、筐体をインターコネクトでくっつけて1コア=1チップの時代に最大128CPUモデルというのも出した。
SMPにするとメモリ位置によらずレイテンシが一定のためOSをいじらなくても良いという利点がある。当時Sunが提供していたSolarisを勝手にいじれないという事情もあった。結果的にスパコンで重要なインターコネクト技術が蓄積された。
この技術をベースにプロセッサを浮動小数点演算に特化したハードウェアを大量に接続したものが「京」である。

 だがしかし、だ。性能比較で見たとおり物量で勝っているので次回は抜かれる恐れがある。そしてIBMのPOWER7 Blue_Watersの存在だ。今回も登録されていない。IBMは隠し球を持っている。
次回もトップでいるためには、プロセッサの高速化、コア増強、GPU導入の検討が必要だろう。おそらく最初の二つはソケット互換ですでに着手しているはずだ。IA-32系も同様にコア数と動作周波数を増やしてくるだろう。
IA-32系と違って有利な点は、独自拡張の部分をソフトウェアで絞るように使いこなせば差が付けられることだ。IA-32系同士ではソフトで差を付けるのは難しい。

 こうやって各メーカー/団体/研究者が切磋琢磨して世界一を目指すことにより計算機の技術は向上し、シミュレーションも高速化され、科学技術・産業の発展に寄与するのだ。

おまけ:
本日の「京」(理化学研究所)

ブログ気持玉

クリックして気持ちを伝えよう!

ログインしてクリックすれば、自分のブログへのリンクが付きます。

→ログインへ

なるほど(納得、参考になった、ヘー)
驚いた
面白い
ナイス
ガッツ(がんばれ!)
かわいい

気持玉数 : 0

この記事へのコメント

この記事へのトラックバック