本:「ペタフロップスコンピューティング」と地球シミュレータ
地球シミュレータ(ES2)
最近、ベクトル機に興味が湧いたので上記URLとTOP500や後で紹介する本などから地球シミュレータ(ES)と二代目で運用中のES2を較べてみた。
・CPUは500MHz(ベクトル部1GHz)SX-6相当からSX-9E 3.2GHzへ。CMOSスケールは150nmから65nm、性能は8GFlopsから102.4GFlopsへ。
・ノードあたりのCPU数は8つで変わらず、メモリは16GBから128GBへ。
・全ノード数は640(5120CPU)から160(1280CPU)へ。四分の一にはなっているがその分ノード性能が向上している。
・結合ネットワークは単段クロスバ 同軸(電気)から2段Fat-tree 光インターコネクトへ。
・ノード間データスループットは12.3GB/s(実効)から64GB/sへ。
・全ネットワークのデータスループットは8TB/sから10TB/sへ。
・演算性能 40TFlops→131TFlops(LINPACK Rpeak)
・ストレージ 0.6PB→1.5PB
たくさんのPE(CPU)を接続するのにインターコネクトは重要で、ESでは配線コストは上昇するが高速な単段クロスバを採用している。今回は2段Fat-treeで他の上位スパコンと同等の方式を採っているが、光接続で性能は向上している。
ストレージはたくさんの計算を順次実行するためには重要であるが、性能が3.2倍になった割には増加分が少ない気がする。TOP500上位を目指すために予算後回しなのかもしれない。(邪推)
ESからES2への変更は基本設計がほとんど同じままでスケールアップしたような印象を受ける。元のアーキテクチャが純ベクトル機の構成でスケーラブルだからだろう。筋がよいと言うのだろうな。
TOP500の最上位Roadrunnerを見るとRpeakで145.7TFlops。現在のTOP500リストは2008年11月のものだから、そろそろES2も登録されるのではないだろうか。三位以内にははいれそうな感じがする。
6/4追記:
新型「地球シミュレータシステム」、LINPACKベンチで122.4TFLOPSを達成(マイコミジャーナル)
NECの新型「地球シミュレータ」が国内最速を達成~実効効率は93.38%で世界最高(PCwatch)
"LINPACKのベンチマークで122.4TFLOPSの性能を達成した。"ベクトル型の実効性能の高さが実証された模様。
本の紹介:
意外と地球シミュレータそのものについての言及は少なく、いかにして高性能なベクトル型スパコンを作るかに焦点を当てている。
第一章は序文、第二章はスパコンの応用分野について。
第三章からは次世代計算機システムに関する必要機能を解説してあるが、すでに地球シミュレータ(ES)ありきでES2を目指しての言及が多い。
第四章はES2の青写真とも言うべきものである。次世代までに利用できそうな技術について解説してある。このため、ES2で実現した機能とは食い違う記述もある。
第五章はファシリティに関する章で、電源管理、省エネルギー、電磁ノイズ対策(照明を含む)、避雷対策について書かれてある。ES、ES2はこれらの土台の上に構築されているのだ。
第六章は次々世代に関するもので、不揮発性メモリや不揮発性ロジック、三次元実装技術といった現在研究中の内容が含まれている。特に不揮発性メモリ/ロジックはシミュレーションの一時停止/再開に非常に有効だろう。また、途中までの計算結果を元にいくつかのパラメータを試すのにも便利だ。
最近、ベクトル機に興味が湧いたので上記URLとTOP500や後で紹介する本などから地球シミュレータ(ES)と二代目で運用中のES2を較べてみた。
・CPUは500MHz(ベクトル部1GHz)SX-6相当からSX-9E 3.2GHzへ。CMOSスケールは150nmから65nm、性能は8GFlopsから102.4GFlopsへ。
・ノードあたりのCPU数は8つで変わらず、メモリは16GBから128GBへ。
・全ノード数は640(5120CPU)から160(1280CPU)へ。四分の一にはなっているがその分ノード性能が向上している。
・結合ネットワークは単段クロスバ 同軸(電気)から2段Fat-tree 光インターコネクトへ。
・ノード間データスループットは12.3GB/s(実効)から64GB/sへ。
・全ネットワークのデータスループットは8TB/sから10TB/sへ。
・演算性能 40TFlops→131TFlops(LINPACK Rpeak)
・ストレージ 0.6PB→1.5PB
たくさんのPE(CPU)を接続するのにインターコネクトは重要で、ESでは配線コストは上昇するが高速な単段クロスバを採用している。今回は2段Fat-treeで他の上位スパコンと同等の方式を採っているが、光接続で性能は向上している。
ストレージはたくさんの計算を順次実行するためには重要であるが、性能が3.2倍になった割には増加分が少ない気がする。TOP500上位を目指すために予算後回しなのかもしれない。(邪推)
ESからES2への変更は基本設計がほとんど同じままでスケールアップしたような印象を受ける。元のアーキテクチャが純ベクトル機の構成でスケーラブルだからだろう。筋がよいと言うのだろうな。
TOP500の最上位Roadrunnerを見るとRpeakで145.7TFlops。現在のTOP500リストは2008年11月のものだから、そろそろES2も登録されるのではないだろうか。三位以内にははいれそうな感じがする。
6/4追記:
新型「地球シミュレータシステム」、LINPACKベンチで122.4TFLOPSを達成(マイコミジャーナル)
NECの新型「地球シミュレータ」が国内最速を達成~実効効率は93.38%で世界最高(PCwatch)
"LINPACKのベンチマークで122.4TFLOPSの性能を達成した。"ベクトル型の実効性能の高さが実証された模様。
本の紹介:
意外と地球シミュレータそのものについての言及は少なく、いかにして高性能なベクトル型スパコンを作るかに焦点を当てている。
第一章は序文、第二章はスパコンの応用分野について。
第三章からは次世代計算機システムに関する必要機能を解説してあるが、すでに地球シミュレータ(ES)ありきでES2を目指しての言及が多い。
第四章はES2の青写真とも言うべきものである。次世代までに利用できそうな技術について解説してある。このため、ES2で実現した機能とは食い違う記述もある。
第五章はファシリティに関する章で、電源管理、省エネルギー、電磁ノイズ対策(照明を含む)、避雷対策について書かれてある。ES、ES2はこれらの土台の上に構築されているのだ。
第六章は次々世代に関するもので、不揮発性メモリや不揮発性ロジック、三次元実装技術といった現在研究中の内容が含まれている。特に不揮発性メモリ/ロジックはシミュレーションの一時停止/再開に非常に有効だろう。また、途中までの計算結果を元にいくつかのパラメータを試すのにも便利だ。
![]() | ペタフロップス・コンピューティング―地球シミュレータを原点に“和”のスパコンを求めて 谷 啓二 培風館 2007-05 売り上げランキング : 281328 Amazonで詳しく見る by G-Tools |
この記事へのコメント