愛あるセレクトをしたいママのみかた

SC14 - Top500に見るスパコン界の状況

マイナビニュース
SC14 - Top500に見るスパコン界の状況
●新設台数が鈍化し高齢化が進むスパコン
○スパコンの新設はスローダウンしている

恒例であるが、SC14で第44回のTop500の「BoF(Birds of a Feather:同じ羽を持つ鳥の集まり、転じて同好の士の集まり)」が開催された。今年1月に、Top500の創始者の1人であるHans Meuer教授が亡くなったので、委員会のメンバーはご子息のMartin Meuer氏に交代している。

なお、Samuel Williams氏はHPGMG、Mike Heroux氏はHPCGという新しいベンチマークプログラムの説明のための参加であり、Top500委員会のメンバーではない。

Top500というとリストの順位だけが注目されるが、その価値は単なる番付表というだけでなく、その中身を分析して行くと、スパコン界の状況が見えてくるという点が重要である。

今回のTop500では、1位の天河2号から9位のVulcanまで、前回のリストからまったく変動がなく、かろうじて10位に米国政府機関のCray CS-Stormスパコンが入ったということだけが変化である。

右側の図は、これまでの毎回のTop500リストで、何システムの新しいスパコンがリスト入りしたかを示している。もちろん、毎回、新システムの数は変動するが、概ね、150~200システムという状況が2013年6月までは続いていた。しかし、その後、新システムの数は急減し、今回は78システムになってしまった。
明らかに、2013年以降は、Top500リスト入りする規模のスパコンの新設がスローダウンしている。

新設のスローダウンの結果、リストに入っているスパコンの平均年齢が上がってきている。左上の図のように、2011年頃までは平均1.27年前後で推移していたが、それ以降、平均年齢が上がってきて、今回のリストでは2.9年と過去の2倍以上の年齢となり、Top500の世界も急速に高齢化が進んでいる。

右上の図は、500システムの性能の合計の値の直前のリストからの伸びを示すものである。このグラフはアップダウンが激しいが、過去にはおおむね1.9倍弱程度とムーアの法則の1.6倍(なぜ、ムーアの法則が1.6倍かは不明)を上回る伸び率で推移してきたが、このところ1.2倍程度という低い伸びになっている。左下の図は、Top500全システムの性能の合計、1位のシステムの性能と500位のシステムの性能の推移を折れ線グラフで示したもので、1位の性能の線はでこぼこしているが、合計と500位の性能は片対数グラフに綺麗に乗っていた。しかし、2011年ころから500位の性能の伸びがスローダウンし始め、2014年には合計の数値の伸びもスローダウンの兆候が出始めている。

右下の図は、性能の合計値が500システム合計の性能値の半分となる順位の推移を示すグラフで、2010年頃までは上位50~70システムの性能合計が全システムの性能合計の半分を占めるという状況であった。
しかし、このところ上位10~30システムで半分を占めるという状況になっている。これは性能の高い大規模システムと性能の低い小規模システムとの2極化を意味している。

次の左上の図は、システムの平均性能の推移と1個のプロセサの性能の推移を示すもので、縦軸は適当にスケールされているので、絶対的な値は意味はない。この図から明らかなのは、プロセサの性能の向上にくらべて、システム性能の伸びの方が大きく、テクノロジの伸びだけではスパコンに必要とされるたけの性能向上を支えることは出来ず、使用するプロセサの個数の増大で対処しているという状況になっているということである。

右上の図は、500システム全体で、GPUなどのアクセラレータが占めるFlops値の合計を示すものである。2012年から2013年に掛けて、アクセラレータのFlops値の急速に増加したが、その後は、伸び率が減少している。

左下の図は、アクセラレータのFlops値が全体のFlops値の中で占める割合を示したもので、このところ34%くらいのところで留まっており、どんどんアクセラレータのFlops値が伸びて、Top500全体の性能を引き上げて行くという状況ではない。

右下の図は、LINPACKのFlops値を消費電力で割ったエネルギー効率の図であり、リストの中で最も効率の良いシステムのFlops/W値は順調に伸びているが、下位のシステムでは効率の改善が遅れていることを示している。
Top10システムでは2000GFlops/kW程度になっているのに対して、Top50システムでは1500GFlops/kW、Top500システム全体では1000GFlops/kWとTop10に比べて半分の効率でしかない。●今後もBellの法則は成立するのか?
○Gordon Bell氏が提唱したBellの法則

Gordon Bell賞の創始者であるBell氏は、おおよそ10年ごとに新しい重要なクラスのコンピュータが出現するというBellの法則を提唱した。次の右上の図は、それぞれのアーキテクチャのシステムがTop500システムの中で占める割合を示したグラフで、1994年頃まではベクトルスパコンの時代であった。しかし、それ以降は、(IBMのPOWERや富士通のSPARC64のような)カスタム設計されたスカラCPUを使うスパコンが多数を占める時代となり、これが10年程度続いた。まさにBellの法則が当てはまる状況であった。

そして、2003年頃になると、x86などの市販の汎用プロセサを使う小規模サーバをクラスタ接続するマシンが主流を占めるようになり、この状況は現在も続いている。
アクセラレータを使うマシンが増え始めているが、近い将来、これが主流となり、汎用CPUだけのクラスタシステムの時代が終わって、Bellの法則が成り立つようになるのかどうかは、まだ分からない。

Top500スパコンの性能の伸びがこのところスローダウンしていることは明らかであるが、2015年から2017年頃に掛けて、100~数100PFlops級のスパコンの設置計画が米国や中国をはじめとしていくつか出てきており、現在のスローダウンは一時的なものであるという見方もある。
一方、ムーアの法則もスローダウンしており、テクノロジの伸びとスパコン性能の伸びの乖離が大きくなり、システムが巨大化し、コストも高くなるので、Top500級のスパコンの調達がスローダウンしてきているという見方もあり、どちらが正しいのかは、まだ、はっきりしない。

次の2つの図は、国別の性能合計の伸びと、今回のTop500リストでの国別のシステム数を示すパイチャートである。

国別の性能合計では、米国が一貫してトップを走っており、EU全体の合計の性能も、概ね、米国の線と並行で推移している。日本と中国の線を見ると、中国の急速な性能向上が目立つ。2010年以降でいうと、京コンピュータの完成で一時的に逆転したが、それ以外では、中国の性能合計が日本のそれを上回っている。

国別のシステム数では、米国がほぼ半分の46%を占め、中国が12%でそれに続いている。こちらのグラフはEU全体のまとめでなく国別になっており、日本、英国、フランス、ドイツの各国が5~6%というレベルで並んでいる。

Top500の世界では、このところの性能の伸びのスローダウンが今後どうなっていくのか、近い将来、現在の汎用CPUだけのコモディティクラスタの時代が終わり、新しいクラスのコンピュータの時代に変わるのかが注目される。


また、Top500は密行列を計算する性能を測っているが、これでは現代の問題を代表していないということから、HPGMGやHPCGベンチマークが提案されており、これらのベンチマークで測ると、性能の伸び方が、ある程度変わって見えることになるかも知れない。

Bellの法則の新しいクラスのコンピュータは、HPLの計算性能を上げるのではなく、ストレージを含めてビッグデータの処理性能を画期的に引き上げるという方向に行く可能性が高く、HPL性能で計測している限り、新しいクラスのコンピュータの台頭は見えないかも知れない。Top500の分析は、どのようにスパコン界が動いて行くかについて考えるヒントを与えてくれるが、スパコン界の動きを理解するためには、Top500以外のより広い範囲の分析も必要となる。

そしてスパコンへの投資額は、国家間の競争や安全保障などにも影響される。その点で、中国の急速な台頭や国別のシェアもスパコン界の動向に影響を与える重要な要素であり、スパコン界は目が離せない状況となっている。

提供:

マイナビニュース

この記事のキーワード