GTC 2015 - 巨大電波望遠鏡「SKA」でパルサーを見つける
結果として、Resample 8%、FFT 27%、Harmonic Sum 65%の実行時間比率であったのであるが、下記のように一番処理の複雑なFFTの時間が66%になった。そして、全体性能は最初のコードと比べて2.5倍になったが、まだ、450TFlopsである。メモリリミットなので、Pascalから採用されるHBMは性能向上に貢献しそうである。
SKA Midのデータをリアルタイムで解析するためには、分散を取り除くDedispersionで0.5ExaFlops、ResamplingとFFTで1.3ExaFlops、Harmonic Sumで0.5ExaFlops、その他0.1ExaFlopsで、合計2.4ExaFlopsの演算能力が必要という計算になる。稼働開始時期を考えると、これはTop500の1位に近い性能である。
この時期にはNVIDIAのVolta GPUが使え、1個のVoltaで実効6PFlopsが実現できるとすると、500ノード(ステーション)でそれぞれ2個のGPUがあれば良いと述べているが、6PFlopsは2~3桁楽観的な見通しではないかと思われる。