2015年4月2日 10:11
KEK、小型スパコン「Suiren(睡蓮)」でGreen500 1位を上回る性能/Wを達成
アクセラレータに転送し、アクセラレータでの計算が終わると、残った行列の全部のデータを(分割して)アクセラレータからホストCPUのメモリに転送する必要がある。
これに対して、元の行列をCPUのメモリではなく、PEZY-SC側のデバイスメモリに格納するようにHPLプログラムを書き換えることにより、必要な転送データ量を削減した。
行列をデバイス側のメモリに置くという計算法は2008年にTop500の1位となったRoadrunnerでも使われており、PEZY-SCでの独創ではないが、PEZY-SCの場合はDDR3 DRAMを使い32GBのメモリを登載しており、CPUメモリとの転送データ量をより少なくすることができるので、効果的である。また、デバイス側のメモリを使うことにより行列のサイズを896000元から960000元に増加させることができ、これも性能向上に貢献している。これらの改善によりLevel-1でのGreen500のスコアは6,217MFlops/W と25.5%向上し、Linpack性能も202.64TFlopsと13.8%向上している。
『怪我をさせたくない』子どもの寝顔を“眺めるだけ”の夫は、発熱した妻に【衝撃発言】を!?⇒結婚前にチェック!本性の見抜き方