GTC 2015 - 東大/筑波大のTightly Coupled Accelerator「TCAの性能編」
QUDAではメッセージサイズが小さい場合、PEACH2は良い結果を示しているが、実行時間の短縮までは示すことが出来なかったという。
ただし、Panda先生の最新版は大幅な性能向上が行われており、InfiniBandを使うMPIの性能も上がってきている。また、NVIDIAは独自のPCIeより高性能のNVLINKを次世代のPascal GPUからサポートする計画であり、独自のインタコネクトを作ることの必要性は薄れてきているのではないかと思われる。
しかし、アクセラレータ間に高速、高バンド幅の通路を持つことが有効であることが、ピーク性能364TFlopsという規模のスパコンで実証されたことは、研究として意義があると考えられる。