GTC 2015 - NVIDIAの新製品発表とDeep Learning
メモリバンド幅の観点では、 HBMをGPUと同一のパッケージに搭載する2.5D実装となるPascalでは750GB/sと、GDDR5を使うMaxwellと比べて3倍のメモリバンド幅が得られている。しかし、Voltaでは、900GB/sへの向上となっており、同一テクノロジでのクロック向上程度の改善となっている。
HGEMMでは、PascalはMaxwellの4倍弱の性能向上。メモリバンド幅は絶対値では3倍であるが、データのサイズがFP16で半減しているので、結果として6倍のデータをメモリとの間で転送できる。Deep Learningの処理では、これらを合わせてGPU部分で5倍、そしてNVLINKでGPUチップ間の転送が速くなることから2倍の性能向上を見込んで、PascalはMaxwellの10倍の性能と称している。しかし、性能向上はプログラムによっても変わり、これは非常に粗い見積もりであるという。
4つの発表の最後が自動運転である。現状のADAS(Advanced Driving Assistant System)は前の車や歩行者、交通標識、道路のレーンマーカーなどを専用のロジックで認識して運転を補助しているが、NVIDIAはディープニューラルネットワーク(DNN)