GTC 2015 - NVIDIAの新製品発表とDeep Learning
GTC 2015の基調講演で、Jen-Hsun Huang CEOは次の4つ発表を行った。
Titan Xの発表については、すでにレポートしたので詳しくは触れないが、3072コアを集積するMaxwellアーキテクチャのGM200チップを使うトップエンドのコンシューマ向けGPUである。ハイエンドのGTX 980と比較するとCUDAコア数は1.5倍に増加し、コアクロックは多少低めに抑えられているが、ほぼコア数に比例して演算性能が向上している。
GM200チップの1つの目玉がFP16と呼ぶ16ビットの浮動小数点数のサポートである。全体が16bitしかないので、Exponentは5bit、Fractionは10bitであり、値の有効桁数が少なく、表現できる数の範囲も狭いが、画像などの表現には十分である。そして、通常GPUが扱う32ビットのFP32の半分のメモリで済み、演算器を多少改造すれば1サイクルに2つの数の演算を並列に実行できる。このため、演算性能が倍増するというメリットがある。
画像認識を行うDeep Learningでは、入力は画像データであり、FP16で十分である。
そして、認識のアルゴリズムの主要な部分はGPUの得意な行列積計算である。