2016年3月18日 13:00
コンピュータアーキテクチャの話 (350) NVIDIAの世代別GPUに見るハードウェアの違い
しかし、逆に言うと、PTXというベールを通してGPUハードウェアを見ることになるので、ハードウェアの構造が分かりにくいという面があり、この記事のようなハードウェアの解説を書くことを難しくしている。
そして、NVIDIAのGPUは世代ごとに、そのハードウェアの作りやハードウェアの物量はかなり変わってきているので、NVIDIAはCompute Capability(CC)という形でどのような違いがあるのかをまとめている。CCはTeslaが1.0~1.3(図3-46、3-47には含まれていない)まで、Fermiが2.x、Keplerが3.x、そしてMaxwellが5.xとなっている。
例えば、CC 1.xでは、グリッドは2次元までであったが、2.0以降では3次元のグリッドが扱え、ブロックに含む最大スレッド数も512から1024に増加している。また、SMが扱えるブロック数は、Fermiでは8個であったが、Keplerでは16個、Maxwellでは32個と世代ごとに倍増している。また、倍精度浮動小数点数が扱えるようになったのはCC 1.3以降であり、CPUとGPUのメモリの統一アドレスが可能になったのはCC 3.0以降、GPUで実行される関数から、GPUで実行される関数を呼び出すDynamic Parallelismが使えるのはCC 3.5以降といった具合である。
ミュージカル『この世界の片隅に』こうの史代×昆夏美×大原櫻子×アンジェラ・アキの座談会が実現