2016年2月5日 09:00
コンピュータアーキテクチャの話 (347) CPUとは異なり、レジスタ対応が固定ではないGPU
、LD/STとSFUがそれぞれ4サイクルに4命令を受け付け可能となる。
合計では、サイクルごとに9命令の受付が可能であるが、それぞれの実行ユニットの受付可能命令数の制限の範囲内である必要がある。この制限を超えるような命令列の場合は、別のワープの命令を選ぶ、あるいは、制限を超える命令の発行を取りやめるなどの対応が取られると思われる。
Maxwell GPUではSMの構成が変更され、2個のワープスケジューラに4個のDispatcher、そして32個のCoreと8個のLD/ST、8個のSFUからなる実行ユニットが2組という構成になっている。なお、MaxwellではDP Unitを持つ科学技術計算向けの製品は、まだ、発表されていない。
そして、Maxwellのワープスケジューラには2つのDispatcherが付き、2サイクルに8命令を発行する。実行ユニットとしては、2つのCoreと4サイクルに1命令を実行できるLD/STユニットと4サイクルに1命令を実行できるSFUのグループがある。また、2つのワープスケジューラで共用の4個のTexture Unitがあるが、命令発行の観点からは、あまり影響がない。