くらし情報『コンピュータアーキテクチャの話 (330) レジスタファイルとシェアードメモリ』

2015年6月5日 10:00

コンピュータアーキテクチャの話 (330) レジスタファイルとシェアードメモリ

このため、初期のGPUのメモリ階層は図3-19のようになっている。基本的には演算器は、レジスタファイルとシェアードメモリ(AMDはLocal Data Share:LDSと呼ぶ)を使って処理を行い、速度が遅いデバイスメモリはあまり使わないという計算モデルである。

このようにすれば、シェアードメモリは同じグループ(NVIDIAはWarpと呼び、AMDはWavefrontと呼ぶ)の32スレッド(Waverfrontは64スレッド)の並列アクセスをサービスできれば良い。デバイスメモリは大きな容量が必要であるので、別チップのDRAMが使われるが、シェアードメモリは、例えば16KBと容量が小さいので、高速SRAMを使ってチップ上に作ることができる。

シェアードメモリは、図3-20のようになっており、例えば、32スレッドのグループの場合、32バンクというような多数のバンクを持つ。32スレッドからのアクセスは、そのアドレス[7:2]に従って、どのバンクにアクセスするかが決まり、クロスバを使って目的のアドレスを担当するバンクに接続する。32スレッドからのアクセスが全て異なるバンクを使う場合は、シェアードメモリは32個のアクセスを同時に処理することができる。

新着くらしまとめ
もっと見る
記事配信社一覧
facebook
Facebook
Instagram
Instagram
X
X
YouTube
YouTube
上へ戻る
エキサイトのおすすめサービス

Copyright © 1997-2024 Excite Japan Co., LTD. All Rights Reserved.