Cortex-A15比で最大3.5倍の性能向上はどのように実現しているのか? - ARM、Cortex-A72の詳細を公開
28nmプロセスのままでCortex-A57/Cortex-A72を製造した場合でも、Cortex-A57で40%ほど、Cortex-A72では50%消費電力を下げられる。この結果としてその分動作周波数を上げられる訳だが、さらにプロセスノードを変更することで消費電力を大きく落とせることが判る。
Cortex-A72のもう1つの特徴は、当初からMobile以外の用途を考慮していることだろう(Photo04)。これはCortex-A57でも同じだが、ECCの搭載や大規模クロスバーの採用などサーバにも適した特徴を備えており、さらにはADAS向けなどの用途も念頭においているとする。
さて、ここからはInternalの話である。この図そのものは、すでにARMのWebサイトにも掲載されているものである。まずフロントエンドのFetch/BPU(Branch Prediction Unit)の話。この段階では3つのARM命令(32bit/64bit)を1cycleで取り込む形になる。
実はこの時点で分岐予測に関してかなり色々な処理をやっているらしく、分岐予測の精度を上げると共に不要な分岐予測のアクセスを抑制するとしている。