Cortex-A15比で最大3.5倍の性能向上はどのように実現しているのか? - ARM、Cortex-A72の詳細を公開
またTLBやμBTB(Branch Target Buffer)の構造をCortex-A57から変更、効率を改善したとしている。またこれらのバッファはいずれもPower-optimized SRAMを利用しているとの事だ。
次がDecode/Renameであるが、Cortex-A57はMicroOps構造を取っており、通常のARM命令3つを最大5つのMicroOpsに変換するとする。また64bit命令の一部についてはInstruction-fusion(Intelで言うところのMacro Ops Fusion)を利用することが可能だとか。ただ後で確認したら、これは64bit命令だけではなく32bit命令でも行われているとのことだった。また機能的にはSIMD/FP周りの新命令が追加されたとしている。加えて、一般論としてプロセッサコアで一番消費電力が大きいのがDecode段(最近だとAVXのように256bit幅のSIMDとかがフルにうごくとこちらも馬鹿にならないが、そうした例外を除くとDecode段が一番消費電力が大きい)ということもあって、色々な省電力機構を実装したとしている。
さて、次がDispatch(Photo08)。