手把手建立Roofline模型(CPU)

手把手建立Roofline模型(CPU)

Roofline模型原理

Roofline模型是由加州理工大学伯利克提出的用来建立当前计算平台在不同的计算强度(Operational Intensity)下能够达到的理论计算上限 。论文和基础理论和应用 Roofline Model与深度学习模型的性能分析 。本文旨在教授如何根据当前开发环境机器建立该模型,并简单的介绍如何根据算法计算OI(计算强度)。

需要准备的硬件参数

对于CPU而言,我们需要一下参数:

频率 内存带宽(double) Avx512 Unit Fma
Intel® Xeon® Gold 6148 2.7GHz 39.74GB/s 2 2

其中Avx512、Fma并非是必备参数。

查询CPU相关指标方法或网站:

  • <https://ark.intel.com/content/www/us/en/ark/products/120489/intel-xeon-gold-6148-processor-27-5m-cache-2-40-ghz.html>
  • <https://en.wikichip.org/wiki/intel/xeon_gold/6148>
  • LINUX 下可以使用lscpu 查询.

计算相关参数:
当前CPU的理论峰值:

[理论性能峰值 ={频率*512*AVX数量*FMA over 32/64}
]

hmoban主题是根据ripro二开的主题,极致后台体验,无插件,集成会员系统
自学咖网 » 手把手建立Roofline模型(CPU)