手把手建立Roofline模型(CPU)
Roofline模型原理
Roofline模型是由加州理工大学伯利克提出的用来建立当前计算平台在不同的计算强度(Operational Intensity)下能够达到的理论计算上限 。论文和基础理论和应用 Roofline Model与深度学习模型的性能分析 。本文旨在教授如何根据当前开发环境机器建立该模型,并简单的介绍如何根据算法计算OI(计算强度)。
需要准备的硬件参数
对于CPU而言,我们需要一下参数:
频率 | 内存带宽(double) | Avx512 Unit | Fma | |
---|---|---|---|---|
Intel® Xeon® Gold 6148 | 2.7GHz | 39.74GB/s | 2 | 2 |
其中Avx512、Fma并非是必备参数。
查询CPU相关指标方法或网站:
- <https://ark.intel.com/content/www/us/en/ark/products/120489/intel-xeon-gold-6148-processor-27-5m-cache-2-40-ghz.html>
- <https://en.wikichip.org/wiki/intel/xeon_gold/6148>
- 在
LINUX
下可以使用lscpu
查询.
计算相关参数:
当前CPU的理论峰值:
[理论性能峰值 ={频率*512*AVX数量*FMA over 32/64}
]