首页 文章

用于多核的Vtune放大器XE?

提问于
浏览
1

我正在使用Intel Vtune Amplifier XE 2013来分析在多核CPU上运行的并行程序,特别是它是用OpenCL编写的,并在Xeon Phi中执行 . 我想知道如何对Vtune带来的结果的确切解释,即

  • 是单个线程还是整个核心收集的性能计数器的值? (假设CPU中有许多内核,并且可以在内核上同时执行许多线程,例如Xeon Phi) .

  • Vtune如何在多核CPU上进行采样?它是在单个核心上进行采样并报告,还是在多个核心上进行采样并取平均值?

2 回答

相关问题