我一直试图以相对较高的频率测量/监控Xeon Phi(Knights Corner,有序处理器)上所有这60个核心的利用率,比如至少每0.1秒产生10Hz .

我尝试了最新的PAPI库 . 但它只支持PAPI_TOT_INS,这是已完成指令的计数器 . 这不起作用,因为我实际上需要与每0.1秒发出的指令相关的东西,而不是完成 . 在不同周期发出的几条指令可以在同一周期完成 . 指令的问题受核心是否停止的影响 .

其他可用的命令如'top'和'perf'在1Hz下工作,这对我的测量来说太慢了 . 我需要更高的频率 . 而且,我还需要将测量与我的代码的重要阶段同步 . 因此,英特尔Vtune配置文件对我也不起作用 .

我是否有可能监控Xeon Phi上的指令问题或与其利用相关的任何其他活动?我知道那些硬件计数器在那里,但阅读它们对我来说似乎非常具有挑战性 . 也许我可以通过测量每个线程的CPU时间来推断这种利用率?

谢谢 .