-
4 votesanswersviews
如何监控Xeon Phi上10Hz的核心利用率?
我一直试图以相对较高的频率测量/监控Xeon Phi(Knights Corner,有序处理器)上所有这60个核心的利用率,比如至少每0.1秒产生10Hz . 我尝试了最新的PAPI库 . 但它只支持PAPI_TOT_INS,这是已完成指令的计数器 . 这不起作用,因为我实际上需要与每0.1秒发出的指令相关的东西,而不是完成 . 在不同周期发出的几条指令可以在同一周期完成 . 指令的问题受核心是否... -
2 votesanswersviews
PAPI性能可以解决AMD Opteron 6172上的问题
我一直在尝试用AMD Opteron 6172处理器上的性能计数器分析某些应用程序(用C语言编写),运行Red Hat Enterprise Linux Workstation 6.2版(圣地亚哥) . 我正在使用PAPI v4.1.3.0,它使用AMD本机事件CPU_CLK_UNHALTED用于PAPI_TOT_CYC(计算总周期)和DATA_CACHE_ACCESSES用于PAPI_L1_DC... -
1 votesanswersviews
PAPI专柜问题
我编写了以下代码来获取L3缓存未命中信息 . #include <stdlib.h> #include <stdio.h> #include <math.h> #include <papi.h> int main( int argc, char *argv[] ) { int i; long long counters[3]; cou... -
1 votesanswersviews
使用papi监控运行过程的性能计数器
如何使用PAPI监控已经运行的进程的硬件计数器? 任何帮助将受到高度赞赏 . 谢谢Shuja -
2 votesanswersviews
PAPI:时钟参考周期是什么意思?
我正在使用PAPI liberary来调整和描述我的应用程序 . 我想知道什么(PAPI_REF_CYC:参考时钟周期)实际意味着什么? 提前致谢, -
1 votesanswersviews
英特尔C编译器(icc)中的虚假自动向量化
我需要在程序中使用SSE向量化一些巨大的循环 . 为了节省时间,我决定让ICC处理它 . 为此,我准备好数据,考虑到对齐,我使用了编译器指令 #pragma simd ,_ #pragma aligned , #pragma ivdep . 使用多个 -vec-report 选项进行编译时,编译器会告诉我循环是向量化的 . 快速查看编译器生成的程序集似乎可以确认,因为您可以找到大量的矢量指令,...