首页 文章
  • 4 votes
     answers
     views

    如何监控Xeon Phi上10Hz的核心利用率?

    我一直试图以相对较高的频率测量/监控Xeon Phi(Knights Corner,有序处理器)上所有这60个核心的利用率,比如至少每0.1秒产生10Hz . 我尝试了最新的PAPI库 . 但它只支持PAPI_TOT_INS,这是已完成指令的计数器 . 这不起作用,因为我实际上需要与每0.1秒发出的指令相关的东西,而不是完成 . 在不同周期发出的几条指令可以在同一周期完成 . 指令的问题受核心是否...
  • 2 votes
     answers
     views

    PAPI性能可以解决AMD Opteron 6172上的问题

    我一直在尝试用AMD Opteron 6172处理器上的性能计数器分析某些应用程序(用C语言编写),运行Red Hat Enterprise Linux Workstation 6.2版(圣地亚哥) . 我正在使用PAPI v4.1.3.0,它使用AMD本机事件CPU_CLK_UNHALTED用于PAPI_TOT_CYC(计算总周期)和DATA_CACHE_ACCESSES用于PAPI_L1_DC...
  • 1 votes
     answers
     views

    PAPI专柜问题

    我编写了以下代码来获取L3缓存未命中信息 . #include <stdlib.h> #include <stdio.h> #include <math.h> #include <papi.h> int main( int argc, char *argv[] ) { int i; long long counters[3]; cou...
  • 1 votes
     answers
     views

    使用papi监控运行过程的性能计数器

    如何使用PAPI监控已经运行的进程的硬件计数器? 任何帮助将受到高度赞赏 . 谢谢Shuja
  • 2 votes
     answers
     views

    PAPI:时钟参考周期是什么意思?

    我正在使用PAPI liberary来调整和描述我的应用程序 . 我想知道什么(PAPI_REF_CYC:参考时钟周期)实际意味着什么? 提前致谢,
  • 1 votes
     answers
     views

    英特尔C编译器(icc)中的虚假自动向量化

    我需要在程序中使用SSE向量化一些巨大的循环 . 为了节省时间,我决定让ICC处理它 . 为此,我准备好数据,考虑到对齐,我使用了编译器指令 #pragma simd ,_ #pragma aligned , #pragma ivdep . 使用多个 -vec-report 选项进行编译时,编译器会告诉我循环是向量化的 . 快速查看编译器生成的程序集似乎可以确认,因为您可以找到大量的矢量指令,...

热门问题