-
2 votesanswersviews
如何在AMD芯片上使用intel编译器优化C程序
新手在这里 . 我有一个很大的有限分析代码需要运行高性能计算 . 人们一直告诉我英特尔编译器通常会提供更好的速度(我之前使用过gcc) . 我发现在我们的英特尔集群上也是如此 . 但最近我们有一个新的AMD集群 . 我对如何使用 icpc 的编译选项来优化程序感到困惑 . 基本上,我有两个问题: 问题1 以下是采用AMD芯片的集群: processor : 63 vendor_id ... -
68 votesanswersviews
这是“不应该发生”崩溃AMD Fusion CPU的错误吗?
我的公司已经开始让许多客户打电话,因为我们的程序因其系统上的访问冲突而崩溃 . 崩溃发生在SQLite 3.6.23.1中,我们将其作为应用程序的一部分提供 . (我们提供自定义构建,以便使用与应用程序其余部分相同的VC库,但它是库存SQLite代码 . ) 当 pcache1Fetch 执行 call 00000000 时发生崩溃,如WinDbg调用堆栈所示: 0b50e5c4 719f9fa... -
11 votesanswersviews
使用xmm寄存器而不是ymm时,vxorps是否会更快地使用AMD Jaguar / Bulldozer / Zen?
AMD CPU通过解码为两个128b操作来处理256b AVX指令 . 例如在AMD Steamroller上 vaddps ymm0, ymm1,ymm1 解码为2个宏操作,吞吐量的一半为 vaddps xmm0, xmm1,xmm1 . XOR归零是一种特殊情况(没有输入依赖性,并且on Jaguar at least avoids consuming a physical register... -
28 votesanswersviews
我应该担心英特尔C编译器为AMD发出次优代码?
我们一直是英特尔商店 . 所有开发人员都使用英特尔机器,最终用户的推荐平台是英特尔,如果最终用户希望在AMD上运行,那就是他们的了望 . 也许测试部门有一台AMD机器在哪里检查我们没有运送任何完全损坏的东西,但那是关于它的 . 直到几年前我们才使用MSVC编译器,因为它并没有真正提供超出SSE级别的许多处理器调优选项,所以没有人担心代码是否有利于一个x86供应商而不是另一个 . 但是,最近我们一直... -
2 votesanswersviews
PAPI性能可以解决AMD Opteron 6172上的问题
我一直在尝试用AMD Opteron 6172处理器上的性能计数器分析某些应用程序(用C语言编写),运行Red Hat Enterprise Linux Workstation 6.2版(圣地亚哥) . 我正在使用PAPI v4.1.3.0,它使用AMD本机事件CPU_CLK_UNHALTED用于PAPI_TOT_CYC(计算总周期)和DATA_CACHE_ACCESSES用于PAPI_L1_DC...