首页 文章
  • 4 votes
     answers
     views

    获取xeon phi的特定模型[关闭]

    我正在尝试找到我正在使用的Xeon Phi协处理器的确切模型 . 我运行micpinfo,这就是我得到的 ***************************/opt/intel/mic/bin/micinfo*************************** MicInfo Utility Log Created Fri Jan 10 13:09:40 2014 System...
  • 0 votes
     answers
     views

    具有MIC的英特尔编译器警告 - 缺少库

    在编译链接某些MIC(Intel Xeon Phi协处理器)代码时,我收到了这个警告 . x86_64-k1om-linux-ld: warning: libimf.so, needed by /usr/local/Intel/parallel_studio_xe_2013_sp1/composer_xe_2015.0.090/compiler/lib/mic/liboffload.so.5, n...
  • 0 votes
     answers
     views

    卸载到MIC(Xeon Phi)错误,迭代加载的数组

    将一些数据结构卸载到MIC时遇到问题 . 我使用以下指令卸载到MIC: #pragma offload target(mic:mic_no)\ inout(is_selected : length(query_sequences_count)ALLOC)\ in(a:length(a_size) ALLOC)\ in(a_disp:length(offload_db_cou...
  • 0 votes
     answers
     views

    有人在Xeon Phi上使用GMP吗?

    我使用icc和-mmic选项编译GMP,但无法在MIC上安装 . 我该如何安装?我写了一个用icc编译的演示程序 . 它说无法找到gmp.h.我应该如何在MIC上安装GMP库以及在哪里放置gmp.h?
  • 2 votes
     answers
     views

    如何在AMD芯片上使用intel编译器优化C程序

    新手在这里 . 我有一个很大的有限分析代码需要运行高性能计算 . 人们一直告诉我英特尔编译器通常会提供更好的速度(我之前使用过gcc) . 我发现在我们的英特尔集群上也是如此 . 但最近我们有一个新的AMD集群 . 我对如何使用 icpc 的编译选项来优化程序感到困惑 . 基本上,我有两个问题: 问题1 以下是采用AMD芯片的集群: processor : 63 vendor_id ...
  • 2 votes
     answers
     views

    Intel icc编译器-O标志和-qopt-report

    我目前正在研究HPC,我对icc编译器有疑问 . 我想要做的是通过[O0..O3]更改优化级别时查看正在发生的事情 . 我想要的数据,关于矢量化以及代码是否是折叠内联等,似乎是在 -qopt-report 标志生成的报告中 . 我决定对报告使用最高级别的详细程度 -qopt-report5 (I think this is the correct way to use it) 但是,当降低O级...
  • 43 votes
     answers
     views

    为什么英特尔的编译器更喜欢NEG ADD而非SUB?

    在检查各种代码片段的各种编译器的输出时,我倾向于选择发出一对 NEG ADD 指令,其他编译器将使用单个 SUB 指令 . 举个简单的例子,考虑以下C代码: uint64_t Mod3(uint64_t value) { return (value % 3); } ICC将其转换为以下机器代码(无论优化级别如何): mov rcx, 0xaaaaaaaaaaaaaaab ...
  • 26 votes
     answers
     views

    为什么malloc比英特尔的icc新7倍?

    我为malloc与new进行了基准测试,以分配浮点数组 . 我的理解是malloc执行的操作是new执行的操作的一个子集 - malloc只是分配但是新的分配和构造,尽管我不确定这对于原语是否有意义 . 使用gcc对结果进行基准测试可以得出预期的行为 . malloc()更快 . 甚至有些问题与此问题相反 . 使用icc malloc可能比新的慢7倍 . 怎么可能?! Everything t...
  • 2 votes
     answers
     views

    使用英特尔C编译器2015 Windows构建Boost 1.56

    我已经看到了有关使用英特尔C编译器编译Boost的其他问题,但是,我没有运气 . 我首先启动Intel Parallel Studio XE 2015 Composer Edition IA-32 Visual Studio 2013 CMD,然后cd到我的boost目录(C:\ boost_1_56_0) . 我运行bootstrap.bat(这里没问题) . 然后我运行 b2 toolset=...
  • 2 votes
     answers
     views

    英特尔编译器无法使用多个参数编译可变参数lambda捕获

    这是我能够提出的最小例子: #include <utility> template<class CB, class... ARGS> void call_lam(CB&& cb, ARGS&&... args) { auto lam = [&args...](auto&& callee) { ...
  • 0 votes
     answers
     views

    将英特尔的#pragma offload翻译为OpenMP for Xeon Phi(性能问题和其他问题)

    我使用Intel C编译器17.0.01,我有两个代码块 . 第一个代码块在Xeon Phi上分配内存,如下所示: #pragma offload target(mic:1) nocopy(data[0:size]: alloc_if(1) free_if(0)) 第二个块评估上述内存并将其复制回主机: #pragma offload target(mic:1) out(data[0:size]...
  • 1 votes
     answers
     views

    关于使用AVX512进行编译的困惑

    我正在阅读this文档,该文档介绍了如何使用Intel C编译器和英特尔Knights Landing上的AVX512支持编译C / C代码 . 但是,我对这部分有点困惑: -xMIC-AVX512:使用此选项生成AVX-512F,AVX-512CD,AVX-512ER和AVX-512FP . -xCORE-AVX512:使用此选项生成AVX-512F,AVX-512CD,AVX-512BW,...
  • 0 votes
     answers
     views

    如何使英特尔C编译器(icc)矢量化基本块?

    我目前正在使用icc(版本13.1.0.146)来编译在Intel Xeon Phi协处理器上以纯模式运行的C程序 . 考虑以下两个代码片段: // fragment 1 array[pos] += 1; array[pos + 1] += 1; array[pos + 2] += 1; array[pos + 3] += 1; // fragment 2 for (int i = 0;...
  • 18 votes
     answers
     views

    在Xeon-Phi上运行Haskell

    有没有办法编译Haskell在Xeon Phi协处理器上运行? 英特尔的一些研究人员最近报道了Haskell Research Compiler(这是不公开的,这使得他们的结果基本上不可复制)并测量了Haskell Gap(显示在某些情况下Haskell性能超过C) . 它们通过名为Pillar的中间语言(类似于C--)描述编译路径并将其编译为C,以便他们可以使用icc创建可在Phi上执行的目标代...
  • 2 votes
     answers
     views

    Xeon Phi:使用填充性能降低

    我已经实现了一个简单的n×n矩阵乘法来测试c中与OpenMp相同的性能调整 . 我的初始代码如下: #pragma omp parallel for shared(a,b,c) private(h,i,j,k) for( i = 0; i < n; i++ ) { for( j = 0; j < n; j++) { ...
  • 4 votes
     answers
     views

    在Linux集群上安装R`preview`包:编译问题?

    我期待测试 R 的性能,更具体地说是在具有Intel Xeon Phi协处理器的HPC群集上的 forecast 包中的一些例程 . 据我所知,系统管理员按照英特尔网站上的说明从源代码构建了 R/3.2.5 :https://software.intel.com/en-us/articles/build-r-301-with-intel-c-compiler-and-intel-mkl-on-li...
  • 0 votes
     answers
     views

    Eclipse与英特尔C编译器ICC

    我试图在Ubuntu 12.04上使用icc和Eclipse . icc从命令行完美运行 . 安装icc后我使用apt-get安装了eclipse-platform . 我按照指示给出:http://www.wrgrid.group.shef.ac.uk/icebergdocs/intelv14docs/en_US/get_started_lc.htm 执行这些步骤后,我收到以下错误: Cann...
  • 2 votes
     answers
     views

    无法在Intel Xeon Phi上执行二进制错误

    我有一个C代码,可以在我的机器上本地编译和运行 . 但是,当我尝试使用icc和-mmic标志进行编译并在Intel Xeon Phi上进行测试时,我收到以下消息: /cm/local/apps/sge/current/spool/node079/job_scripts/5438755: line 14: ./sequential.mic: cannot execute binary file 我在...
  • 1 votes
     answers
     views

    英特尔C编译器(icc)中的虚假自动向量化

    我需要在程序中使用SSE向量化一些巨大的循环 . 为了节省时间,我决定让ICC处理它 . 为此,我准备好数据,考虑到对齐,我使用了编译器指令 #pragma simd ,_ #pragma aligned , #pragma ivdep . 使用多个 -vec-report 选项进行编译时,编译器会告诉我循环是向量化的 . 快速查看编译器生成的程序集似乎可以确认,因为您可以找到大量的矢量指令,...
  • 5 votes
     answers
     views

    掩码矢量Intel AVX-512指令的汇编语法

    出于测试目的,我正在使用Icc内联汇编程序为Intel的Xeon Phi编写简短的汇编代码段 . 现在我想使用屏蔽向量指令,但是我无法将它们提供给内联汇编程序 . 对于这样的代码: vmovapd -64(%%r14, %%r10), %%zmm0{%%k1} 我收到错误消息 /tmp/icpc5115IWas_.s: Assembler messages: /tmp/icpc5115IWas...
  • 2 votes
     answers
     views

    如何使GCC像ICC一样生成向量指令?

    我一直在我的项目中使用ICC,ICC将很好地利用向量指令 . 最近我尝试使用GCC(版本5.5)来编译相同的代码,但是在某些模块上,GCC的版本比ICC慢10倍 . 当我做复杂的乘法等时会发生这种情况 . 示例代码如下: 定义: float *ptr1 = _mm_malloc(1280 , 64); float *ptr2 = _mm_malloc(1280 , 64); float compl...
  • 2 votes
     answers
     views

    对于英特尔编译器,使用-openmp而不是-qopenmp

    我正在使用英特尔编译器v16在Xeon Phi上构建OpenCV . 这些是cmake设置: cmake -D CMAKE_BUILD_TYPE=RelWithDebInfo -DWITH_TBB=OFF -DWITH_OPENMP=ON -DCMAKE_C_COMPILER=icc -DCMAKE_CXX_COMPILER=icpc .. 但是,使用 -DWITH_OPENMP=ON 会生成标...
  • 0 votes
     answers
     views

    icpc比gcc慢?

    我正在尝试使用英特尔C编译器制作opencv SURF的优化并行版本,特别是surf.cpp . 我正在使用英特尔顾问找到效率低下和未实现的循环 . 特别是,它建议使用 icpc 编译器(而不是 gcc )重建代码,然后使用 xCORE-AVX2 标志,因为它可用于我的硬件 . 因此,使用 g++ 构建opencv的原始 cmake 是: cmake -D CMAKE_BUILD_TYPE=Rel...
  • 0 votes
     answers
     views

    使用Eclipse Nsight编译CUDA英特尔MKL

    我想在我的一个头文件中实现mkl_lapack的tridiagonal特征值算法 dstevr #include "mkl.h" void trideigs(int N, int LDZ, double *Z, double *W, double *D, double *E){ double VL=0.0, VU=1.0, ABSTOL=0.0; int IL=1, IU=...
  • 292 votes
     answers
     views

    为什么NaN - NaN == 0.0与英特尔C编译器?

    众所周知,NaNs在算术中传播,但我找不到任何演示,所以我写了一个小测试: #include <limits> #include <cstdio> int main(int argc, char* argv[]) { float qNaN = std::numeric_limits<float>::quiet_NaN(); float neg...
  • 2 votes
     answers
     views

    将功能卸载到Intel Xeon Phi所需的时间

    卸载调用是否需要预定义的时间将函数的数据(参数)从主机传输到Intel MIC(Xeon Phi协处理器3120系列)? 具体来说,我为我想要在MIC上执行的功能卸载调用(“#pragma offload target(mic)”) . 该函数有15个参数(指针和变量),我已经确认了MIC上参数的正确传递 . 但是我已经简化了代码,目的是检查传递参数的时间,因此它只包含一个简单的“printf()...
  • 2 votes
     answers
     views

    英特尔MIC卸载 - 它如何与STL一起使用?

    我正在使用在C / OpenMP代码中实现的system,它在整个地方使用STL和Eigen的数据结构 . 从算法上讲,代码似乎是使用新的Intel MIC(Xeon Phi)卡加速的理想选择 . 代码中的典型并行循环如下所示: #pragma omp parallel for private(i) for (i = 0; i < n; ++i) { computeI...
  • 1 votes
     answers
     views

    ICC编译器 - 错误:并行循环条件不测试循环控制变量

    我试图在英特尔MIC(Xeon Phi)卡上卸载调用后并行化我的C / OpenMP代码的“for循环” . 我正在使用“#pragma omp parallel for”,当我使用整数变量作为“循环控制变量”时,它编译得很好 . 在我的代码中我使用浮点数组作为“循环控制变量”然后我得到错误“并行循环条件不测试循环控制变量” . 代码没有错误: #define MAX_DIMENSIONS 10...
  • 6 votes
     answers
     views

    使用Xeon Phi Knights Landing获得密集矩阵乘法的最大FLOPS

    我最近开始使用Xeon Phi Knights Landing(KNL)7250计算机(http://ark.intel.com/products/94035/Intel-Xeon-Phi-Processor-7250-16GB-1_40-GHz-68-core) . 它有68个核心和AVX 512.基本频率为1.4 GHz,Turbo频率为1.6 GHz . 我不知道所有内核的turbo频率是多...
  • 0 votes
     answers
     views

    英特尔顾问的编译器和链接器标志

    我'm using an Intel C++ v16 compiler on a Xeon Phi Knights Landing (KNL) on an application using OpenMP. I'读到了用于Vectorization Advisor,Thread Advisor和最后VTune的编译器和链接器选项 . 结合3个链接文档中的表格,我想出了这个列表(考虑到Xeon Ph...

热门问题