Java 学习之路

4 votes

answers

views

获取xeon phi的特定模型[关闭]

我正在尝试找到我正在使用的Xeon Phi协处理器的确切模型 . 我运行micpinfo，这就是我得到的 ***************************/opt/intel/mic/bin/micinfo*************************** MicInfo Utility Log Created Fri Jan 10 13:09:40 2014 System...

icc intel-mic xeon-phi
0 votes

answers

views

具有MIC的英特尔编译器警告 - 缺少库

在编译链接某些MIC（Intel Xeon Phi协处理器）代码时，我收到了这个警告 . x86_64-k1om-linux-ld: warning: libimf.so, needed by /usr/local/Intel/parallel_studio_xe_2013_sp1/composer_xe_2015.0.090/compiler/lib/mic/liboffload.so.5, n...

c++ icc xeon-phi linker-warning intel-composer
0 votes

answers

views

卸载到MIC（Xeon Phi）错误，迭代加载的数组

将一些数据结构卸载到MIC时遇到问题 . 我使用以下指令卸载到MIC： #pragma offload target(mic:mic_no)\ inout(is_selected : length(query_sequences_count)ALLOC)\ in(a:length(a_size) ALLOC)\ in(a_disp:length(offload_db_cou...

c icc xeon-phi offloading
0 votes

answers

views

有人在Xeon Phi上使用GMP吗？

我使用icc和-mmic选项编译GMP，但无法在MIC上安装 . 我该如何安装？我写了一个用icc编译的演示程序 . 它说无法找到gmp.h.我应该如何在MIC上安装GMP库以及在哪里放置gmp.h？

gmp icc intel-mic xeon-phi
2 votes

answers

views

如何在AMD芯片上使用intel编译器优化C程序

新手在这里 . 我有一个很大的有限分析代码需要运行高性能计算 . 人们一直告诉我英特尔编译器通常会提供更好的速度（我之前使用过gcc） . 我发现在我们的英特尔集群上也是如此 . 但最近我们有一个新的AMD集群 . 我对如何使用 icpc 的编译选项来优化程序感到困惑 . 基本上，我有两个问题：问题1 以下是采用AMD芯片的集群： processor : 63 vendor_id ...

optimization intel amd-processor icc
2 votes

answers

views

Intel icc编译器-O标志和-qopt-report

我目前正在研究HPC，我对icc编译器有疑问 . 我想要做的是通过[O0..O3]更改优化级别时查看正在发生的事情 . 我想要的数据，关于矢量化以及代码是否是折叠内联等，似乎是在 -qopt-report 标志生成的报告中 . 我决定对报告使用最高级别的详细程度 -qopt-report5 (I think this is the correct way to use it) 但是，当降低O级...

intel icc
43 votes

answers

views

为什么英特尔的编译器更喜欢NEG ADD而非SUB？

在检查各种代码片段的各种编译器的输出时，我倾向于选择发出一对 NEG ADD 指令，其他编译器将使用单个 SUB 指令 . 举个简单的例子，考虑以下C代码： uint64_t Mod3(uint64_t value) { return (value % 3); } ICC将其转换为以下机器代码（无论优化级别如何）： mov rcx, 0xaaaaaaaaaaaaaaab ...

assembly x86 micro-optimization icc
26 votes

answers

views

为什么malloc比英特尔的icc新7倍？

我为malloc与new进行了基准测试，以分配浮点数组 . 我的理解是malloc执行的操作是new执行的操作的一个子集 - malloc只是分配但是新的分配和构造，尽管我不确定这对于原语是否有意义 . 使用gcc对结果进行基准测试可以得出预期的行为 . malloc（）更快 . 甚至有些问题与此问题相反 . 使用icc malloc可能比新的慢7倍 . 怎么可能？！ Everything t...

c++ performance memory-management icc
2 votes

answers

views

使用英特尔C编译器2015 Windows构建Boost 1.56

我已经看到了有关使用英特尔C编译器编译Boost的其他问题，但是，我没有运气 . 我首先启动Intel Parallel Studio XE 2015 Composer Edition IA-32 Visual Studio 2013 CMD，然后cd到我的boost目录（C：\ boost_1_56_0） . 我运行bootstrap.bat（这里没问题） . 然后我运行 b2 toolset=...

c++ boost compiler-errors windows-8.1 icc
2 votes

answers

views

英特尔编译器无法使用多个参数编译可变参数lambda捕获

这是我能够提出的最小例子： #include <utility> template<class CB, class... ARGS> void call_lam(CB&& cb, ARGS&&... args) { auto lam = [&args...](auto&& callee) { ...

c++ lambda icc
0 votes

answers

views

将英特尔的#pragma offload翻译为OpenMP for Xeon Phi（性能问题和其他问题）

我使用Intel C编译器17.0.01，我有两个代码块 . 第一个代码块在Xeon Phi上分配内存，如下所示： #pragma offload target(mic:1) nocopy(data[0:size]: alloc_if(1) free_if(0)) 第二个块评估上述内存并将其复制回主机： #pragma offload target(mic:1) out(data[0:size]...

xeon-phi icc intel-mic offloading
1 votes

answers

views

关于使用AVX512进行编译的困惑

我正在阅读this文档，该文档介绍了如何使用Intel C编译器和英特尔Knights Landing上的AVX512支持编译C / C代码 . 但是，我对这部分有点困惑： -xMIC-AVX512：使用此选项生成AVX-512F，AVX-512CD，AVX-512ER和AVX-512FP . -xCORE-AVX512：使用此选项生成AVX-512F，AVX-512CD，AVX-512BW，...

intel xeon-phi icc avx512
0 votes

answers

views

如何使英特尔C编译器（icc）矢量化基本块？

我目前正在使用icc（版本13.1.0.146）来编译在Intel Xeon Phi协处理器上以纯模式运行的C程序 . 考虑以下两个代码片段： // fragment 1 array[pos] += 1; array[pos + 1] += 1; array[pos + 2] += 1; array[pos + 3] += 1; // fragment 2 for (int i = 0;...

vectorization icc
18 votes

answers

views

在Xeon-Phi上运行Haskell

有没有办法编译Haskell在Xeon Phi协处理器上运行？英特尔的一些研究人员最近报道了Haskell Research Compiler（这是不公开的，这使得他们的结果基本上不可复制）并测量了Haskell Gap（显示在某些情况下Haskell性能超过C） . 它们通过名为Pillar的中间语言（类似于C--）描述编译路径并将其编译为C，以便他们可以使用icc创建可在Phi上执行的目标代...

c haskell llvm icc intel-mic
2 votes

answers

views

Xeon Phi：使用填充性能降低

我已经实现了一个简单的n×n矩阵乘法来测试c中与OpenMp相同的性能调整 . 我的初始代码如下： #pragma omp parallel for shared(a,b,c) private(h,i,j,k) for( i = 0; i < n; i++ ) { for( j = 0; j < n; j++) { ...

c openmp compiler-optimization icc xeon-phi
4 votes

answers

views

在Linux集群上安装R`preview`包：编译问题？

我期待测试 R 的性能，更具体地说是在具有Intel Xeon Phi协处理器的HPC群集上的 forecast 包中的一些例程 . 据我所知，系统管理员按照英特尔网站上的说明从源代码构建了 R/3.2.5 ：https://software.intel.com/en-us/articles/build-r-301-with-intel-c-compiler-and-intel-mkl-on-li...

r rcpp forecasting xeon-phi icc
0 votes

answers

views

Eclipse与英特尔C编译器ICC

我试图在Ubuntu 12.04上使用icc和Eclipse . icc从命令行完美运行 . 安装icc后我使用apt-get安装了eclipse-platform . 我按照指示给出：http://www.wrgrid.group.shef.ac.uk/icebergdocs/intelv14docs/en_US/get_started_lc.htm 执行这些步骤后，我收到以下错误： Cann...

linux eclipse icc
2 votes

answers

views

无法在Intel Xeon Phi上执行二进制错误

我有一个C代码，可以在我的机器上本地编译和运行 . 但是，当我尝试使用icc和-mmic标志进行编译并在Intel Xeon Phi上进行测试时，我收到以下消息： /cm/local/apps/sge/current/spool/node079/job_scripts/5438755: line 14: ./sequential.mic: cannot execute binary file 我在...

c++ c cluster-computing icc xeon-phi
1 votes

answers

views

英特尔C编译器（icc）中的虚假自动向量化

我需要在程序中使用SSE向量化一些巨大的循环 . 为了节省时间，我决定让ICC处理它 . 为此，我准备好数据，考虑到对齐，我使用了编译器指令 #pragma simd ，_ #pragma aligned ， #pragma ivdep . 使用多个 -vec-report 选项进行编译时，编译器会告诉我循环是向量化的 . 快速查看编译器生成的程序集似乎可以确认，因为您可以找到大量的矢量指令，...

sse vectorization simd icc papi
5 votes

answers

views

掩码矢量Intel AVX-512指令的汇编语法

出于测试目的，我正在使用Icc内联汇编程序为Intel的Xeon Phi编写简短的汇编代码段 . 现在我想使用屏蔽向量指令，但是我无法将它们提供给内联汇编程序 . 对于这样的代码： vmovapd -64(%%r14, %%r10), %%zmm0{%%k1} 我收到错误消息 /tmp/icpc5115IWas_.s: Assembler messages: /tmp/icpc5115IWas...

x86 inline-assembly icc intel-mic
2 votes

answers

views

如何使GCC像ICC一样生成向量指令？

我一直在我的项目中使用ICC，ICC将很好地利用向量指令 . 最近我尝试使用GCC（版本5.5）来编译相同的代码，但是在某些模块上，GCC的版本比ICC慢10倍 . 当我做复杂的乘法等时会发生这种情况 . 示例代码如下：定义： float *ptr1 = _mm_malloc(1280 , 64); float *ptr2 = _mm_malloc(1280 , 64); float compl...

gcc vectorization icc
2 votes

answers

views

对于英特尔编译器，使用-openmp而不是-qopenmp

我正在使用英特尔编译器v16在Xeon Phi上构建OpenCV . 这些是cmake设置： cmake -D CMAKE_BUILD_TYPE=RelWithDebInfo -DWITH_TBB=OFF -DWITH_OPENMP=ON -DCMAKE_C_COMPILER=icc -DCMAKE_CXX_COMPILER=icpc .. 但是，使用 -DWITH_OPENMP=ON 会生成标...

c++ opencv cmake openmp icc
0 votes

answers

views

icpc比gcc慢？

我正在尝试使用英特尔C编译器制作opencv SURF的优化并行版本，特别是surf.cpp . 我正在使用英特尔顾问找到效率低下和未实现的循环 . 特别是，它建议使用 icpc 编译器（而不是 gcc ）重建代码，然后使用 xCORE-AVX2 标志，因为它可用于我的硬件 . 因此，使用 g++ 构建opencv的原始 cmake 是： cmake -D CMAKE_BUILD_TYPE=Rel...

opencv gcc parallel-processing icc intel-parallel-studio
0 votes

answers

views

使用Eclipse Nsight编译CUDA英特尔MKL

我想在我的一个头文件中实现mkl_lapack的tridiagonal特征值算法 dstevr #include "mkl.h" void trideigs(int N, int LDZ, double *Z, double *W, double *D, double *E){ double VL=0.0, VU=1.0, ABSTOL=0.0; int IL=1, IU=...

cuda icc intel-mkl
292 votes

answers

views

为什么NaN - NaN == 0.0与英特尔C编译器？

众所周知，NaNs在算术中传播，但我找不到任何演示，所以我写了一个小测试： #include <limits> #include <cstdio> int main(int argc, char* argv[]) { float qNaN = std::numeric_limits<float>::quiet_NaN(); float neg...

c++ c floating-point ieee-754 icc
2 votes

answers

views

将功能卸载到Intel Xeon Phi所需的时间

卸载调用是否需要预定义的时间将函数的数据（参数）从主机传输到Intel MIC（Xeon Phi协处理器3120系列）？具体来说，我为我想要在MIC上执行的功能卸载调用（“#pragma offload target（mic）”） . 该函数有15个参数（指针和变量），我已经确认了MIC上参数的正确传递 . 但是我已经简化了代码，目的是检查传递参数的时间，因此它只包含一个简单的“printf（）...

c hpc icc xeon-phi intel-mic
2 votes

answers

views

英特尔MIC卸载 - 它如何与STL一起使用？

我正在使用在C / OpenMP代码中实现的system，它在整个地方使用STL和Eigen的数据结构 . 从算法上讲，代码似乎是使用新的Intel MIC（Xeon Phi）卡加速的理想选择 . 代码中的典型并行循环如下所示： #pragma omp parallel for private(i) for (i = 0; i < n; ++i) { computeI...

c++ stl eigen icc intel-mic
1 votes

answers

views

ICC编译器 - 错误：并行循环条件不测试循环控制变量

我试图在英特尔MIC（Xeon Phi）卡上卸载调用后并行化我的C / OpenMP代码的“for循环” . 我正在使用“#pragma omp parallel for”，当我使用整数变量作为“循环控制变量”时，它编译得很好 . 在我的代码中我使用浮点数组作为“循环控制变量”然后我得到错误“并行循环条件不测试循环控制变量” . 代码没有错误： #define MAX_DIMENSIONS 10...

c openmp icc intel-mic
6 votes

answers

views

使用Xeon Phi Knights Landing获得密集矩阵乘法的最大FLOPS

我最近开始使用Xeon Phi Knights Landing（KNL）7250计算机（http://ark.intel.com/products/94035/Intel-Xeon-Phi-Processor-7250-16GB-1_40-GHz-68-core） . 它有68个核心和AVX 512.基本频率为1.4 GHz，Turbo频率为1.6 GHz . 我不知道所有内核的turbo频率是多...

x86 openmp icc intel-mkl xeon-phi
0 votes

answers

views

英特尔顾问的编译器和链接器标志

我'm using an Intel C++ v16 compiler on a Xeon Phi Knights Landing (KNL) on an application using OpenMP. I'读到了用于Vectorization Advisor，Thread Advisor和最后VTune的编译器和链接器选项 . 结合3个链接文档中的表格，我想出了这个列表（考虑到Xeon Ph...

compilation linker intel icc intel-parallel-studio

热门问题