-
3 votesanswersviews
Xeon Phi上的loaddup_pd / unpacklo_pd
如果我在512宽SIMD向量中有以下双打,就像在Xeon Phi寄存器中一样: m0 = |b4|a4|b3|a3|b2|a2|b1|a1| 有可能成为: m0_d = |a4|a4|a3|a3|a2|a2|a1|a1| 使用单一指令?此外,由于双打没有按位内在函数,这仍然是实现上述目标的有效方法吗? m0_t = _mm512_swizzle_pd(m9,_MM_SWIZ_REG_CDAB)... -
1 votesanswersviews
Xeon Phi中的分散/聚集
我指的是关于Xeon Phi指令集的Intel手册,并且无法理解散布/收集指令的工作原理 . 假设我有以下双打矢量: A-> |b4|a4|b3|a3|b2|a2|b1|a1| 是否可以创建4个向量,如下所示: V1->|b1|a1|b1|a1|b1|a1|b1|a1| V2->|b2|a2|b2|a2|b2|a2|b2|a2| V3->|b3|a3|b3|a3|b3|a... -
0 votesanswersviews
在Xeon Phi上使用GDB的LD_LIBRARY_PATH
我目前正在尝试使用英特尔提供的GDB版本(gdb-mic)调试Xeon Phi的本机应用程序 . 当我在登录Phi时运行程序时,如果设置了LD_LIBRARY_PATH = / tmp(我先前已经转移了libiomp5.so),它就可以工作 . 但是,当我使用GDB调试应用程序时,我无法设置库路径 . 我尝试了命令“set env LD_LIBRARY_PATH = / tmp”,但是GDB仍然找... -
0 votesanswersviews
在Intel Xeon Phi上使用OpenCL进行并发仿真
我有一个OpenCL应用程序,它利用了英特尔至强融核的功能 . 内核使用数据库进行一些统计计算 . 因此,我在想是否可以添加第二个使用相同数据库的内核并在Phi上同时运行它们 . 例如,内核1使用n / 2个线程,内核2使用n / 2个线程等 . 有什么建议 ? -
1 votesanswersviews
至强phi计时器分辨率
我的主要目的是在xeon phi协处理器中插入1ms延迟,但我的结果差异大约为9ms . 因此,我尝试使用xeon主机和phi协处理器来查找定时器分辨率 . 我执行了以下代码: #include <stdio.h> #include <time.h> #include <sys/time.h> int main() { ... -
4 votesanswersviews
获取xeon phi的特定模型[关闭]
我正在尝试找到我正在使用的Xeon Phi协处理器的确切模型 . 我运行micpinfo,这就是我得到的 ***************************/opt/intel/mic/bin/micinfo*************************** MicInfo Utility Log Created Fri Jan 10 13:09:40 2014 System... -
3 votesanswersviews
在Xeon Phi上运行Erlang
如何在Intel Xeon Phi协处理器上编译VM并运行Erlang程序? -
1 votesanswersviews
在Xeon Phi上操作双打面具
我正在使用内部函数对Xeon Phi进行条件计算 . 我必须使用双值,所以我需要一个__mmask8 . 只要我使用一些比较函数对我来说没有问题,但如果我想修改这些掩码,我会遇到一些类型的冲突 . documentation给了我很多函数来修改用于单精度的__mmask16,没有一个函数可用于双精度 . 我想做一些像下面这样的事情: int tmp = 0; for(i = 0; i < ... -
-1 votesanswersviews
加速减少Xeon CPU,GPU和Xeon Phi操作的方法
我有一个应用程序,其中大型矩阵上的减少操作(如sum,max)是瓶颈 . 我需要尽快做到这一点 . mkl中有向量指令吗? 是否有特殊的硬件单元在xeon cpu,gpu或mic上处理它? 一般来说,如何在这些硬件中实现减少操作? -
0 votesanswersviews
如何将单个应用程序的特定线程卸载到特定的Xeon Phi核心?
假设我在主机上运行了一个c / c应用程序 . 在主机CPU上运行的线程很少,在Xeon Phi核心上运行50个线程 . How can I make sure that each of these 50 runs on its own Xeon Phi core and is never purged off the core cache (given the code is small eno... -
0 votesanswersviews
英特尔MIC模板计算
我想为Intel Xeon Phi协处理器(61核)编写有效的并行应用程序,它可以进行五点模板计算 . 我写了两个版本的代码 . 第一:我使用OpenMP“#pragma omp parralel for” void ParallelStencil(const double* macierzIn, double* macierzOut, const int m, const int n) { ... -
0 votesanswersviews
具有MIC的英特尔编译器警告 - 缺少库
在编译链接某些MIC(Intel Xeon Phi协处理器)代码时,我收到了这个警告 . x86_64-k1om-linux-ld: warning: libimf.so, needed by /usr/local/Intel/parallel_studio_xe_2013_sp1/composer_xe_2015.0.090/compiler/lib/mic/liboffload.so.5, n... -
0 votesanswersviews
卸载到MIC(Xeon Phi)错误,迭代加载的数组
将一些数据结构卸载到MIC时遇到问题 . 我使用以下指令卸载到MIC: #pragma offload target(mic:mic_no)\ inout(is_selected : length(query_sequences_count)ALLOC)\ in(a:length(a_size) ALLOC)\ in(a_disp:length(offload_db_cou... -
4 votesanswersviews
OpenMP 4.0 - GCC 5.2.0 - 重叠设备和主机任务执行
我试图测试一个非常简单的程序,通过OpenMP 4.0指令使用gcc 5卸载功能 . 我的目标是编写一个两个独立的任务程序,其中一个任务在加速器(即Intel MIC仿真器)上执行,另一个任务在CPU上同时执行 . 这是代码: #include <omp.h> #include <stdio.h> #define limit 100000 int main(int ar... -
0 votesanswersviews
使用对齐数据卸载到intel MIC
当我编译下面的代码时,我收到警告: src/parallel_hashing.cpp(50): warning #3218: *MIC* class/struct may fail when offloaded because this field is misaligned or contains data that is misaligned __declspec(align(64)) ... -
0 votesanswersviews
独立卸载数据
我的项目有问题 . 我尝试从CPU发送数据独立于xeon phi . int test=5; #pragma offload target(mic0) in(test) { test=3; } printf("test equals %i", test); 结果是3.我不明白这个,测试不应该等于5? -
2 votesanswersviews
什么是_kmp_fork_barrier以及如何查看是否存在负载不 balancer ?
我正在使用英特尔VTune放大器来查看我的并行应用程序如何扩展 . 注意我不使用任何显式锁机制 它在我的4核笔记本电脑上可以很好地扩展(考虑到有部分算法无法并行化): 但是,当我在Knights Landing(KNL)上进行测试时,它会出现可怕的扩展: Notice that I'm using only 64 cores on purpose (说到这个,如果你're interested... -
2 votesanswersviews
在Xeon Phi上使用GCC
我被告知可以在MIC上运行一个用gcc构建的程序 . 真的吗? 如果是,如何进行? 我正在使用gcc版本4.4.7 . -
1 votesanswersviews
如何将我的工作绑定到intel xeon phi协处理器?
我有一台带有四个麦克风卡(mic0-mic3)的服务器,效果很好 . 如何将并行作业(mic_app)绑定到mic0,其他并行作业无法在mic0中运行 . 如何检测mic0一直在运行并行作业(mic_app) . -
0 votesanswersviews
是否有用于最小化线程数的搜索算法?
我正在使用Intel Xeon Phi协处理器,它具有多达240个线程,我正在努力减少用于特定应用程序的线程数(或最大化性能),同时在最佳执行时间的百分比内 . 例如,如果我有以下测量: 主题|执行时间处理时间 240 100 s 200 105 s 150 107 s 120 109 s 100 120 s 我想在120和150之间选择一些线程,因为“性能曲线”似乎稳... -
0 votesanswersviews
Intel Threading Building Blocks支持Intel Xeon Phi协处理器
我在英特尔的论坛上问过这个问题,没有运气 . 有谁知道他们开始支持Xeon Phi协处理器的英特尔TBB版本是什么? -
1 votesanswersviews
与GPU相比,协处理器加速器
像Intel Xeon-Phi这样的协处理器应该像GPU一样使用,因此应该卸载执行 a single kernel 的大量块,这样只有协处理器处理的整体吞吐量才会导致加速,卸载独立的线程(任务) )还会提高效率吗? -
4 votesanswersviews
使用宽对齐的未对齐数据访问进行矢量化/优化循环(特别是Xeon Phi)
这是我向Stackoverflow社区提问的第一次经历 . 对不起,如果我的问题不符合论坛的风格/大小 - 将随着经验而改善 . 我正在尝试使用英特尔编译器14.0.1在C中对一个循环进行矢量化,以便更好地利用宽512位寄存器来优化英特尔至强融核的速度 . (受https://software.intel.com/en-us/articles/data-alignment-to-assist-v... -
0 votesanswersviews
Xeon phi卸载模式如何利用线程并行和矢量化
我正在使用cilk plus和offload对Xeon phi进行一些性能测试 . 在一个简单的向量添加程序中,我有两种方法可以做到: 使用cilk_for将任务拆分到Xeon phi中的不同线程: __declspec(target(mic)) void vector_add(double *A,double *B,double *C, int vector_size) { _Cil... -
2 votesanswersviews
Xeon Phi:使用填充性能降低
我已经实现了一个简单的n×n矩阵乘法来测试c中与OpenMp相同的性能调整 . 我的初始代码如下: #pragma omp parallel for shared(a,b,c) private(h,i,j,k) for( i = 0; i < n; i++ ) { for( j = 0; j < n; j++) { ... -
0 votesanswersviews
hStreams在自启动系统上
我正在尝试使用hStreams的简单教程示例来处理多核集成平台英特尔至强唱片(Knights Landing)7210(无卸载) . hStreams的documentation说: 预计可以通过fabric-Xeon或KNL进行自启动和卸载 所以我想知道hStreams是否也适用于我的平台 . 最后,我不确定是否需要MPSS(hStreams的先决条件),它只能安装在卸载系统上 . 对于h... -
6 votesanswersviews
Knights Landing CPU(Xeon Phi)会加速字节/字整数代码吗?
Intel Xeon Phi“Knights Landing”处理器将是第一款支持AVX-512的处理器,但它只支持“F”(如没有SSE2的SSE,或没有AVX2的AVX),所以主要是浮点数 . 我正在编写使用内部函数通过SSE4.1指令操作字节和字(8位和16位)的软件 . 我很困惑AVX-512F中是否会有所有/大多数SSE4.1指令的EVEX编码版本,这是否意味着我可以期望我的SSE代码自动... -
0 votesanswersviews
在Xeon Phi协处理器上使用Pthreads
我使用pthreads编写了一个简单的平流方程求解器,它在处理器上正常工作 . 然而,当我使用-mmic标志编译它并在协处理器上运行(使用micnativeloadex)时,它只使用 one 线程(我很难编码它使用200) . 据我所知,代码应该按原样运行 . 我在这里错过了什么吗? 代码非常脏,但仍然是完整的 . #include <stdlib.h> #include <st... -
0 votesanswersviews
如何启用另一个intel xeon phi协处理器?
我有一个带有一个麦克风卡(mic0)的服务器,效果很好 . 最近,我在同一台服务器上添加了另一个麦克风(mic1) . mic1可以被 lspci 检测到,但不会出现 ifconfig . 如何启用mic1使其与mic0一起工作? -
0 votesanswersviews
如何在Windows上检测Intel Xeon Phi协处理器?
有没有可用于检测系统中是否有xeon phi协处理器的C / C API?