首页 文章
  • 0 votes
     answers
     views

    Intel Xeon Phi卸载代码STL向量

    我想将存储在STL向量中的数据复制到Intel Xeon Phi协处理器 . 在我的代码中,我创建了包含向量的类,其中包含计算所需的数据 . 我想在主机上创建类对象,也在主机上初始化数据,然后我想将此对象发送到协处理器 . 这是一个简单的代码,说明了我想做的事情 . 复制对象到协处理器向量后为空 . 有什么问题?怎么做得对? #pragma offload_attribute (push, tar...
  • 0 votes
     answers
     views

    卸载到MIC(Xeon Phi)错误,迭代加载的数组

    将一些数据结构卸载到MIC时遇到问题 . 我使用以下指令卸载到MIC: #pragma offload target(mic:mic_no)\ inout(is_selected : length(query_sequences_count)ALLOC)\ in(a:length(a_size) ALLOC)\ in(a_disp:length(offload_db_cou...
  • 0 votes
     answers
     views

    使用对齐数据卸载到intel MIC

    当我编译下面的代码时,我收到警告: src/parallel_hashing.cpp(50): warning #3218: *MIC* class/struct may fail when offloaded because this field is misaligned or contains data that is misaligned __declspec(align(64)) ...
  • 0 votes
     answers
     views

    独立卸载数据

    我的项目有问题 . 我尝试从CPU发送数据独立于xeon phi . int test=5; #pragma offload target(mic0) in(test) { test=3; } printf("test equals %i", test); 结果是3.我不明白这个,测试不应该等于5?
  • 0 votes
     answers
     views

    支持Intel Xeon Phi x100(KNC)的数据科学库[暂停]

    我们正在努力寻找可以在Intel Xeon Phi KNC(x100)协处理器(本机,卸载或混合)上运行的机器学习库 . 这可以是像Intel DAAL这样的库(它本来是理想的,但它不支持KNC处理器)的内置卸载指令或可以编译为在Phi上运行的现有库(例如mlpack) . 我们正在尝试的后者的一个例子是mlpack和pyMIC,它试图在协处理器上本地运行c代码 . 但是,我们正面临着这种方法的一...
  • 1 votes
     answers
     views

    OpenMP将任务卸载到Intel MIC

    我试图将我的程序中昂贵的循环卸载到Intel MIC . 代码的一部分是: !$omp target map(to:coor,sigma_const,clase) map(tofrom:ener1,ener2) !$omp parallel private(i,j,fdummy1,k,l,fdummy2,fdummy3,fdummy4,fdummy5,dist) !$omp do reductio...
  • 8 votes
     answers
     views

    如何使用GCC 5.1和OpenMP将工作卸载到Xeon Phi

    背景 我们一直试图使用新的GCC 5.1版本将OpenMP块卸载到Intel MIC(即Xeon Phi),但未成功 . 在GCC Offloading页面之后,我们将 build.sh 脚本放在一起,为"intelmic"和主机编译器构建"accel"目标编译器 . 编译似乎成功完成 . 然后使用 env.sh 脚本,我们尝试编译下面列出的简单 hello...
  • 1 votes
     answers
     views

    OpenMP目标(更新)到

    我正在使用配备Intel Xeon Phi coprorcessors的平台上的OpenMP 4.5加速器模型 . 我想用CPU MIC来解决问题 . 我需要使用类似于Intel Offload的机制 . 我想立即将数据从缓冲区A从卡转移到缓冲区B.示例在下面的代码中给出 . #pragma offload target(mic : 0) \ out(A[0:size] : REUSE in...
  • 0 votes
     answers
     views

    Xeon-Phi从主机openMP并行区域异步卸载

    我在主机openMP代码中使用intel的卸载编译指示 . 代码如下所示 int s1 = f(a,b,c); #prama offload singnal(s1) in (...) out(x:len) { for (int i = 0; i < len; ++i) { x[i] = ... } } #pragma omp parallel...
  • 0 votes
     answers
     views

    具有Intel MIC卸载的异构OpenMP并行循环

    我正在研究一个代码,其中包含一个包含许多迭代的循环(~10 ^ 6-10 ^ 7),其中一个数组(比方说,'myresult')是通过大量贡献的求和来计算的 . 在使用OpenMP的Fortran 90中,这将看起来像: !$omp parallel do !$omp& reduction(+:myresult) do i=1,N myresult[i] = myresult[i] + ...
  • 1 votes
     answers
     views

    不明原因的Xeon-Phi开销

    我试图在Xeon Phi KNC上运行这些不同n尺寸的代码 . 我正在获得表中所示的时间,但我不知道为什么我会遇到这些波动 . 你能指导我一下吗?提前致谢 . 码: program prog integer, allocatable :: arr1(:), arr2(:) integer :: i, n, time_start, time_end n=481 do while (n...
  • 0 votes
     answers
     views

    将英特尔的#pragma offload翻译为OpenMP for Xeon Phi(性能问题和其他问题)

    我使用Intel C编译器17.0.01,我有两个代码块 . 第一个代码块在Xeon Phi上分配内存,如下所示: #pragma offload target(mic:1) nocopy(data[0:size]: alloc_if(1) free_if(0)) 第二个块评估上述内存并将其复制回主机: #pragma offload target(mic:1) out(data[0:size]...
  • 1 votes
     answers
     views

    Xeon-Phi与Xeon无法解释的开销

    我试图在Xeon Phi KNC(具有61个核心和4T / C)和Xeon(带有2个Xeon E5-2660 v2插槽)上运行以下不同n尺寸的代码 . 我得到的时间如下表所示 . 但是,我试图理解为什么MIC的性能比运行Xeon处理器更差 . 我在这里做错了什么,如何修复它(如果可能的话)? 谢谢! 码: program prog integer, allocatable :: arr1(:)...
  • 0 votes
     answers
     views

    Intel MIC - 卸载错误:数据传输

    我将从英特尔至强融核协处理器传输数据到主机CPU有问题 . 我尝试使用卸载模型实现计算 . 在我的计算开始时,我将所有数据传输到协处理器(一个阵列) . 计算后我想只传输给主处理器这个数组的一部分,但结果我得到以下错误: 卸载错误:数据传输(base = 0x75654640,size = 7896016)不是现有分配的子集(base = 0x75654640,size = 4512008) 这是...

热门问题