首页 文章
  • 0 votes
     answers
     views

    Mpi4py代码不会停止运行

    我正在使用一个非常基本的python代码(文件名: test_mpi.py )来尝试使用mpi4py在python中进行并行编程 . 我想要做的是为所有条目设置一个带有零的二维numpy数组 . 然后使用集群中的特定处理器来增加numpy数组的特定元素的值 . 具体来说,我有一个3 * 3的numpy矩阵( mat ),其所有元素都为零 . 我的代码完成运行后(跨多个处理器),我希望矩阵看起来像这...
  • 0 votes
     answers
     views

    Intel MIC - 卸载错误:数据传输

    我将从英特尔至强融核协处理器传输数据到主机CPU有问题 . 我尝试使用卸载模型实现计算 . 在我的计算开始时,我将所有数据传输到协处理器(一个阵列) . 计算后我想只传输给主处理器这个数组的一部分,但结果我得到以下错误: 卸载错误:数据传输(base = 0x75654640,size = 7896016)不是现有分配的子集(base = 0x75654640,size = 4512008) 这是...
  • 3 votes
     answers
     views

    连续内存分配的好处

    在性能方面,为矩阵分配连续内存块与单独内存块有什么好处?即,而不是像这样编写代码: char **matrix = malloc(sizeof(char *) * 50); for(i = 0; i < 50; i++) matrix[i] = malloc(50); 给我50个不同的50个字节的块和一个50个指针的块,如果我改为写: char **matrix = malloc(...
  • 2 votes
     answers
     views

    将功能卸载到Intel Xeon Phi所需的时间

    卸载调用是否需要预定义的时间将函数的数据(参数)从主机传输到Intel MIC(Xeon Phi协处理器3120系列)? 具体来说,我为我想要在MIC上执行的功能卸载调用(“#pragma offload target(mic)”) . 该函数有15个参数(指针和变量),我已经确认了MIC上参数的正确传递 . 但是我已经简化了代码,目的是检查传递参数的时间,因此它只包含一个简单的“printf()...
  • 0 votes
     answers
     views

    将Xeon-Phi分配给MPI进程

    我的系统有两个xeon-phi卡连接到一个节点 . 我正在尝试运行分布式MPI代码,它在卸载模式下使用xeon-phi加速 . 我想知道如果我为每个节点运行两个MPI进程,我将如何为每个MPI进程分配xeon-phi . 如何确保每个MPI进程使用不同的MIC .
  • 1 votes
     answers
     views

    OpenMP目标(更新)到

    我正在使用配备Intel Xeon Phi coprorcessors的平台上的OpenMP 4.5加速器模型 . 我想用CPU MIC来解决问题 . 我需要使用类似于Intel Offload的机制 . 我想立即将数据从缓冲区A从卡转移到缓冲区B.示例在下面的代码中给出 . #pragma offload target(mic : 0) \ out(A[0:size] : REUSE in...
  • 6 votes
     answers
     views

    .net 4.0任务并行库与MPI.NET

    .net 4.0任务并行库是否替换MPI.NET以进行高性能计算? MPI.NET在这里找到http://www.osl.iu.edu/research/mpi.net/svn/是一个高性能,易于使用的Microsoft .NET环境的消息传递接口(MPI)实现 . MPI是编写在分布式内存系统(如计算集群)上运行的并行程序的事实标准 . .NET 4 TPL说:“任务并行库(TPL)是.NET...
  • 0 votes
     answers
     views

    设计用于执行HPC计算的java GUI

    对不起,如果问题太开放或不合适,但这是由于我对几个技术/软件缺乏了解,我很遗憾 . 我有一个项目,我有一个现有的java swing GUI,它在本地机器上运行MPI作业 . 但是,需要支持在HPC群集上运行MPI作业(假设使用ssh访问的Linux群集) . 更具体地说,我需要执行的主要后端可执行文件(linux和windows)执行使用一个非常简单的主从系统,其中所有相关输出仅由主节点执行 ....
  • 5 votes
     answers
     views

    PBS工作相互依赖:一个工作开始,取消其他工作

    我想向我的群集上的几个队列提交模拟 . 只要一个队列启动它,它就会被其他队列取消 . 我知道它可能是不明确的,因为几个工作可能会在几个队列上同时开始 . 监视队列的bash脚本可能会这样做 . 提交作业时是否可以直接使用qsub? 编辑:下面是一个使用bash脚本的工作示例 . 这可能不是最佳的,因为它需要(慢)磁盘访问 . #!/bin/bash - # # Exit in case of er...
  • -1 votes
     answers
     views

    加速减少Xeon CPU,GPU和Xeon Phi操作的方法

    我有一个应用程序,其中大型矩阵上的减少操作(如sum,max)是瓶颈 . 我需要尽快做到这一点 . mkl中有向量指令吗? 是否有特殊的硬件单元在xeon cpu,gpu或mic上处理它? 一般来说,如何在这些硬件中实现减少操作?
  • 0 votes
     answers
     views

    英特尔指令集扩展和用户机器(AVX,IMCI ...)

    如果程序是在Xeon-Phi协处理器上编译的,并且包含来自IMCI指令集扩展的指令,是否可以在没有Xeon-Phi协处理器的用户机器上运行它? 如果可能,与没有在i7 Core处理器上编译的IMCI指令相同的应用程序相比,用户计算机上的性能是否会得到改善? 换句话说,为了从使用英特尔指令集扩展时提高性能中受益,用户计算机是否必须具有支持此扩展的处理器?

热门问题