Java 学习之路

0 votes

answers

views

Mpi4py代码不会停止运行

我正在使用一个非常基本的python代码（文件名： test_mpi.py ）来尝试使用mpi4py在python中进行并行编程 . 我想要做的是为所有条目设置一个带有零的二维numpy数组 . 然后使用集群中的特定处理器来增加numpy数组的特定元素的值 . 具体来说，我有一个3 * 3的numpy矩阵（ mat ），其所有元素都为零 . 我的代码完成运行后（跨多个处理器），我希望矩阵看起来像这...

python parallel-processing cluster-computing hpc mpi4py
0 votes

answers

views

Intel MIC - 卸载错误：数据传输

我将从英特尔至强融核协处理器传输数据到主机CPU有问题 . 我尝试使用卸载模型实现计算 . 在我的计算开始时，我将所有数据传输到协处理器（一个阵列） . 计算后我想只传输给主处理器这个数组的一部分，但结果我得到以下错误：卸载错误：数据传输（base = 0x75654640，size = 7896016）不是现有分配的子集（base = 0x75654640，size = 4512008）这是...

c++ hpc intel-mic offloading
3 votes

answers

views

连续内存分配的好处

在性能方面，为矩阵分配连续内存块与单独内存块有什么好处？即，而不是像这样编写代码： char **matrix = malloc(sizeof(char *) * 50); for(i = 0; i < 50; i++) matrix[i] = malloc(50); 给我50个不同的50个字节的块和一个50个指针的块，如果我改为写： char **matrix = malloc(...

c memory-management hpc
2 votes

answers

views

将功能卸载到Intel Xeon Phi所需的时间

卸载调用是否需要预定义的时间将函数的数据（参数）从主机传输到Intel MIC（Xeon Phi协处理器3120系列）？具体来说，我为我想要在MIC上执行的功能卸载调用（“#pragma offload target（mic）”） . 该函数有15个参数（指针和变量），我已经确认了MIC上参数的正确传递 . 但是我已经简化了代码，目的是检查传递参数的时间，因此它只包含一个简单的“printf（）...

c hpc icc xeon-phi intel-mic
0 votes

answers

views

将Xeon-Phi分配给MPI进程

我的系统有两个xeon-phi卡连接到一个节点 . 我正在尝试运行分布式MPI代码，它在卸载模式下使用xeon-phi加速 . 我想知道如果我为每个节点运行两个MPI进程，我将如何为每个MPI进程分配xeon-phi . 如何确保每个MPI进程使用不同的MIC .

mpi hpc acceleration intel-mic xeon-phi
1 votes

answers

views

OpenMP目标（更新）到

我正在使用配备Intel Xeon Phi coprorcessors的平台上的OpenMP 4.5加速器模型 . 我想用CPU MIC来解决问题 . 我需要使用类似于Intel Offload的机制 . 我想立即将数据从缓冲区A从卡转移到缓冲区B.示例在下面的代码中给出 . #pragma offload target(mic : 0) \ out(A[0:size] : REUSE in...

c++ openmp hpc xeon-phi offloading
6 votes

answers

views

.net 4.0任务并行库与MPI.NET

.net 4.0任务并行库是否替换MPI.NET以进行高性能计算？ MPI.NET在这里找到http://www.osl.iu.edu/research/mpi.net/svn/是一个高性能，易于使用的Microsoft .NET环境的消息传递接口（MPI）实现 . MPI是编写在分布式内存系统（如计算集群）上运行的并行程序的事实标准 . .NET 4 TPL说：“任务并行库（TPL）是.NET...

.net parallel-processing mpi hpc
0 votes

answers

views

设计用于执行HPC计算的java GUI

对不起，如果问题太开放或不合适，但这是由于我对几个技术/软件缺乏了解，我很遗憾 . 我有一个项目，我有一个现有的java swing GUI，它在本地机器上运行MPI作业 . 但是，需要支持在HPC群集上运行MPI作业（假设使用ssh访问的Linux群集） . 更具体地说，我需要执行的主要后端可执行文件（linux和windows）执行使用一个非常简单的主从系统，其中所有相关输出仅由主节点执行 ....

java swing mpi hpc
5 votes

answers

views

PBS工作相互依赖：一个工作开始，取消其他工作

我想向我的群集上的几个队列提交模拟 . 只要一个队列启动它，它就会被其他队列取消 . 我知道它可能是不明确的，因为几个工作可能会在几个队列上同时开始 . 监视队列的bash脚本可能会这样做 . 提交作业时是否可以直接使用qsub？编辑：下面是一个使用bash脚本的工作示例 . 这可能不是最佳的，因为它需要（慢）磁盘访问 . #!/bin/bash - # # Exit in case of er...

batch-processing hpc qsub
-1 votes

answers

views

加速减少Xeon CPU，GPU和Xeon Phi操作的方法

我有一个应用程序，其中大型矩阵上的减少操作（如sum，max）是瓶颈 . 我需要尽快做到这一点 . mkl中有向量指令吗？是否有特殊的硬件单元在xeon cpu，gpu或mic上处理它？一般来说，如何在这些硬件中实现减少操作？

hpc intel-mkl intel-mic xeon-phi
0 votes

answers

views

英特尔指令集扩展和用户机器（AVX，IMCI ...）

如果程序是在Xeon-Phi协处理器上编译的，并且包含来自IMCI指令集扩展的指令，是否可以在没有Xeon-Phi协处理器的用户机器上运行它？如果可能，与没有在i7 Core处理器上编译的IMCI指令相同的应用程序相比，用户计算机上的性能是否会得到改善？换句话说，为了从使用英特尔指令集扩展时提高性能中受益，用户计算机是否必须具有支持此扩展的处理器？

c++ intel processor hpc xeon-phi

热门问题