我指的是关于Xeon Phi指令集的Intel手册,并且无法理解散布/收集指令的工作原理 .
假设我有以下双打矢量:
A-> |b4|a4|b3|a3|b2|a2|b1|a1|
是否可以创建4个向量,如下所示:
V1->|b1|a1|b1|a1|b1|a1|b1|a1|
V2->|b2|a2|b2|a2|b2|a2|b2|a2|
V3->|b3|a3|b3|a3|b3|a3|b3|a3|
V4->|b4|a4|b4|a4|b4|a4|b4|a4|
使用这些说明?有没有其他方法来实现这一目标?
1 回答
来自英特尔论坛(由Evgueni Petrov回答):
其中'Addr'是内存中位置的地址,我们从中将双打加载到矢量'A'中 .
我们可以分别使用&(Addr 2),&(Addr 4)和&(Addr 6)对V2,V3,V4进行类似的操作 .