首页 文章

Intel Xeon Phi上每个时钟周期的乘法次数

提问于
浏览
0

在Intel Xeon Phi中,每个内核有32个512位宽的向量寄存器 . 每个向量寄存器每个周期可以执行16个单精度浮点运算 . 并且可以在1个循环中完成2个操作(v管中为1个,u管中为1个) .

我想知道除了向量寄存器中的向量乘法之外,在1个时钟周期内可以进行多少标量乘法 .

1 回答

  • 1

    那里有些误解 . 每个核心有1个向量单位 . 寄存器存储值,它们不计算 . 因此,每个核心每个周期可以发出1 512字节宽的向量运算 . 您也可以在1个周期内进行标量乘法运算 . 您不能同时发布这两个 . 使用u和v管道,您可以发出一个向量或标量操作,然后在另一个管道中执行内存操作 . 您可以在每个周期执行融合乘法 - 加法(MADD)指令,这有效地为每个核每个周期提供2个向量运算 .

相关问题