-
12 votesanswersviews
为什么英特尔公布的一些Haswell AVX延迟比Sandy Bridge慢3倍?
在英特尔intrinsics webapp中,有几项行动似乎从桑迪桥变为哈斯威尔 . 例如,许多插入操作(如_mm256_insertf128_si256)显示如下的成本表: Performance Architecture Latency Throughput Haswell 3 - Ivy Bridge 1 - Sandy... -
37 votesanswersviews
为什么英特尔Haswell XEON CPU偶尔会错误地计算FFT和ART?
在最后几天,我观察到我的新工作站的行为,我无法解释 . 对这个问题进行一些研究,INTEL Haswell architecture以及当前的Skylake Generation可能存在一个错误 . 在撰写可能的错误之前,让我先概述一下使用的硬件,程序代码和问题本身 . 工作站硬件规范 INTEL至强E5-2680 V3 2500MHz 30M高速缓存12核心 Supermicro SC7... -
0 votesanswersviews
如何检测Xeon Phi(骑士登陆)
英特尔工程师写道,我们应该使用VZEROUPPER / VZEROALL来避免在所有处理器(包括未来的Xeon处理器)上转移到非VEX状态,但不能在Xeon Phi上转换:https://software.intel.com/pt-br/node/704023 人们还测量并发现VZEROUPPER和VZEROALL在Knights Landing上很贵: 在64位模式下,两个指令都有36个时钟周期... -
6 votesanswersviews
为什么英特尔不以更兼容或通用的方式设计其SIMD ISA?
英特尔在Xeon Phi上有几个SIMD ISA,如SSE,AVX,AVX2,AVX-512和IMCI . 这些ISA在不同的处理器上受支持 . 例如,AVX-512 BW,AVX-512 DQ和AVX-512 VL仅在Skylake上受支持,但在Xeon Phi上不受支持 . Skylake和Xeon Phi均支持AVX-512F,AVX-512 CDI,AVX-512 ERI和AVX-512... -
7 votesanswersviews
向左和向右移位SSE / AVX寄存器,同时以零移位
我想将左移或右移32位的SSE / AVX寄存器移位为零 . 让我对我感兴趣的转变更加准确 . 对于SSE,我想做四个32位浮点数的以下转换: shift1_SSE: [1, 2, 3, 4] -> [0, 1, 2, 3] shift2_SSE: [1, 2, 3, 4] -> [0, 0, 1, 2] 对于AVX,我想转移做以下转变: shift1_AVX: [1, 2, 3, ...