Java 学习之路

12 votes

answers

views

为什么英特尔公布的一些Haswell AVX延迟比Sandy Bridge慢3倍？

在英特尔intrinsics webapp中，有几项行动似乎从桑迪桥变为哈斯威尔 . 例如，许多插入操作（如_mm256_insertf128_si256）显示如下的成本表： Performance Architecture Latency Throughput Haswell 3 - Ivy Bridge 1 - Sandy...

x86-64 intel simd cpu-architecture avx2
37 votes

answers

views

为什么英特尔Haswell XEON CPU偶尔会错误地计算FFT和ART？

在最后几天，我观察到我的新工作站的行为，我无法解释 . 对这个问题进行一些研究，INTEL Haswell architecture以及当前的Skylake Generation可能存在一个错误 . 在撰写可能的错误之前，让我先概述一下使用的硬件，程序代码和问题本身 . 工作站硬件规范 INTEL至强E5-2680 V3 2500MHz 30M高速缓存12核心 Supermicro SC7...

intel cpu-architecture processor avx2
0 votes

answers

views

如何检测Xeon Phi（骑士登陆）

英特尔工程师写道，我们应该使用VZEROUPPER / VZEROALL来避免在所有处理器（包括未来的Xeon处理器）上转移到非VEX状态，但不能在Xeon Phi上转换：https://software.intel.com/pt-br/node/704023 人们还测量并发现VZEROUPPER和VZEROALL在Knights Landing上很贵：在64位模式下，两个指令都有36个时钟周期...

avx avx2 xeon-phi avx512 knights-landing
6 votes

answers

views

为什么英特尔不以更兼容或通用的方式设计其SIMD ISA？

英特尔在Xeon Phi上有几个SIMD ISA，如SSE，AVX，AVX2，AVX-512和IMCI . 这些ISA在不同的处理器上受支持 . 例如，AVX-512 BW，AVX-512 DQ和AVX-512 VL仅在Skylake上受支持，但在Xeon Phi上不受支持 . Skylake和Xeon Phi均支持AVX-512F，AVX-512 CDI，AVX-512 ERI和AVX-512...

intel simd avx avx2 avx512
7 votes

answers

views

向左和向右移位SSE / AVX寄存器，同时以零移位

我想将左移或右移32位的SSE / AVX寄存器移位为零 . 让我对我感兴趣的转变更加准确 . 对于SSE，我想做四个32位浮点数的以下转换： shift1_SSE: [1, 2, 3, 4] -> [0, 1, 2, 3] shift2_SSE: [1, 2, 3, 4] -> [0, 0, 1, 2] 对于AVX，我想转移做以下转变： shift1_AVX: [1, 2, 3, ...

x86 sse simd avx avx2

为什么英特尔公布的一些Haswell AVX延迟比Sandy Bridge慢3倍？

为什么英特尔Haswell XEON CPU偶尔会错误地计算FFT和ART？

如何检测Xeon Phi（骑士登陆）

为什么英特尔不以更兼容或通用的方式设计其SIMD ISA？

向左和向右移位SSE / AVX寄存器，同时以零移位

热门问题