在最近的x86架构上,存储到负载转发失败的成本是多少?

特别是,由于负载部分地与早期存储重叠,或者因为较早的加载或存储跨越某些导致转发失败的对齐边界,因此存储到加载转发失败 .

当然有延迟成本:它有多大?是否还存在吞吐量成本,例如,故障的存储到转发转发是否使用其他资源然后对其他负载和存储不可用,或者甚至是其他非存储器操作?

当商店的所有部分都来自商店缓冲区时,与存储缓冲区和L1混合的情况有区别吗?