为什么多态性在haskell（GHC）中如此昂贵？-Java 学习之路

我问这个问题，请参考this问题 . Don Stewart接受的答案：第一行是"Your code is highly polymorphic change all float vars to Double .."，它提供了4倍的性能提升 .

我有兴趣在Haskell中进行矩阵计算，我应该养成编写高度单态代码的习惯吗？

但是有些语言很好地利用了ad-hoc多态来生成快速代码，为什么GHC不会或不能呢？（读C或D）

为什么我们不能拥有像Haskell一样的闪电战或特征？我不明白GHC中的类型和（ad-hoc）多态性是如何工作的 .

3 回答

11
我不明白类词汇在GHC中如何运作 .

好的，考虑这个功能：
```
linear :: Num x => x -> x -> x -> x
linear a b x = a*x + b
```
这需要三个数字作为输入，并返回一个数字作为输出 . 此函数接受任何数字类型;它是多态的 . GHC如何实现这一点？好吧，本质上编译器会创建一个"class dictionary"，它包含其中的所有类方法（在本例中为 + ， - ， * 等） . 此字典成为函数的额外隐藏参数 . 像这样的东西：
```
data NumDict x =
  NumDict
  {
    method_add :: x -> x -> x,
    method_subtract :: x -> x -> x,
    method_multiply :: x -> x -> x,
    ...
  }

linear :: NumDict x -> x -> x -> x -> x
linear dict a b x = a `method_multiply dict` x `method_add dict` b
```
无论何时调用该函数，编译器都会自动插入正确的字典 - 除非调用函数也是多态的，在这种情况下它本身会收到一个字典，所以只需传递它 .

事实上，缺乏多态性的函数通常更快，因为缺乏函数查找，但因为知道类型允许进行额外的优化 . 例如，我们的多态 linear 函数将适用于数字，向量，基质，比率，复数，任何东西 . 现在，如果编译器知道我们想要在 Double 上使用它，那么现在所有操作都成为单机器代码指令，所有操作数都可以在处理器寄存器中传递，依此类推 . 所有这些都会产生极其高效的代码 . 即使它是 Double 组件的复杂数字，我们也可以使它变得更好，更高效 . 如果我们不知道我们在哪种类型中进行任何优化......这就是大多数速度差异通常来自的地方 .

对于像线性这样的微小函数，每次调用它时很可能会内联，导致没有多态性开销和少量代码重复 - 更像是C模板 . 对于更大，更复杂的多态函数，可能会有一些成本 . 一般情况下，编译器决定这一点，而不是你 - 除非你想开始在这个地方撒上pragma . ;-)或者，如果你实际上没有使用任何多态，你可以只给出所有单形类型的签名...
回复于 2024-04-23T21:31:19+08:00
18

对于多态代码，通常需要在代码大小和代码速度之间进行权衡 . 要么为它将要操作的每种类型生成相同代码的单独版本，这会导致更大的代码，或者您生成可以在多种类型上运行的单个版本，这将更慢 .

模板的C实现选择以增加代码大小为代价来增加代码速度 . 默认情况下，GHC采取相反的权衡 . 但是，可以使用SPECIALIZE和INLINABLE编译指示使GHC为不同类型生成单独的版本 . 这将导致多态代码具有类似于单态代码的速度 .

回复于 2024-04-23T21:31:19+08:00
18

我想通过说 INLINABLE 通常建议超过 SPECIALIZE 来补充Dirk的答案 . 函数上的 INLINABLE 注释可保证模块导出函数的原始源代码，以便在使用时将其专门化 . 这通常不需要为每个用例提供单独的 SPECIALIZE 编译指示 .

与 INLINE 不同， INLINABLE 不会改变GHC的优化启发式 . 它只是说"Please export the source code" .

回复于 2024-04-23T21:31:19+08:00

为什么多态性在haskell（GHC）中如此昂贵？

3 回答

相关问题