-- Haskell
showTree :: (Show a) => Tree a -> String
showTree tree = case tree of
Leaf -> "a leaf"
Branch value left right -> "a branch with value " ++ show value ++
", left subtree (" ++ showTree left ++ ")" ++
", right subtree (" ++ showTree right ++ ")"
// Scala
def showTree[T](tree: Tree[T]) = tree match {
case Leaf => "a leaf"
case Branch(value, left, right) => s"a branch with value $value, " +
s"left subtree (${showTree(left)}), " +
s"right subtree (${showTree(right)})"
}
最简单的例子是 Show ,它是具有字符串表示的所有类型的类;就是所有类型 a 我们有一个函数 show ∷ a → String . 如果某个类型具有 show 函数,我们说它是“在 Show ”;否则,它不是 . 你知道的大多数类型如 Int , Bool 和 String 都在 Show ;另一方面,函数(具有 → 的任何类型)不在 Show 中 . 这就是GHCi无法打印功能的原因 .
类型类由一个类需要实现的函数定义为它的一部分 . 例如, Show 只能由 show 函数定义:
class Show a where
show ∷ a → String
现在要将 Foo 这样的新类型添加到 Show ,我们必须为它编写一个实例 . 这是 show 函数的实际实现:
instance Show Foo where
show foo = case foo of
Bar → "Bar"
Baz → "Baz"
3 回答
ADT(在此上下文中不是抽象数据类型,这是另一个概念,但是代数数据类型)和类型类是完全不同的概念,它们解决了不同的问题 .
ADT,如首字母缩略词,是一种数据类型 . 需要ADT来构建数据 . 我认为,Scala中最接近的匹配是案例类和密封特征的组合 . 这是在Haskell中构造复杂数据结构的主要方法 . 我认为ADT最着名的例子是
Maybe
类型:此类型在标准Scala库中具有直接等效项,称为
Option
:这不完全是如何在标准库中定义
Option
,但你明白了 .基本上ADT是(在某种意义上)几个命名元组的组合(0-ary,如
Nothing
/None
; 1-ary,asJust a
/Some(value)
;更高的arities也是可能的) .请考虑以下数据类型:
这是简单的二叉树 . 这两个定义基本上都读取如下:“二叉树是
Leaf
或Branch
;如果它是分支,那么它包含一些值和另外两个树” . 这意味着如果你有一个Tree
类型的变量,那么它可以包含Leaf
或Branch
,你可以检查哪一个存在并提取包含的数据,如果需要的话 . 这种检查和提取的主要方法是模式匹配:这个概念非常简单,但也非常强大 .
您已经注意到,ADT已关闭,即在定义类型后无法添加更多命名元组 . 在Haskell中,这是在语法上强制执行的,而在Scala中,这是通过
sealed
关键字实现的,该关键字不允许其他文件中的子类 .这些类型被称为代数是有原因的 . 命名元组可以被视为产品(在数学意义上)和这些元组的“组合”作为求和(也在数学意义上),并且这种考虑具有深刻的理论意义 . 例如,前面提到的二叉树类型可以这样写:
但我认为这超出了这个问题的范围 . 如果你想了解更多,我可以搜索一些链接 .
另一方面,类型类是定义多态行为的一种方法 . 大致类型类是某种类型提供的 Contract . 例如,您知道您的值
x
满足定义某个操作的 Contract . 然后,您可以调用该方法,然后自动选择该 Contract 的实际实现 .通常将类型类与Java接口进行比较,例如:
使用此比较,类型类的实例与接口的实现匹配:
接口和类型类之间存在非常重要的差异 . 首先,您可以编写自定义类型类,并使任何类型成为它的实例:
但是你不能用接口做这样的事情,也就是说,你不能让现有的类实现你的接口 . 您也注意到,此功能意味着类型类是开放的 .
这种为现有类型添加类型类实例的能力是解决expression problem的一种方法 . Java语言没有办法解决它,但Haskell,Scala或Clojure都有 .
类型类和接口之间的另一个区别是接口只在第一个参数上是多态的,即在隐式
this
上 . 在这种意义上,类型类不受限制 . 您可以定义甚至在返回值上调度的类型类:使用接口是不可能的 .
可以使用隐式参数在Scala中模拟类型类 . 这种模式非常有用,在最近的Scala版本中甚至还有一种特殊的语法简化了它的使用 . 以下是它的完成方式:
Showable[T]
trait对应于类型类,隐式对象定义对应于其实例 .如您所见,类型类是一种接口,但功能更强大 . 你甚至可以选择不同的类型类的实现,而使用它们的代码保持不变 . 然而,这种功率是以样板和额外实体为代价的 .
注意,可以编写与上面Scala程序等效的Haskell,但是它需要编写多个模块或
newtype
包装器,所以我不在这里介绍它 .BTW,Clojure,一个在JVM上工作的Lisp方言,有协议,它结合了接口和类型类 . 协议是在单个第一个参数上调度的,但您可以为任何现有类型实现协议 .
您的问题实际上涉及三个不同的概念:类型类,抽象数据类型和代数数据类型 . 令人困惑的是,"abstract"和"algebraic"数据类型可以缩写为"ADT";在Haskell上下文中,ADT几乎总是意味着"algebraic" .
所以让我们定义所有三个术语 .
代数数据类型(ADT)是可以通过组合更简单的类型来实现的类型 . 这里的核心思想是“构造函数”,它是一个定义值的符号 . 可以把它想象成Java风格的枚举中的值,除了它也可以带参数 . 最简单的代数数据类型只有一个没有参数的构造函数:
这种类型只有一个¹值:
Bar
. 就其本身而言,这并不是很有趣;我们需要一些方法来 Build 更大的类型 .第一种方法是给出构造函数参数 . 例如,我们可以让
Bar
采用int和字符串:现在
Foo
有许多不同的可能值:Bar 0 "baz"
,Bar 100 "abc"
等等 . 一个更现实的例子可能是员工的记录,看起来像这样:构建更复杂类型的另一种方法是通过多个构造函数进行选择 . 例如,我们可以同时拥有
Bar
和Baz
:现在,
Foo
类型的值可以是Bar
或Baz
. 事实上,这正是布尔人的工作方式;Bool
定义如下:它完全符合你的期望 . 真正有趣的类型可以使用两种方法来组合自己 . 作为一个相当人为的例子,想象一下形状:
形状可以是由其两个角定义的矩形,也可以是作为中心和半径的圆 . (我们将
Point
定义为(Int, Int)
. )足够公平 . 但在这里,我们遇到了障碍:事实证明其他形状也存在!如果一些相信三角形的异教徒想要在他们的模型中使用我们的类型,他们可以在事后添加Triangle
构造函数吗?不幸的是:在Haskell中,代数数据类型是封闭的,这意味着你不能在事后添加新的替代品 .使用代数数据类型可以做的一件重要事情就是模式匹配 . 这基本上意味着能够分支ADT的替代品 . 作为一个非常简单的示例,您可以在
Bool
上进行模式匹配,而不是使用if表达式:如果构造函数具有参数,则还可以通过模式匹配来访问这些值 . 使用上面的
Shape
,我们可以编写一个简单的area
函数:_
只是意味着我们不是't care about the value of a point'的中心 .这只是代数数据类型的基本概述:事实证明,它有了更多的乐趣 . 您可能需要查看“了解你的哈斯克尔(简称LYAH)”中的relevant chapter以获得更多阅读 .
现在,抽象数据类型呢?这指的是一个不同的概念 . 抽象数据类型是不公开实现的类型:您不需要进行模式匹配或自己构造新值 . 实践中的一个好例子是
Map
(来自Data.Map
) . 该映射实际上是一种特殊的二叉搜索树,但模块中没有任何内容可以让您直接使用树结构 . 这很重要,因为树需要维护某些额外的不变量,这些变量很容易搞乱 . 所以你只能使用Map
作为不透明的blob .代数和抽象类型在某种程度上是正交的概念;相当不幸的是,他们的名字很容易将一个人误认为另一个人 .
拼图的最后一部分是类型类 . 与代数和抽象数据类型不同,类型类本身不是类型 . 相反,将类型类视为一组类型 . 特别是,类型类是实现某些功能的所有类型的集合 .
最简单的例子是
Show
,它是具有字符串表示的所有类型的类;就是所有类型a
我们有一个函数show ∷ a → String
. 如果某个类型具有show
函数,我们说它是“在Show
”;否则,它不是 . 你知道的大多数类型如Int
,Bool
和String
都在Show
;另一方面,函数(具有→
的任何类型)不在Show
中 . 这就是GHCi无法打印功能的原因 .类型类由一个类需要实现的函数定义为它的一部分 . 例如,
Show
只能由show
函数定义:现在要将
Foo
这样的新类型添加到Show
,我们必须为它编写一个实例 . 这是show
函数的实际实现:在此之后,
Foo
位于Show
. 我们可以在任何地方为Foo
编写一个实例 . 特别是,我们可以在定义类之后编写新实例,即使在其他模块中也是如此 . 这就是类型类开放的意义;与代数数据类型不同,我们可以在事后添加新的东西给类型类 .对于类型类还有更多;你可以在same LYAH chapter中阅读它们 .
¹从技术上讲,还有另一个名为⊥(底部)的值,但我们暂时忽略它 . 你可以稍后了解⊥ .
²实际上,
Show
实际上有另一个可能的函数,它将a
的列表带到String
. 这基本上是一个让字符串看起来很漂亮的黑客,因为字符串只是Char
的列表而不是它自己的类型 .类型类和ADT之间的区别是:
如果要根据某些内容调度方法,请使用类型类 type
如果要根据某些内容调度方法,请使用ADT value
例如,考虑
print
函数:类型是静态的,并且在程序的整个生命周期中都不能更改,因此当您使用类型类时,您使用的方法将在编译时根据调用站点的推断类型进行静态选择 . 所以在这个例子中,我知道我甚至没有运行程序就使用
Char
Show
实例:ADT允许您动态更改函数的行为 . 例如,我可以定义:
现在,如果我在某些情况下调用
print2
:...我不知道
print2
采用哪个分支,除非我知道e
的运行时值 . 如果e
是Left
然后我接受Left
分支,如果e
是Right
那么我接受Right
分支 . 有时我可以静态地推断出哪个构造函数e
,但有时我不能,例如在下面的例子中: