有人可以解释SAP HANA和 SAP HANA Vora 之间的区别吗?
正如我所说, SDA 只是创建了一些 virtual tables
,它可以访问外部系统的数据(如Hadoop和ODBC的许多其他数据库),就像它将成为SAP HANA系统的一部分(因此您可以使用HANA IDE)和使用"default database engine"计算并将此外部系统的子结果返回给SAP HANA .
Vora 的概念也是为了让SAP用户访问Hadoop系统,但是使用Apache Spark的InMemory执行引擎来计算子结果 .
我读到Hadoop是用于冷数据的完美数据存储(来自SAP HANA的数据早于某个时间段,并且不是所有分析都需要) . 但我对这两种数据访问解决方案感到困惑,因为我找不到重要的区别 .
如果您计划在SAP HANA工具编写的一次分析中访问热门(SAP HANA)和冷(Hadoop)数据,哪一种会更好?
您建议将SAP HANA与Hadoop集群结合使用,其中包含Hive表中的数据?
1 回答
HANA Vora和SDA是相关的,但实际上是两个不能直接比较的东西 .
智能数据访问是HANA中的一个功能/组件,用于连接外部数据源(例如MySQL / Oracle数据库,Vora等)
“HANA Vora”中的HANA一词具有误导性,因为Vora实际上是一个不需要HANA运行的独立产品 . Vora是Apache Spark的扩展,允许您处理内存中HDFS的数据 . 此外,Vora的一个主要功能是它与HANA很好地集成 . 它可以将其本地表与HANA中的表连接,反之亦然 .
目前Vora不支持INSERT / UPDATE命令,因此您无法直接将冷数据存储的数据从HANA移动到Vora . 但是,您可以使用HANA的数据生命周期管理器(DLM)来实现这一点,该博客文章中讨论了这个问题:https://blogs.sap.com/2016/02/12/seamless-big-data-tiering-with-hana-hadoop-and-vora-with-a-little-help-from-dlm/