我的另一端有一个RDBMS(SQL Server / Oracle)和一个Hadoop数据库 . 主键“客户”在两个数据存储中都很常见 .
几个问题:
是否可以拥有一个可以从RDBMS和Big数据中提取数据并生成报告的数据集市?什么是工具示例?
datamart本身是否需要是RDBMS存储,还是内存中的某些内容?
在这种环境中运行数据分析的最佳方式是什么?
数据可视化怎么样?
或者我应该将所有数据都放入RDBMS数据仓库中,然后解决这些问题?
数据虚拟化或数据联合是您正在寻找的 - 即能够访问将根据需要访问多个资源的单个源 .
数据库通常在此区域具有一些有限的功能,允许您定义外部表,例如this link for Oracle and HDFS
1 回答
数据虚拟化或数据联合是您正在寻找的 - 即能够访问将根据需要访问多个资源的单个源 .
数据库通常在此区域具有一些有限的功能,允许您定义外部表,例如this link for Oracle and HDFS