我需要使用Azure SQL数据仓库构建数据仓库,该数据仓库来自单个Azure SQL数据库中的数据 . 看看this article,似乎我有两个选择:
-
SSIS
-
Azure数据工厂
我的Azure SQL数据库已规范化,但我想以星型或雪花型架构格式构建我的Azure SQL数据仓库,因此它不是表的直接副本 - 肯定需要进行一些转换 .
鉴于Azure SQL数据库不支持SSIS,并且要求我在其上运行带有SQL Server的VM以使我的进程完全保留在Azure中,Azure Data Factory是Azure SQL数据库和Azure SQL数据仓库之间ETL数据的推荐工具吗?在这种情况下,一种选择与另一种选择是否更加完整?
谢谢!
2 回答
如果您希望将流程完全保留在 Cloud 中而不是启动VM,那么Azure Data Factory目前是数据移动的最佳选择 . 但是,在这个时间点,我可能会建议采用ELT方法而不是ETL方法 . 通过先加载数据然后在SQL数据仓库中完成转换,您的加载速度会更快,并且在转换数据时您将能够利用额外的计算能力 . 此外,听起来您熟悉SQL,因此您可能更容易在SQL数据仓库内编写转换,而不是使用Data Factory的JSON .
查看是否创建一个指向Azure SQL数据库的外部表(在DW中)将帮助您 . 有了这个,您可能会发布一些Create Table As(CTAS)命令来将结构更改为星星/雪花 .
来自https://msdn.microsoft.com/en-us/library/dn935022.aspx