我在Azure Data lake商店中有一个大型数据集,每天可能会添加/更新一些文件 . 如何在不读取每个数据集的情况下处理这些新文件?我需要使用Data Factory V1将这些新文件复制到SQL服务器 .
如果您可以使用ADF V2,则可以使用get metadata活动获取每个文件的lastModifiedDate属性,然后仅复制新文件 . 你可以参考这个文档 . https://docs.microsoft.com/en-us/azure/data-factory/control-flow-get-metadata-activity
1 回答
如果您可以使用ADF V2,则可以使用get metadata活动获取每个文件的lastModifiedDate属性,然后仅复制新文件 . 你可以参考这个文档 . https://docs.microsoft.com/en-us/azure/data-factory/control-flow-get-metadata-activity