Azure：将新文件添加到data lake store时运行数据工厂活动-Java 学习之路

我在Azure Data lake商店中有一个大型数据集，每天可能会添加/更新一些文件 . 如何在不读取每个数据集的情况下处理这些新文件？我需要使用Data Factory V1将这些新文件复制到SQL服务器 .

1 回答

2

如果您可以使用ADF V2，则可以使用get metadata活动获取每个文件的lastModifiedDate属性，然后仅复制新文件 . 你可以参考这个文档 . https://docs.microsoft.com/en-us/azure/data-factory/control-flow-get-metadata-activity

回复于 2024-05-04T07:19:36+08:00