首页 文章

使用U-SQL遍历文件夹

提问于
浏览
0

我正在尝试使用U-SQL读取文件的完整父目录,无论它在源目录结构中有多深

@searchLog = EXTRACT FileName string, , Path string , UserId int , Start DateTime , Region string , Query string , Duration int , Urls string , ClickedUrls string FROM "wasb://[blobcontainter]@[blobaccount]/samples/{Path}/{FileName}.csv" USING Extractors.Csv();

我想要实现的是遍历blob容器中的文件夹,并将路径保存到文件中以及内部数据 . 假设我有这样的文件结构:

"/samples/foo/log1.csv" "/samples/foo/bar/log1.csv" "/samples/foo/bar/baz/log3.csv"

我想获得的 Value

"foo" "foo/bar" "foo/bar/baz"

分别

目前,我只能使用以下方式读取一个级别的文件夹:它在结果集中作为Path返回:

FROM "wasb://[blobcontainter]@[blobaccount]/samples/{Path}/{FileName}.csv"

放一个通配符

FROM "wasb://[blobcontainter]@[blobaccount]/samples/{*}/{FileName}.csv"

读取顶级和第一个子级文件夹的结果,但它没有比这更深,另外它不返回结果集中的路径 .

最重要的是,文件列表中不支持Streamsets

FROM "wasb://[blobcontainter]@[blobaccount]/samples/{Topfolder}/{FileName}.csv" FROM "wasb://[blobcontainter]@[blobaccount]/samples/{Topfolder}/{Subfolder1}/{FileName}.csv"

也不是一种选择 .

1 回答

  • 0

    目前尚未提供,但这是我们长期积压的一部分 . 请在http://aka.ms/adlfeedback提交功能请求,以帮助我们确定功能的优先级 .

相关问题