首页 文章

使用Glue Data爬虫处理压缩的gz文件以创建表模式

提问于
浏览
1

我在S3存储桶中有一个压缩的gzip文件 . 这些文件将由客户端每天上传到S3存储桶 . 未压缩时的gzip将包含CSV格式的10个文件,但仅具有相同的模式 . 我的目标是处理gzip文件,使用数据爬虫创建表模式,然后将所有数据作为镶木地板文件加载/合并到新的单个表中 .

Glue爬虫可以读取gz文件并根据文件列表创建创建表 . 请帮助解决方案 .

谢谢 .

1 回答

相关问题