我有一个由AWS Glue管理的数据目录,以及我的开发人员在我们的S3存储桶中使用新表或分区进行的任何更新,我们每天都使用爬虫来更新,以保持新分区的 Health .
但是,我们还需要自定义表属性 . 在我们的配置单元中,我们将每个表的数据源作为表属性,并且我们以胶水的形式添加到数据目录中的表中,但是,每次运行爬虫时,它都会覆盖自定义表属性,如Description .
我做错了吗?或者这是来自AWS Glue的错误?
您是否在抓取工具定义中选中了 Schema change policy ?
Schema change policy
1 回答
您是否在抓取工具定义中选中了
Schema change policy
?