我看到类似的问题已经存在:
Copying only new records from AWS DynamoDB to AWS Redshift
Loading data from Amazon dynamoDB to redshift
不幸的是,他们中的大多数已经过时(因为亚马逊引入了新的服务)和/或有不同的答案 .
在我的情况下,我有两个数据库(RedShift和DynamoDB),我必须:
-
使RedShift数据库保持最新状态
-
在S3上存储数据库备份
要做到这一点,我想使用这种方法:
-
在一天结束时仅备份从DynamoDB到S3的新/修改记录 . (每天1个文件)
-
使用S3中的文件更新RedShift数据库
所以我的问题是最有效的方法是什么?
我读了this tutorial但我不确定 AWS Data Pipeline 是否可以配置为仅仅来自DynamoDB的新记录"catch" . 如果无法做到这一点,则每次扫描整个数据库都不是一种选择 .
先感谢您!
1 回答
你可以使用Amazon Lambda与dynamodb流(documentation)
您可以配置lambda函数以获取更新的记录(来自dynamodb流),然后更新redshift db