首页 文章

仅备份从DynamoDB到S3的新记录并将其加载到RedShift中

提问于
浏览
1

我看到类似的问题已经存在:

Backup AWS Dynamodb to S3

Copying only new records from AWS DynamoDB to AWS Redshift

Loading data from Amazon dynamoDB to redshift

不幸的是,他们中的大多数已经过时(因为亚马逊引入了新的服务)和/或有不同的答案 .

在我的情况下,我有两个数据库(RedShift和DynamoDB),我必须:

  • 使RedShift数据库保持最新状态

  • 在S3上存储数据库备份

要做到这一点,我想使用这种方法:

  • 在一天结束时仅备份从DynamoDB到S3的新/修改记录 . (每天1个文件)

  • 使用S3中的文件更新RedShift数据库

所以我的问题是最有效的方法是什么?

我读了this tutorial但我不确定 AWS Data Pipeline 是否可以配置为仅仅来自DynamoDB的新记录"catch" . 如果无法做到这一点,则每次扫描整个数据库都不是一种选择 .

先感谢您!

1 回答

  • 3

    你可以使用Amazon Lambda与dynamodb流(documentation

    您可以配置lambda函数以获取更新的记录(来自dynamodb流),然后更新redshift db

相关问题