DynamoDB - 数据备份


利用 Data Pipeline 的导入/导出功能来执行备份。如何执行备份取决于您是使用 GUI 控制台还是直接使用 Data Pipeline (API)。使用控制台时为每个表创建单独的管道,或者如果使用直接选项,则在单个管道中导入/导出多个表。

导出和导入数据

您必须在执行导出之前创建 Amazon S3 存储桶。您可以从一个或多个表导出。

执行以下四步过程来执行导出 -

步骤 1 - 登录 AWS 管理控制台并打开位于https://console.aws.amazon.com/datapipeline/的 Data Pipeline 控制台

步骤 2 - 如果您在使用的 AWS 区域中没有管道,请选择立即开始。如果您有一个或多个,请选择“创建新管道”

步骤 3 - 在创建页面上,输入管道的名称。为源参数选择使用模板构建。从列表中选择将 DynamoDB 表导出到 S3 。在源 DynamoDB 表名称字段中输入源表。

使用以下格式在输出 S3 文件夹文本框中输入目标 S3 存储桶:s3://nameOfBucket/region/nameOfFolder。在日志的S3 位置文本框中输入日志文件的 S3 目标。

步骤 4 -输入所有设置后选择激活。

管道可能需要几分钟才能完成其创建过程。使用控制台监控其状态。通过查看导出的文件,使用 S3 控制台确认处理成功。

导入数据

仅当满足以下条件时才会成功导入:您创建了目标表、目标和源使用​​相同的名称,并且目标和源使用​​相同的键架构。

您可以使用已填充的目标表,但是导入会替换与源项目共享键的数据项目,并向表中添加多余的项目。目的地也可以使用不同的区域。

尽管您可以导出多个源,但每个操作只能导入一个。您可以按照以下步骤执行导入 -

步骤 1 - 登录 AWS 管理控制台,然后打开 Data Pipeline 控制台。

步骤 2 - 如果您打算执行跨区域导入,则应选择目标区域。

步骤 3 - 选择创建新管道

步骤 4 - 在名称字段中输入管道名称。为源参数选择使用模板构建,然后在模板列表中选择从 S3 导入 DynamoDB 备份数据

在输入 S3 文件夹文本框中输入源文件的位置。在目标 DynamoDB 表名称字段中输入目标表名称。然后在日志的 S3 位置文本框中输入日志文件的位置。

步骤 5 -输入所有设置后选择激活。

导入在管道创建后立即开始。管道可能需要几分钟才能完成创建过程。

错误

发生错误时,Data Pipeline 控制台会显示 ERROR 作为管道状态。单击出现错误的管道会将您带到其详细信息页面,该页面显示流程的每个步骤以及发生故障的点。其中的日志文件也提供了一些见解。

您可以按如下方式查看错误的常见原因 -

  • 导入的目标表不存在,或者未使用与源相同的键架构。

  • S3存储桶不存在,或者您没有读/写权限。

  • 管道超时。

  • 您没有必要的导出/导入权限。

  • 您的 AWS 账户已达到其资源限制。