Amazon RDS - 数据库监控


为了维护Amazon RDS的可靠性、可用性和性能,我们需要收集监控数据,以便我们可以轻松调试多点故障。借助 Amazon RDS,您可以监控数据库实例的网络吞吐量、读取、写入和/或元数据操作的 I/O、客户端连接以及突发信用余额。我们还应该考虑存储历史监测数据。这些存储的数据将为您提供与当前性能数据进行比较的基线。

以下是一些监控数据的示例以及它们如何帮助维护健康的 RDS 实例。

  • 高 CPU 或 RAM 消耗 – 高 CPU 或 RAM 消耗值可能是合适的,前提是它们符合您的应用程序目标(例如吞吐量或并发性)并且是预期的。

  • 磁盘空间消耗 – 如果使用的空间始终等于或高于总磁盘空间的 85%,则调查磁盘空间消耗。查看是否可以从实例中删除数据或将数据归档到不同的系统以释放空间。

  • 网络流量 – 对于网络流量,请与您的系统管理员联系,了解您的域网络和 Internet 连接的预期吞吐量。如果吞吐量始终低于预期,请调查网络流量。

  • 数据库连接 – 如果您发现大量用户连接且实例性能和响应时间下降,请考虑限制数据库连接。

  • IOPS 指标 – IOPS 指标的预期值取决于磁盘规格和服务器配置,因此请使用您的基准来了解典型值。调查值是否始终与您的基线不同。为了获得最佳 IOPS 性能,请确保您的典型工作集适合内存,以最大限度地减少读写操作。

使用 Amazon CloudWatch 进行监控

Amazon RDS 每分钟都会向 Amazon CloudWatch 发送指标和维度。我们可以从 AWS 控制台监控这些指标,如下图所示。

监控矩阵.jpg