暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Amazon RDS 的监控以及最佳实践

西云数据云计算 2022-01-20
920

前言

对于日常运维数据库, 做好监控是一个 DBA 比较重要的一部分。在 Amazon Relational Database Service( Amazon  RDS )中, 提供了不同方面/维度的监控。我们可以通过不同维度的监控分析数据库当前的状态,以及是否出现某些瓶颈。


Amazon RDS 对于监控有许多选项、功能,下面我们列举了各个监控功能可以做到的事情,以及如何对 RDS 的关键指标进行简单、有效的配置。




监控功能






CloudWatch

Amazon CloudWatch 是一个指标存储库。此存储库可从 Amazon RDS 收集原始数据,并将数据处理为易读的近乎实时的指标。


默认情况下,以 1 分钟为间隔自动将 Amazon RDS 指标数据发送到 Amazon CloudWatch。时间段为 60 秒(1 分钟)的数据点可用 15 天。这意味着您能够访问历史信息,了解您的 Web 应用程序或服务的执行情况。

 

需要重点关注的几个指标

# CPU, 内存,网络
CPUUtilization - CPU 使用百分率
FreeableMemory - 随机存取内存的可用大小
NetworkReceiveThroughput - 网络接收吞吐量(MB/秒)
NetworkTransmitThroughput - 网络传输吞吐量(MB/秒)


# 存储,IO
FreeStorageSpace - 可用存储空间的大小
ReadIOPS - 读取 IOPS(计数/秒)
ReadLatency - 读取延迟(毫秒)
ReadThroughput - 读取吞吐量(MB/秒)
WriteIOPS - 写入 IOPS (计数/秒)
WriteLatency - 写入延迟(毫秒)
WriteThroughput - 写入吞吐量(MB/秒)
SwapUsage - 交换区使用情况 (MB), 数据库实例上使用的交换空间的大小
DiskQueueDepth - 队列深度(计数),等待访问磁盘的未完成 I/O(读取/写入请求)的数量


# 数据库连接
DatabaseConnections -  使用中的数据库连接数


# GP2 存储类型需要关注
BurstBalance - 突发余额(百分比)

# t2 实例类型需要关注
CPUCreditUsage - CPU 额度使用(计数)




增强监控(Enhanced Monitoring)

利用增强监测功能,您可以实时监控数据库实例的操作系统。Amazon RDS 为数据库实例运行的操作系统 (OS) 实时提供指标,您可以在控制台上查看 RDS 数据库实例的所有系统指标和过程信息。RDS 将增强监测中的指标传输到您的 Amazon CloudWatch Logs。 


增强监控提供了更详细的系统指标,并可以提供 1s 级别的监控。分为 general,cpuUtilization,diskIO,physicalDeviceIO,fileSys,loadAverageMinute,memory,network,processList,swap,tasks。




性能详情 (Performance Insights,PI)


利用 Performance Insights 控制面板,您可以可视化数据库负载并按等待状态、SQL 语句、主机或用户来筛选负载。

 

性能详情的关键指标是 DB Load,每秒收集一次。数据库负载的单位是数据库引擎的平均活动会话数(AAS)。活动的会话是已将作业提交到数据库引擎并且正在等待响应的连接。例如,如果您将 SQL 查询提交到数据库引擎,则数据库会话在引擎处理该查询时将处于活动状态。为了获取平均活动会话数,性能详情会对同时运行查询的会话数进行采样。平均活动会话数是会话总数除以样本总数。





事件(Event)


RDS 事件表示 RDS 环境中的更改。例如,当实例状态从待处理变为正在运行时,Amazon RDS 将生成事件。Amazon RDS 将事件近乎实时地传输到 CloudWatch Events 和 EventBridge。





数据库日志


1. 可以将数据库的日志输出到 CloudWatch Logs 中, 非常简单的配置,就可以将日志输出, 并且可以在 CloudWatch 中利用过滤,下载等功能对日志进行分析查看。
2. 将数据库日志下载到本地。可以借助 Amazon Command Line Interface (Amazon CLI )将日志下载到本地进行分析。





其他第三方工具


可以通过 Prometheus,Zabbix,Grafana,pgbadger 等其他自建监控工具对数据库进行监控。




Amazon RDS 监控最佳实践





如何配置一个较为简单并好用的监控方案,利用 RDS 默认自带的 CloudWatch 监控,您可以参考如下方式:


1. 对 FreeStorageSpace 进行监控,避免没有存储空间问题以至 RDS 实例无法正常提供服务。
2. 对 CPUUtilization 进行监控,避免 CPU 资源消耗过大,导致 RDS 实例响应变慢。
3. 对 FreeableMemory 进行监控,避免内存吃紧导致 RDS 实例响应变慢甚至宕机。
4. RDS 有许多 IO 指标,可以对 DiskQueueDepth 进行监控,因为无论吞吐量还是 IOPS 如果吃紧,都会反应在 DiskQueueDepth 上升,如果某时发现 DiskQueueDepth 意外上升,可以再对吞吐量和 IOPS 进一步分析。
5. 可以做好事件通知, 在第一时间得到数据库的动态。
6. 保存 RDS 实例日志至 CloudWatch Logs 中,这样避免 RDS 实例日志被轮循删除。

以上就是对于 Amazon RDS 监控功能的梳理,大家可以根据业务的繁忙程度、紧要程度来定制适合自身业务的监控。

作者介绍

张晨

西云数据云计算技术支持工程师
负责亚马逊云科技中国区数据库服务技术支持,协助客户解决数据库服务相关使用问题。

END




长按识别左侧二维码

关注我们>>





关于西云数据(NWCD)]

宁夏西云数据科技有限公司(简称“西云数据”)是亚马逊云科技中国(宁夏)区域云服务的运营方和服务提供方,作为西云数据的战略技术合作伙伴,亚马逊云科技向西云数据提供技术、指导和专业知识。西云数据成立于 2015 年,是一家持有互联网数据中心服务和互联网资源协作服务牌照的云服务提供商。2017 年 12 月 12 日, 西云数据正式推出亚马逊云科技中国(宁夏)区域云服务,现已开通 3 个可用区。西云数据市场销售总部设立于北京,在全国多地设有分支机构以服务全国各地的企业客户。

西云数据致力于将世界先进的 Amazon Web Services 云计算技术带给中国客户,为客户提供优质、安全、稳定、可靠的云服务,全力支持中国企业和机构的创新发展。


关于亚马逊云科技]

15 年多以来,亚马逊云科技(Amazon Web Services)一直是世界上以服务丰富、应用广泛而著称的云平台。亚马逊云科技一直不断扩展其服务组合以支持几乎云上任意工作负载,目前提供了超过 200 项全功能的服务,涵盖计算、存储、数据库、联网、分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体、以及应用开发、部署与管理等方面,遍及 25 个地理区域的 80 个可用区(AZ),并已公布计划在澳大利亚、印度、印度尼西亚、西班牙、瑞士和阿拉伯联合酋长国新建 6 个区域、18 个可用区。全球数百万客户,包括发展迅速的初创公司、大型企业和领先的政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本。欲了解亚马逊云科技的更多信息,请访问:http://aws.amazon.com。

    发现“分享、赞、在看了吗,戳我看看吧~

文章转载自西云数据云计算,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论