全部产品
弹性计算 会员服务 网络 安全 移动云 数加·大数据分析及展现 数加·大数据应用 管理与监控 云通信 阿里云办公 培训与认证 更多
存储与CDN 数据库 域名与网站(万网) 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 智能硬件
云监控

云数据库RDS监控

更新时间:2017-06-07 13:26:11

关系型数据库RDS监控

概览

云监控通过监控 RDS 的磁盘使用率、IOPS 使用率、连接数使用率、CPU 使用率等监控指标,让您一目了然的了解 RDS 的运行状态。用户购买 RDS 产品后,云监控会自动对上述四个监控项收集数据,无需其他操作。

注意事项

  • RDS 只有主实例和只读实例提供监控和报警服务。

  • 云监控会默认为每个主实例和只读实例创建报警规则。内容分别是 CPU 使用率>80%,连接数使用率>80%,IOPS 使用率>80%,磁盘使用率 >80%。超过阈值时会短信和邮件通知云账号联系人。

监控服务

监控项说明

监控项 含义 维度 单位 最小监控粒度
磁盘使用率 数据库实例中磁盘空间的使用百分率 实例 百分比 5分钟
IOPS使用率 数据库实例的每秒IO请求次数 实例 百分比 5分钟
连接数使用率 连接数是指应用程序可以连接到RDS实例的数量。连接数使用率即已经使用的连接数百分率 实例 百分比 5分钟
CPU使用率 实例对CPU的使用率,数据库内存的大小决定CPU的性能 实例 百分比 5分钟
内存使用率 数据库实例中内存的已用占比,目前只有MySQL类型数据库支持内存实例率 实例 百分比 5分钟
只读实例延迟 Mysql只读实例延迟时间 实例 5分钟
网络入流量 实例每秒钟的输入流量 实例 bits/s 5分钟
网络出流量 实例每秒钟的输出流量 实例 bits 5分钟
实例故障 事件类型指标,可设置报警规则 - - -
实例主备切换 事件类型指标,可设置报警规则 - - -

备注:网络入流量和网络出流量仅支持 MySQL 和 SQLServer 数据库类型。

查看监控数据

  1. 登录云监控控制台

  2. 进入云服务监控下的云数据库 RDS实例列表。

  3. 单击实例名称或操作中的监控图表,进入监控详情页面。

  4. 单击大小图切换按钮,切换大图显示(可选)。

报警服务

参数说明

  • 监控项:RDS 提供的监控指标。

  • 统计周期:报警系统会按照这个周期检查您对应的监控数据是否超过了报警阈值。例如设置内存使用率报警规则的统计周期为 1 分钟,则每间隔1分钟会检查一次内存使用率是否超过了阈值。

  • 统计方法:统计方法指对超出阈值范围的设置。统计方法中可以设置平均值、最大值、最小值、求和值。

    a. 平均值:统计周期内监控数据的平均值。统计结果是 15 分钟内采集的所有监控数据的平均值,当这个平均值大于 80% 时,才算超过阈值。

    b. 最大值:统计周期内监控数据的最大值。统计周期内采集的监控数据中,最大值超过 80%,即为超过阈值。

    c. 最小值:统计周期内监控数据的最小值。统计周期内采集的监控数据中,最小值超过 80%,即为超过阈值。

    d. 求和值:统计周期内监控数据的总和。对统计周期内采集的监控数据进行求和,求和后的结果超过 80% 即为超过阈值。流量类指标需要用到此类统计方法。

  • 连续几次超过阈值后报警:指连续几个统计周期监控项的值持续超过阈值后触发报警。

    例如:设置 CPU 使用率超过 80% 报警,统计周期为 5 分钟,连续 3 次超过阈值后报警,则第一次探测 CPU 使用率超过 80% 时,不会发出报警通知。5 分钟后第二次探测 CPU 使用率超过 80%,也不会发出报警。第三次探测仍然超过 80% 时,才会发出报警通知。即从实际数据第一次超过阈值到最终发出报警规则,最少需要消耗的时间为统计周期×(连续探测次数-1)=5×(3-1)=10分钟。

设置报警规则

  1. 登录云监控控制台

  2. 进入云服务监控下的云数据库 RDS 实例列表。

  3. 单击实例列表操作中的报警规则,进入实例的报警规则页面。

  4. 单击报警规则页面右上角的新建报警规则,根据参数创建一条报警规则。

本文导读目录