云监控通过监控 RDS 的磁盘使用率、IOPS 使用率、连接数使用率、CPU 使用率等监控指标,让您一目了然的了解 RDS 的运行状态。用户购买 RDS 产品后,云监控会自动对上述四个监控项收集数据,无需其他操作。

说明
  • RDS 只有主实例和只读实例提供监控和报警服务。
  • 云监控会默认为每个主实例和只读实例创建报警规则。内容分别是 CPU 使用率>80%,连接数使用率>80%,IOPS 使用率>80%,磁盘使用率 >80%。超过阈值时会短信和邮件通知云账号联系人。

监控服务

  • 监控项说明
    监控项 含义 维度 单位 最小监控粒度
    磁盘使用率 数据库实例中磁盘空间的使用百分率 实例 百分比 5分钟
    IOPS使用率 数据库实例的每秒IO请求次数 实例 百分比 5分钟
    连接数使用率 连接数是指应用程序可以连接到RDS实例的数量。连接数使用率即已经使用的连接数百分率 实例 百分比 5分钟
    CPU使用率 实例对CPU的使用率,数据库内存的大小决定CPU的性能 实例 百分比 5分钟
    内存使用率 数据库实例中内存的已用占比,目前只有MySQL类型数据库支持内存实例率 实例 百分比 5分钟
    只读实例延迟 Mysql只读实例延迟时间 实例 5分钟
    网络入流量 实例每秒钟的输入流量 实例 bit/s 5分钟
    网络出流量 实例每秒钟的输出流量 实例 bit/s 5分钟
    实例故障 事件类型指标,可设置报警规则 - - -
    实例主备切换 事件类型指标,可设置报警规则 - - -

    网络入流量和网络出流量仅支持 MySQL 和 SQLServer 数据库类型。

  • 查看监控数据
    1. 登录云监控控制台
    2. 单击左侧导航栏中云服务监控下的云数据库 RDS,进入云数据库RDS监控列表页面。
    3. 单击实例名称或操作中的监控图表,进入监控图表页面。
    4. 单击大小图切换按钮,切换大图显示(可选)。

报警服务

  • 参数说明
    • 监控项:RDS 提供的监控指标。
    • 统计周期:报警系统会按照这个周期检查您对应的监控数据是否超过了报警阈值。例如设置内存使用率报警规则的统计周期为 1 分钟,则每间隔1分钟会检查一次内存使用率是否超过了阈值。
    • 统计方法:统计方法指对超出阈值范围的设置。统计方法中可以设置平均值、最大值、最小值、求和值。
      • 平均值:统计周期内监控数据的平均值。统计结果是 15 分钟内采集的所有监控数据的平均值,当这个平均值大于 80% 时,才算超过阈值。
      • 最大值:统计周期内监控数据的最大值。统计周期内采集的监控数据中,最大值超过 80%,即为超过阈值。
      • 最小值:统计周期内监控数据的最小值。统计周期内采集的监控数据中,最小值超过 80%,即为超过阈值。
      • 求和值:统计周期内监控数据的总和。对统计周期内采集的监控数据进行求和,求和后的结果超过 80% 即为超过阈值。流量类指标需要用到此类统计方法。
    • 连续几次超过阈值后报警:指连续几个统计周期监控项的值持续超过阈值后触发报警。

      例如:设置 CPU 使用率超过 80% 报警,统计周期为 5 分钟,连续 3 次超过阈值后报警,则第一次探测 CPU 使用率超过 80% 时,不会发出报警通知。5 分钟后第二次探测 CPU 使用率超过 80%,也不会发出报警。第三次探测仍然超过 80% 时,才会发出报警通知。即从实际数据第一次超过阈值到最终发出报警规则,最少需要消耗的时间为统计周期×(连续探测次数-1)=5×(3-1)=10分钟。

  • 设置报警规则
    1. 登录云监控控制台
    2. 单击左侧导航栏中云服务监控下的云数据库 RDS,进入云数据库RDS监控列表页面。
    3. 单击实例列表操作中的报警规则,进入实例的报警规则页面。
    4. 单击报警规则页面右上角的新建报警规则,根据参数创建一条报警规则。