云监控通过提供Analytic DB的磁盘额定容量、磁盘已用容量、磁盘使用率等监控信息,帮助您获取Analytic DB服务的使用情况。在您开通Analytic DB服务后,云监控自动开始对其进行监控。您还可以对监控项设置报警规则,以便数据异常时收到报警信息。

监控服务

  • 监控项说明
    监控项 含义 维度 单位 最小监控粒度
    diskSize 磁盘额定容量 instanceId,tableSchema,workerId 兆字节 1分钟
    diskUsed 磁盘已用容量 instanceId,tableSchema,workerId 兆字节 1分钟
    diskUsedPercent 磁盘使用率 instanceId,tableSchema,workerId 百分比 1分钟
  • 查看监控数据
    1. 登录云监控控制台
    2. 单击左侧导航栏中云服务监控下的分析型数据库,进入分析数据库监控列表页面。
    3. 单击实例名称或操作中的监控图表,进入监控图表页面。
    4. (可选)单击大小图切换按钮,切换大图显示。

报警服务

  • 设置报警规则
    1. 登录云监控控制台
    2. 单击左侧导航栏中云服务监控下的分析型数据库,进入分析数据库监控列表页面。
    3. 单击实例列表操作中的报警规则,进入实例的报警规则页面。
    4. 单击右上角的创建报警规则,选择资源范围,根据参数设置报警规则,选择通知方式,单击确认即可。
  • 参数说明
    • 产品:例如云服务器ECS、RDS、OSS 等。
    • 资源范围:报警规则的作用范围,分为全部资源实例
      • 全部资源:表示该规则作用在用户名下对应产品的全部实例上。例如设置了全部资源粒度的MongoDB CPU使用率大于80%报警,则只要用户名下有MongoDB CPU使用率大于80%,就会发送报警通知。资源范围选择全部资源时,报警的资源最多1000个,超过1000个可能会导致达到阈值不报警的问题,建议您使用应用分组按业务划分资源后再设置报警。
      • 实例:表示该规则只作用在某个具体实例上。例如设置了实例粒度的主机 CPU 使用率大于80%报警,则只要这个实例 CPU使用率大于80% ,就会发送报警通知。
    • 规则名称:报警规则的名称。
    • 规则描述:报警规则的主体,定义在监控数据满足何种条件时,触发报警规则。

      报警规则举例说明:以主机监控为例,单个服务器监控指标15秒上报一个数据点,5分钟有20个数据点。

      • CPU使用率5分钟平均值>90%, 含义是CPU使用率 5分钟的20个数据点平均值大于90%。
      • CPU使用率5分钟总是>90%, 含义是CPU使用率 5分钟的20个数据点全部大于90%。
      • CPU使用率5分钟只要有一次>90%,含义是CPU使用率 5分钟的20个数据点至少有1个大于90%。
      • 公网流出流量5分钟总计>50M ,含义是公网流出流量5分钟的20个数据点求和结果大于50M。
    • 通道沉默时间:指报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。
    • 连续几次超过阈值后报警:连续几次报警的探测结果符合您设置的规则描述,才会触发报警。例如规则描述为“CPU使用率 1分钟内平均值>80%,连续3次超过阈值后报警”,则连续出现3次 CPU使用率 1分钟内平均值>80%的情况,才会触发报警。
    • 生效时间:报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。
    • 通知对象:发送报警的联系人组。
    • 报警级别
      • 电话+短信+邮件+钉钉机器人
      • 短信+邮件+钉钉机器人
      • 邮件+钉钉机器人
    • 邮件主题:默认为产品名称+监控项名称+实例ID。
    • 邮件备注:自定义报警邮件补充信息。填写邮件备注后,发送报警的邮件通知中会附带您的备注。
    • 报警回调:填写公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。