本文为您介绍如何通过创建可用性监控,快速发现本地或依赖的远程服务无响应的情况。

背景信息

为了满足广大云用户探测本地、远程指定路径或端口是否正常响应的需要,云监控的可用性监控功能可以帮助云用户快速发现本地或远程服务无响应的情况,并能够在出现响应超时或状态码错误时发送报警通知。

创建可用性监控的准备工作

创建可用性监控的实施步骤

注意事项
说明
  • 使用可用性监控功能依赖云监控插件,请确保被监控主机已安装云监控插件。
  • 监控频率为每分钟1次。
操作步骤
  1. 登录云监控控制台
  2. 单击左侧导航栏中的应用分组,进入应用分组页面。
  3. 选择需要创建可用性监控的应用分组,单击应用分组名称,进入应用分组详情页面。
  4. 单击左侧导航栏中的可用性监控,进入可用性监控页面。

  5. 单击右上角的新建配置按钮,进入创建可用性监控页面。

  6. 输入任务名称,选择探测源(可以是分组内的所有机器配置相同的探测规则,也可以只是部分机器配置相同的探测规则)。
  7. 选择探测类型和探测目标:支持URL或者IP云数据库RDS版云数据库Redis版三种探测类型。
    • 探测类型为URL或者IP时,支持HTTP(S)TELNETPING三种探测目标。当探测目标为HTTP(S)协议时,支持配置HEADGETPOST请求方法和返回值的匹配内容。
    • 探测类型为云数据库RDS版云数据库Redis版时,会显示您分组中的相关实例和访问地址。
  8. 选择报警配置,报警支持状态码和响应时间两种配置,任何一种配置达到阈值后都会触发报警。报警会发送给应用分组的联系人组。
    • 状态码:探测的状态码满足报警设置时就触发报警。
    • 响应时间:探测的响应时间满足报警设置时就触发报警。
    • 通知方式:报警通知的发送渠道。
    • 高级配置:支持通道沉默时间生效时间两种配置。
      • 通道沉默时间是指报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。
      • 生效时间是指报警规则的生效时间,报警规则只在生效时间内发送报警通知,非生效时间内产生的报警只记录报警历史。
  9. 完成以上配置后,单击确定按钮即可。