举例说明如何监控本地服务进程可用性,当出现响应超时或状态码错误时,发送报警通知。

说明
  • 使用该功能依赖云监控插件,使用该功能需要确保机器已安装云监控插件。
  • 可用性探测频率为每分钟1次。
  • 使用该功能前请先创建应用分组

操作步骤

  1. 登录云监控控制台,选择页面左侧菜单的应用分组,进入应用分组页面
  2. 选择需要创建本地服务可用性监控的应用分组,点击应用分组名称,进入应用分组详情页面。
  3. 选择页面左侧菜单的可用性监控,进入可用性监控页面。
  4. 点击页面右上角的新建配置按钮,进入编辑页面。
  5. 探测源:即探测的发起方,本地服务可用性探测源和探测目标都是机器本身。
  6. 探测类型:选择URLIP
  7. 探测目标HTTP协议填写格式为localhost:port/pathTelnet协议填写格式为127.0.0.1:port。比如要探测mysql的连通性,选择Telnet后填写127.0.0.1:3306;探测tomcat是否响应正常,选择HTTP后填写localhost:8080/monitor
  8. 报警配置:可配置状态码响应时间。何两种配置达到阈值后都会触发报警,报警会发送给应用分组的联系人组。本地可用性监控配置状态码大于400即可。
    • 状态码:探测的状态码满足报警设置时就触发报警。
    • 通知方式:报警通知的发送渠道。
    • 高级配置
      • 通道沉默时间:报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。
      • 生效时间:报警规则的生效时间,只会在生效时间内检查监控数据是否需要报警。可根据实际情况自行配置。


  9. 完成以上配置并保存,就完成一个本地服务可用性监控的创建。当您的服务无响应时会发出短信、邮件等报警通知,列表中会显示发生报警的实例数量,点击异常数量可以查看异常实例详情。

  10. 点击探测异常机器数,显示异常机器详情。