举例说明如何监控本地服务进程可用性,当出现响应超时或状态码错误时,发送报警通知。

说明
  • 使用该功能依赖云监控插件,使用该功能需要确保机器已安装云监控插件。
  • 可用性探测频率为每分钟1次。
  • 使用该功能前请先创建应用分组

操作步骤

  1. 登录云监控控制台
  2. 点击左侧导航栏中的应用分组,进入应用分组页面。
  3. 选择需要创建本地服务可用性监控的应用分组,点击应用分组名称,进入应用分组详情页面。
  4. 点击左侧导航栏中的可用性监控,进入可用性监控页面。
  5. 点击页面右上角的新建配置按钮,进入创建可用性监控页面。

    监控配置区域:

    • 探测源:即探测的发起方,本地服务可用性探测源和探测目标都是机器本身。
    • 探测类型:选择URL或者IP
    • 探测目标HTTP(S)填写格式为localhost:port/pathTELNET填写格式为127.0.0.1:port。比如要探测tomcat是否响应正常,选择HTTP(S)后填写localhost:8080/monitor;要探测mysql的连通性,选择TELNET后填写127.0.0.1:3306

    报警配置区域:

    报警支持状态码响应时间两种配置,任何一种配置达到阈值后都会触发报警。报警会发送给应用分组的联系人组。本地可用性监控配置状态码大于400即可。

    • 状态码:探测的状态码满足报警设置时就触发报警。
    • 通知方式:报警通知的发送渠道。
    • 高级配置
      • 通道沉默时间:报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。
      • 生效时间:报警规则的生效时间,只会在生效时间内检查监控数据是否需要报警。可根据实际情况自行配置。
  6. 完成以上配置并保存,就完成一个本地服务可用性监控的创建。当您的服务无响应时会发出短信、邮件等报警通知,列表中会显示发生报警的实例数量,点击异常数量可以查看异常实例详情。
  7. 点击探测异常机器数,显示异常机器详情。