全部产品
存储与CDN 数据库 域名与网站(万网) 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 钉钉智能硬件
云监控

本地服务可用性监控

更新时间:2017-09-28 12:32:18

目的

当您的业务上线对外提供服务后,如何监控服务进程是否存活,有无正常响应?本教程的目的就是举例说明如何监控本地服务进程可用性,当出现响应超时或状态码错误时,发送报警通知。

实战案例

注意事项

  • 使用该功能依赖云监控插件,使用该功能需要确保机器已安装云监控插件。
  • 可用性探测频率为每分钟1次。
  • 使用该功能前请先创建应用分组

使用步骤

  • 登录云监控控制台,选择页面左侧菜单的应用分组,进入应用分组页面
  • 选择需要创建本地服务可用性监控的应用分组,点击应用分组名称,进入应用分组详情页面。
  • 选择页面左侧菜单的可用性监控,进入可用性监控页面。
  • 点击页面右上角的新建配置按钮,进入编辑页面。
  • 选择探测源:即探测的发起方,本地服务可用性探测源和探测目标都是机器本身。
  • 选择探测类型:选择URL或IP
  • 探测目标:HTTP协议填写格式为“localhost:port/path”,Telnet协议填写格式为“127.0.0.1:port”。比如要探测mysql的连通性,选择Telnet后填写“127.0.0.1:3306”,探测的tomcat是否响应正常,选择HTTP后填写“localhost:8080/monitor”
  • 选择报警配置,报警支持状态码和响应时间两种配置,任何一种配置达到阈值后都会触发报警。报警会发送给应用分组的联系人组。本地可用性监控配置状态码大于400即可。
    • 状态码报警:探测的状态码满足报警设置时就触发报警。
    • 通知方式:报警通知的发送渠道。
    • 高级配置:支持通道沉默时间和生效时间两种配置。通道沉默时间是指报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。生效时间是指报警规则的生效时间,只会在生效时间内检查监控数据是否需要报警。可根据实际情况自行配置。create

完成以上配置并保存,就完成一个本地服务可用性监控的创建。当您的服务无响应时会发出短信、邮件等报警通知,列表中会显示发生报警的机器数量,点击异常数量可以查看异常机器详情。异常列表

点击探测异常机器数,显示异常机器详情。 异常详情

本文导读目录