四、探测模板

创建探测模板,应用到地址上,及时感知服务地址健康状态。当探测到服务地址不可用时,借助全局流量管理的容灾切换能力,自动摘除异常节点,确保服务平稳运行。

基本概念

探测模板:对地址进行健康检查的一组预设配置。支持设置PING、TCP、HTTP、HTTPS协议类型探测模板

探测任务:将探测模板应用到一个地址则为一个探测任务。一个地址可以添加多个探测模板,一个探测模板也可被多个地址使用。

创建探测模板

  1. 访问云解析DNS-全局流量管理

  2. 单击 探测模板 > 创建探测模板,在弹框中完成各项参数配置后提交表单。

    Ping健康检查

    表单项

    说明

    模板名称

    健康检查探测模板的名称,一般为了方便配置人员区分和记忆,建议名称可以区分健康检查协议。

    探测类型

    探测节点IP地址的类型,支持IPv4IPv6两种类型。

    探测协议

    选择ping,监控IP地址的网络可达性、丢包率、延时等指标。

    ICMP发送包数量

    每次Ping监控,同时发出多少个ICMP数据包,用以计算Ping的网络丢包率。可选值为:20。

    异常时丢包率

    每次ping监控,对发出的ICMP数据包,计算丢包率。丢包率=(丢失数据包/发送的总ICMP数据包数目)* 100%,达到丢包率阈值时,触发异常报警。丢包率可选值为:10%、30%、80%、90%、100%。

    检查间隔

    设置两次健康检查的时间间隔,默认间隔1分钟,最小支持15秒(面向旗舰版实例开放)。

    超时时间

    对每次探测发出的数据包,计算返回时间,大于超时时间未返回的数据包即判断为健康检查超时。超时时间可选择值为:2秒、3秒、5秒、10秒。

    重试次数

    在执行探测时,如果连续多次监控出现异常,系统才将应用服务判断为异常,以防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。

    • 1次,即健康检查监控到一次报警,就将应用服务判断为异常。

    • 2次,即健康检查监控到两次报警,就将应用服务判断为异常。

    • 3次,即健康检查监控到三次报警,就将应用服务判断为异常。

    重要

    检查地址若存在网络不通、ICMP destination unreachable,此类情况不计入失败率,所以不产生报警。请及时修复地址的网络问题,或更换为HTTP健康检查任务。

    探测节点

    系统根据地址类型默认提供的探测节点如下:

    IPv4探测:

    • 运营商节点:长沙市电信、南京市联通、大连市移动、青岛市电信、天津市联通、大连市联通、郑州市电信、深圳市移动、西安市电信、南京市移动

    • BGP节点:青岛市、上海市、张家口市、呼和浩特市、深圳市、杭州市、北京市

    • 国际节点:马来西亚、日本、新加坡、加利福尼亚州、香港特别行政区、德国

    IPv6探测:

    • BGP节点:上海市、呼和浩特市、深圳市、北京市

    • 国际节点:香港特别行政区

    重要
    • 如果地址池的地址均为阿里云地址,且使用黑洞策略进行故障测试,探测节点请选择运营商节点。(原因:黑洞是在阿里云网络和运营商网络的互联网生效的ACL策略,但阿里云IP之间的流量基本上是在云网络内部流动,降低探测效果。)

    • BGP节点和运营商节点的差别:BGP节点会优选运营商网络线路,例如以上海市BGP节点为例,若上海移动线路故障,探测点可能会选择上海电信线路探测,除非所有线路均故障。而运营商节点表示探测节点就使用该运营商网络,没有优选机制。

    • 若您在服务端需要对访问来源做白名单策略,可以单击查看监控节点IP信息获取探测点IP地址信息。

    • 若需要探测的IP地址在海外,请选择国际节点。

    所选节点探测失败比例

    指健康检查异常的探测点占探测点总数的比例,当失败比例超过设置的阈值时,将应用服务判断为异常。可设置的失败比例阈值为:20%、50%、80%、100%。

    TCP健康检查

    表单项

    说明

    模板名称

    健康检查探测模板的名称,一般为了方便配置人员区分和记忆,建议名称可以区分健康检查协议。

    探测类型

    探测节点IP地址的类型,支持IPv4IPv6两种类型。

    探测协议

    选择tcp,对目标IP地址使用TCP协议进行探测,主要是监控IP地址的网络可达性、端口可用性、延时等指标。

    检查间隔

    设置两次健康检查的时间间隔,默认间隔1分钟,最小支持15秒(面向旗舰版实例开放)。

    超时时间

    对每次探测发出的数据包,计算返回时间,大于超时时间未返回的数据包即判断为健康检查超时。超时时间可选择值为:2秒、3秒、5秒、10秒。

    重试次数

    在执行探测时,如果连续多次监控出现异常,系统才将应用服务判断为异常,以防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。

    • 1次,即健康检查监控到一次报警,就将应用服务判断为异常。

    • 2次,即健康检查监控到两次报警,就将应用服务判断为异常。

    • 3次,即健康检查监控到三次报警,就将应用服务判断为异常。

    探测节点

    系统根据地址类型默认提供的探测节点如下:

    IPv4探测:

    • 运营商节点:长沙市电信、南京市联通、大连市移动、青岛市电信、天津市联通、大连市联通、郑州市电信、深圳市移动、西安市电信、南京市移动

    • BGP节点:青岛市、上海市、张家口市、呼和浩特市、深圳市、杭州市、北京市

    • 国际节点:马来西亚、日本、新加坡、加利福尼亚州、香港特别行政区、德国

    IPv6探测:

    • BGP节点:上海市、呼和浩特市、深圳市、北京市

    • 国际节点:香港特别行政区

    重要
    • 如果地址池的地址均为阿里云地址,且使用黑洞策略进行故障测试,探测节点请选择运营商节点。(原因:黑洞是在阿里云网络和运营商网络的互联网生效的ACL策略,但阿里云IP之间的流量基本上是在云网络内部流动,降低探测效果。)

    • BGP节点和运营商节点的差别:BGP节点会优选运营商网络线路,例如以上海市BGP节点为例,若上海移动线路故障,探测点可能会选择上海电信线路探测,除非所有线路均故障。而运营商节点表示探测节点就使用该运营商网络,没有优选机制。

    • 若您在服务端需要对访问来源做白名单策略,可以单击查看监控节点IP信息获取探测点IP地址信息。

    • 若需要探测的IP地址在海外,请选择国际节点。

    所选节点探测失败比例

    指健康检查异常的探测点占探测点总数的比例,当失败比例超过设置的阈值时,将应用服务判断为异常。可设置的失败比例阈值为:20%、50%、80%、100%。

    HTTP/HTTPS健康检查

    表单项

    说明

    模板名称

    健康检查探测模板的名称,一般为了方便配置人员区分和记忆,建议名称可以区分健康检查协议。

    探测类型

    探测节点IP地址的类型,支持IPv4IPv6两种类型。

    探测协议

    选择httphttps,对目标IP地址进行HTTP(S)监控,监控IP地址的Web服务器网络可达性、服务可用性、首包延时等指标。

    HOST设置

    执行HTTP(S)监控时,指定HTTP(S)请求头部信息中携带的Host字段,用于标识需要访问的具体HTTP网站,默认为主域名,如果目标网站的Host有特殊要求,请自行修改。

    HTTP路径

    用户HTTP(S)健康检查的URL路径配置,系统默认填写“/”。

    校验内容

    当执行HTTP(S)监控时,根据Web服务器的返回码判断Web服务器是否正常工作。当返回码大于报警阈值时,系统认为应用服务出现异常:

    • 异常码大于等于400:Bad Request,即如果HTTP(S)请求携带了错误的请求参数,Web服务器将返回大于等于400的返回码,如果校验内容设置为“异常码大于等于400”,请务必在URL路径中填写精确的URL访问路径参数。

    • 异常码大于等于500:Server Error,即如果Web服务器出现了某些异常,将返回大于等于500的异常码,系统默认使用大于等于500的异常码作为报警阈值。

    • 校验应答内容:必填项,站点监控将根据应答内容与读取到的HTTP服务器回应Body的前64k内容进行匹配,若应答报文未包含应答内容,则健康检查异常。应答内容支持中文、英文,暂不支持正则表达式。

    检查间隔

    设置两次健康检查的时间间隔,默认间隔1分钟,最小支持15秒(面向旗舰版实例开放)。

    超时时间

    对每次探测发出的数据包,计算返回时间,大于超时时间未返回的数据包即判断为健康检查超时。超时时间可选择值为:2秒、3秒、5秒、10秒。

    重试次数

    在执行探测时,如果连续多次监控出现异常,系统才将应用服务判断为异常,以防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。

    • 1次,即健康检查监控到一次报警,就将应用服务判断为异常。

    • 2次,即健康检查监控到两次报警,就将应用服务判断为异常。

    • 3次,即健康检查监控到三次报警,就将应用服务判断为异常。

    启用SNI

    SNI(Server Name Indication)是TLS协议的一个扩展,它允许客户端在发起TLS握手时指定想要连接的主机名。由于TLS握手发生在HTTP请求的任何数据被发送之前,SNI允许服务器在发送证书之前知道客户端试图访问的服务,这使得服务器可以选择正确的证书来呈现给客户端。启用后,将会支持此功能。

    跟随3XX重定向

    开启状态:监控点获取的状态码为3XX(301,302,303, 307,308)时,跟随跳转。关闭时则不跳转。

    探测节点

    系统根据地址类型默认提供的探测节点如下:

    IPv4探测:

    • 运营商节点:长沙市电信、南京市联通、大连市移动、青岛市电信、天津市联通、大连市联通、郑州市电信、深圳市移动、西安市电信、南京市移动

    • BGP节点:青岛市、上海市、张家口市、呼和浩特市、深圳市、杭州市、北京市

    • 国际节点:马来西亚、日本、新加坡、加利福尼亚州、香港特别行政区、德国

    IPv6探测:

    • BGP节点:上海市、呼和浩特市、深圳市、北京市

    • 国际节点:香港特别行政区

    重要
    • 如果地址池的地址均为阿里云地址,且使用黑洞策略进行故障测试,探测节点请选择运营商节点。(原因:黑洞是在阿里云网络和运营商网络的互联网生效的ACL策略,但阿里云IP之间的流量基本上是在云网络内部流动,降低探测效果。)

    • BGP节点和运营商节点的差别:BGP节点会优选运营商网络线路,例如以上海市BGP节点为例,若上海移动线路故障,探测点可能会选择上海电信线路探测,除非所有线路均故障。而运营商节点表示探测节点就使用该运营商网络,没有优选机制。

    • 若您在服务端需要对访问来源做白名单策略,可以单击查看监控节点IP信息获取探测点IP地址信息。

    • 若需要探测的IP地址在海外,请选择国际节点。

    所选节点探测失败比例

    指健康检查异常的探测点占探测点总数的比例,当失败比例超过设置的阈值时,将应用服务判断为异常。可设置的失败比例阈值为:20%、50%、80%、100%。

    image