云监控通过监控 Sever Load Balancer 的流入流量、流出流量等 7 个监控项,为用户展示 Sever Load Balancer 的运行状态,帮助用户监测实例的运行状态,并支持用户对监控项设置报警规则。用户创建 Sever Load Balancer 实例后云监控会自动对上述监控项收集数据。

监控服务

  • 监控项说明
    • 4层协议监控项
      监控项 含义 维度 单位 最小监控粒度
      端口流入流量 从外部访问 Sever Load Balancer 指定端口所需要消耗的流量 端口 bit/s 1分钟
      端口流出流量 Sever Load Balancer 指定端口访问外部所需要消耗的流量 端口 bit/s 1分钟
      端口流入数据包数 Sever Load Balancer 指定端口每秒接到的请求数据包数量 端口 Count/Second 1分钟
      端口流出数据包数 Sever Load Balancer 指定端口每秒发出的数据包数量 端口 Count/Second 1分钟
      端口新建连接数 统计周期内平均每秒 TCP 三次握手的第一次 SYN_SENT 状态的数量 端口 Count 1分钟
      端口活跃连接数 当时所有ESTABLISHED状态的连接 端口 Count 1分钟
      端口非活跃连接数 指除ESTABLISHED状态的其他所有状态的当时tcp连接数 端口 Count 1分钟
      端口并发连接数 端口当时连接数总量(活跃连接数和非活跃连接数之和) 端口 Count 1分钟
      后端健康ECS实例个数 健康检查正常实例数 端口 Count 1分钟
      后端异常ECS实例个数 健康检查异常实例数 端口 Count 1分钟
      端口丢弃连接数 端口平均每秒丢弃的连接数 端口 Count/Second 1分钟
      端口丢弃流入数据包数 端口平均每秒丢失的流入包数 端口 Count/Second 1分钟
      端口丢弃流出数据包数 端口平均每秒丢失的流出包数 端口 Count/Second 1分钟
      端口丢弃流入流量 端口平均每秒丢失的入流量 端口 bit/s 1分钟
      端口丢失流出流量 端口平均每秒丢失的出流量 端口 bit/s 1分钟
      实例活跃连接数 实例当时所有 ESTABLISHED 状态的连接 实例 Count/Second 1分钟
      实例非活跃连接数 实例当时除 ESTABLISHED 状态的其他所有状态tcp连接数 实例 Count/Second 1分钟
      实例丢弃连接数 实例每秒丢弃的连接数 实例 Count/Second 1分钟
      实例丢弃流入数据包数 实例每秒丢弃的流入数据包数量 实例 Count/Second 1分钟
      实例丢弃流出数据包数 实例每秒丢弃的流出数据包数量 实例 Count/Second 1分钟
      实例丢弃流入流量 实例每秒丢弃的流入流量 实例 bit/s 1分钟
      实例丢弃流出流量 实例每秒丢弃的流出流量 实例 bit/s 1分钟
      实例最大并发连接数 实例当时连接数总量(活跃连接数和非活跃连接数之和) 实例 Count/Second 1分钟
      实例新建连接数 实例统计周期内平均每秒TCP三次握手的第一次SYN_SENT状态的数量 实例 Count/Second 1分钟
      实例流入数据包数 实例每秒接到的请求数据包数量 实例 Count/Second 1分钟
      实例流出数据包数 实例平均每秒发出的数据包数量 实例 Count/Second 1分钟
      实例流入流量 从外部访问 Sever Load Balancer 实例所需要消耗的流量 实例 bit/s 1分钟
      实例流出流量 Sever Load Balancer 实例访问外部所需要消耗的流量 实例 bit/s 1分钟
    • 七层协议监控项
      监控项 含义 维度 单位 最小监控粒度
      端口QPS 监听维度的QPS 端口 Count/Second 1分钟
      端口RT 端口维度的请求平均延时 端口 ms 1分钟
      端口2xx 状态码个数 端口维度的slb返回给client的2xx状态码统计 端口 Count/Second 1分钟
      端口3xx 状态码个数 端口维度的slb返回给client的3xx状态码统计 端口 Count/Second 1分钟
      端口4xx 状态码个数 端口维度的slb返回给client的4xx状态码统计 端口 Count/Second 1分钟
      端口5xx 状态码个数 端口维度的slb返回给client的5xx状态码统计 端口 Count/Second 1分钟
      端口其他状态码个数 端口维度的slb返回给client的other状态码统计 端口 Count/Second 1分钟
      端口Upstream 4xx 状态码个数 端口维度的rs返回给slb的4xx状态码统计 端口 Count/Second 1分钟
      端口Upstream 5xx 状态码个数 端口维度的rs返回给client的5xx状态码统计 端口 Count/Second 1分钟
      端口UpstreamRT 端口维度的rs发给proxy的平均请求延迟 端口 ms 1分钟
      实例QPS 实例维度的QPS 实例 Count/Second 1分钟
      实例Rt 实例维度的请求平均延时 实例 Count/Second 1分钟
      实例2xx 状态码个数 实例维度的slb返回给client的2xx状态码统计 实例 Count/Second 1分钟
      实例3xx 状态码个数 实例维度的slb返回给client的3xx状态码统计 实例 Count/Second 1分钟
      实例4xx 状态码个数 实例维度的slb返回给client4xx状态码统计 实例 Count/Second 1分钟
      实例5xx 状态码个数 实例维度的slb返回给client的5xx状态码统计 实例 Count/Second 1分钟
      实例其他 状态码个数 实例维度的slb返回给client的Other状态码统计 实例 Count/Second 1分钟
      实例Upstream 4XX状态码个数 实例维度的rs返回给slb的4xx状态码统计 实例 Count/Second 1分钟
      实例Upstream 5XX状态码个数 实例维度的rs返回给slb的5xx状态码统计 实例 Count/Second 1分钟
      实例Upstream RT 实例维度的rs发给proxy的平均请求延迟 实例 ms 1分钟
      说明 新建连接数、活跃连接数、非活跃连接数统计的均是客户端到 Sever Load Balancer 的 TCP 连接请求。
  • 查看监控数据
    1. 登录云监控控制台
    2. 单击左侧导航栏中云服务监控下的负载均衡,进入负载均衡监控列表页面。
    3. 单击实例名称或操作中的监控图表,进入监控图表页面。
    4. 单击大小图切换按钮,切换大图显示(可选)。

报警服务

  • 参数说明
    • 监控项:负载均衡提供的监控指标。

    • 统计周期:报警系统会按照这个周期检查您对应的监控数据是否超过了报警阈值。例如设置内存使用率报警规则的统计周期为1分钟,则每间隔1分钟会检查一次内存使用率是否超过了阈值。

    • 统计方法:统计方法指对超出阈值范围的设置。统计方法中可以设置平均值、最大值、最小值、求和值。

      • 平均值:统计周期内监控数据的平均值。统计结果是15分钟内采集的所有监控数据的平均值,当这个平均值大于80%时,才算超过阈值。
      • 最大值:统计周期内监控数据的最大值。统计周期内采集的监控数据中,最大值超过80%,即为超过阈值。
      • 最小值:统计周期内监控数据的最小值。统计周期内采集的监控数据中,最小值超过80%,即为超过阈值。
      • 求和值:统计周期内监控数据的总和。对统计周期内采集的监控数据进行求和,求和后的结果超过80%即为超过阈值。流量类指标需要用到此类统计方法。
    • 连续几次超过阈值后报警:指连续几个统计周期监控项的值持续超过阈值后触发报警。

      例如:设置 CPU 使用率超过 80% 报警,统计周期为 5 分钟,连续 3 次超过阈值后报警,则第一次探测 CPU 使用率超过 80% 时,不会发出报警通知。5 分钟后第二次探测 CPU 使 用率超过 80%,也不会发出报警。第三次探测仍然超过 80% 时,才会发出报警通知。即从实际数据第一次超过阈值到最终发出报警规则,最少需要消耗的时间为统计周期×(连续探测次数-1)=5×(3-1)=10分钟。

  • 设置报警规则
    1. 登录云监控控制台
    2. 单击左侧导航栏中云服务监控下的负载均衡,进入负载均衡监控列表页面。
    3. 单击实例列表操作中的报警规则,进入实例的报警规则页面。
    4. 单击报警规则页面右上角的新建报警规则,根据参数创建一条报警规则。