VPC NAT网关监控与运维

如果您想实时监控网关性能、出入方向流量统计,您可以使用云监控服务来监控VPC NAT网关。云监控可以从VPC NAT网关中监控并收集实时指标,并在VPC NAT网关控制台生成可视化的时序曲线图,来帮助您排查问题。

查看VPC NAT网关监控

  1. 登录NAT网关管理控制台
  2. 在左侧导航栏,选择NAT网关 > VPC NAT网关
  3. 在顶部菜单栏,选择VPC NAT网关的地域。
  4. VPC NAT网关页面,找到目标VPC NAT网关,然后在监控列单击图标查看各个监控信息。

    监控指标分类

    监控项

    说明

    Session统计

    并发连接数/端口分配失败丢失数(count)

    VPC NAT网关可同时容纳的TCP和UDP连接数量。

    并发丢弃连接速率(countS)

    VPC NAT网关连接数超过并发连接数限制,而导致连接被丢弃的速率。

    新建连接速率/新建丢弃连接速率(countS)

    新建连接速率:VPC NAT网关每秒可新建的TCP和UDP连接数。

    新建丢弃连接速率:VPC NAT网关每秒新建连接数超过每秒最大新建数连接限制,而导致新建连接被丢弃。

    并发连接水位/新建连接水位(%)

    并发连接水位:已消耗连接数占总连接数的百分比。

    新建连接水位:已消耗的新建连接数占总新建连接数的百分比。

    说明

    单个NAT网关实例默认支持每秒10万新建连接数以及每分钟200万并发连接数。当业务需求触发NAT网关的弹性能力变化时,相关的调整将在大约10分钟内生效。

    入方向统计

    入方向流量速率

    入方向每秒接受的流量,包括:

    • 从VPC外部来流量速率:VPC外部每秒发送到VPC NAT网关的流量。

    • 发往VPC流量速率:VPC NAT网关每秒发送到VPC的流量。

    入方向流量(bytes)

    入方向所消耗的流量,包括:

    • 从VPC外部来流量:VPC外部发送到VPC NAT网关的流量。

    • 发往VPC流量:VPC NAT网关发送到VPC的流量。

    入方向包速率(countS)

    入方向每秒接受的数据包数量,包括:

    • 从VPC外部来包速率:VPC外部每秒发送到VPC NAT网关的包数量。

    • 发往VPC包速率:VPC NAT网关每秒发送到VPC的包数量。

    入方向包量(count)

    入方向所消耗的数据包数量,包括:

    • 从VPC外部来包量:VPC外部发送到VPC NAT网关的包数量。

    • 发往VPC包量:VPC NAT网关发送到VPC的包数量。

    出方向统计

    出方向流量速率

    出方向每秒接受的流量,包括:

    • 发往VPC外部流量速率:VPC NAT网关每秒发送到VPC外部的流量。

    • 从VPC来流量速率:VPC每秒发送到VPC NAT网关的流量。

    出方向流量(bytes)

    出方向所消耗的流量,包括:

    • 发往VPC外部流量:VPC NAT网关发送到VPC外部的流量。

    • 从VPC来流量:VPC发送到VPC NAT网关的流量。

    出方向包速率(countS)

    出方向每秒接受的数据包数量,包括:

    • 发往VPC外部包速率:VPC NAT网关每秒发送到VPC外部的包数量。

    • 从VPC来包速率:VPC每秒发送到VPC NAT网关的包数量。

    出方向包量(count)

    出方向所消耗的数据包数量,包括:

    • 发往VPC外部包量:VPC NAT网关发送到VPC外部的包数量。

    • 从VPC来包量:VPC发送到VPC NAT网关的包数量。

创建阈值报警规则

您可以在云监控控制台为VPC NAT网关设置阈值报警规则。通过对监控项报警阈值进行监控,帮您迅速得知监控数据异常并解决异常。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择报警服务 > 报警规则

  3. 报警规则页面,单击创建报警规则

  4. 创建报警规则面板,设置报警规则相关信息,然后单击确认

    本文仅列举与NAT网关强相关的配置项。关于其余配置项,请参见创建报警规则

    参数

    说明

    产品

    云监控可管理的产品名称。例如:增强型NAT网关。

    资源范围

    报警规则的作用范围。取值:

    • 全部资源:表示该规则作用在用户名下对应产品的全部实例上。例如:您设置了全部资源粒度的MongoDB CPU使用率大于80%报警,则只要用户名下有MongoDB CPU使用率大于80%,就会发送报警通知。资源范围选择全部资源时,报警的资源最多1000个,超过1000个可能会导致达到阈值不报警的问题,建议您使用应用分组按业务划分资源后再设置报警。

    • 实例:表示该规则只作用在某个具体实例上。例如:您如果设置了实例粒度的主机CPU使用率大于80%报警,则当该实例CPU使用率大于80%时,会发送报警通知。

    规则名称

    报警规则的名称。

    规则描述

    报警规则的主体,定义在监控数据满足指定条件时,触发报警规则。例如:CPU使用率5分钟平均值>=90%,持续3个周期,则报警服务5分钟检查一次数据是否满足平均值>=90%,只检测3次。

    通道沉默周期

    指报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。

    生效时间

    报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。

    报警联系人组

    发送报警的联系人组。

    高级设置

    报警回调

    填写公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。

    无数据处理方法

    无监控数据时报警的处理方式。取值:

    • 不做任何处理(默认值)

    • 发送无数据报警

    • 视为恢复

    标签

    报警规则的标签。包括标签名称和标签值。

相关文档