如果您想实时监控网关性能、出入方向流量统计,您可以使用云监控服务来监控VPC NAT网关。云监控可以从VPC NAT网关中监控并收集实时指标,并在VPC NAT网关控制台生成可视化的时序曲线图,来帮助您排查问题。
查看VPC NAT网关监控
- 登录NAT网关管理控制台。 
- 在左侧导航栏,选择。 
- 在顶部菜单栏,选择VPC NAT网关的地域。 
- 在VPC NAT网关页面,找到目标VPC NAT网关,然后在监控列单击  图标查看各个监控信息。 图标查看各个监控信息。- 监控指标分类 - 监控项 - 说明 - Session统计 - 并发连接数/端口分配失败丢失数(count) - VPC NAT网关可同时容纳的TCP和UDP连接数量。 - 并发丢弃连接速率(countS) - VPC NAT网关连接数超过并发连接数限制,而导致连接被丢弃的速率。 - 新建连接速率/新建丢弃连接速率(countS) - 新建连接速率:VPC NAT网关每秒可新建的TCP和UDP连接数。 - 新建丢弃连接速率:VPC NAT网关每秒新建连接数超过每秒最大新建数连接限制,而导致新建连接被丢弃。 - 并发连接水位/新建连接水位(%) - 并发连接水位:已消耗连接数占总连接数的百分比。 - 新建连接水位:已消耗的新建连接数占总新建连接数的百分比。 说明- 单个NAT网关实例默认支持每秒10万新建连接数以及每分钟200万并发连接数。当业务需求触发NAT网关的弹性能力变化时,相关的调整将在大约10分钟内生效。 - 入方向统计 - 入方向流量速率 - 入方向每秒接受的流量,包括: - 从VPC外部来流量速率:VPC外部每秒发送到VPC NAT网关的流量。 
- 发往VPC流量速率:VPC NAT网关每秒发送到VPC的流量。 
 - 入方向流量(bytes) - 入方向所消耗的流量,包括: - 从VPC外部来流量:VPC外部发送到VPC NAT网关的流量。 
- 发往VPC流量:VPC NAT网关发送到VPC的流量。 
 - 入方向包速率(countS) - 入方向每秒接受的数据包数量,包括: - 从VPC外部来包速率:VPC外部每秒发送到VPC NAT网关的包数量。 
- 发往VPC包速率:VPC NAT网关每秒发送到VPC的包数量。 
 - 入方向包量(count) - 入方向所消耗的数据包数量,包括: - 从VPC外部来包量:VPC外部发送到VPC NAT网关的包数量。 
- 发往VPC包量:VPC NAT网关发送到VPC的包数量。 
 - 出方向统计 - 出方向流量速率 - 出方向每秒接受的流量,包括: - 发往VPC外部流量速率:VPC NAT网关每秒发送到VPC外部的流量。 
- 从VPC来流量速率:VPC每秒发送到VPC NAT网关的流量。 
 - 出方向流量(bytes) - 出方向所消耗的流量,包括: - 发往VPC外部流量:VPC NAT网关发送到VPC外部的流量。 
- 从VPC来流量:VPC发送到VPC NAT网关的流量。 
 - 出方向包速率(countS) - 出方向每秒接受的数据包数量,包括: - 发往VPC外部包速率:VPC NAT网关每秒发送到VPC外部的包数量。 
- 从VPC来包速率:VPC每秒发送到VPC NAT网关的包数量。 
 - 出方向包量(count) - 出方向所消耗的数据包数量,包括: - 发往VPC外部包量:VPC NAT网关发送到VPC外部的包数量。 
- 从VPC来包量:VPC发送到VPC NAT网关的包数量。 
 
创建阈值报警规则
您可以在云监控控制台为VPC NAT网关设置阈值报警规则。通过对监控项报警阈值进行监控,帮您迅速得知监控数据异常并解决异常。
- 登录云监控控制台。 
- 在左侧导航栏,选择。 
- 在报警规则页面,单击创建报警规则。 
- 在创建报警规则面板,设置报警规则相关信息,然后单击确认。 - 本文仅列举与NAT网关强相关的配置项。关于其余配置项,请参见创建报警规则。 - 参数 - 说明 - 产品 - 云监控可管理的产品名称。例如:增强型NAT网关。 - 资源范围 - 报警规则的作用范围。取值: - 全部资源:表示该规则作用在用户名下对应产品的全部实例上。例如:您设置了全部资源粒度的MongoDB CPU使用率大于80%报警,则只要用户名下有MongoDB CPU使用率大于80%,就会发送报警通知。资源范围选择全部资源时,报警的资源最多1000个,超过1000个可能会导致达到阈值不报警的问题,建议您使用应用分组按业务划分资源后再设置报警。 
- 实例:表示该规则只作用在某个具体实例上。例如:您如果设置了实例粒度的主机CPU使用率大于80%报警,则当该实例CPU使用率大于80%时,会发送报警通知。 
 - 规则名称 - 报警规则的名称。 - 规则描述 - 报警规则的主体,定义在监控数据满足指定条件时,触发报警规则。例如:CPU使用率5分钟平均值>=90%,持续3个周期,则报警服务5分钟检查一次数据是否满足平均值>=90%,只检测3次。 - 通道沉默周期 - 指报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。 - 生效时间 - 报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。 - 报警联系人组 - 发送报警的联系人组。 - 高级设置 - 报警回调 - 填写公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。 - 无数据处理方法 - 无监控数据时报警的处理方式。取值: - 不做任何处理(默认值) 
- 发送无数据报警 
- 视为恢复 
 - 标签 - 报警规则的标签。包括标签名称和标签值。 
相关文档
- PutResourceMetricRule:为单个资源的监控项设置阈值报警规则。 
- CreateMetricRuleResources:创建一个报警规则关联的资源。