您可以使用阿里云云监控服务来监控包年包月公网NAT网关。云监控可以从包年包月公网NAT网关中监控并收集实时指标,并在包年包月公网NAT网关控制台生成可视化的时序曲线图。您可以根据各监控指标来排查问题。
查看NAT网关监控
- 登录NAT网关管理控制台。
- 在顶部菜单栏,选择包年包月公网NAT网关的地域。
- 在公网NAT网关页面,找到目标包年包月公网NAT网关,然后在监控列单击图标查看监控。
系统默认展示最近1小时内的监控数据。您可以在监控图表上方选择查看1小时内、3小时内、6小时内、12小时内的监控数据,也可以查看自定义时间段内的监控数据。
具体监控指标如下表所示。监控指标分类 监控项 说明 Session统计 并发连接数(count) NAT网关可同时容纳的TCP和UDP连接数量。 端口分配失败丢失数(count) NAT网关访问目的地址并发连接数过高时分配TCP或UDP端口失败的次数。 说明- 单个弹性公网IP(Elastic IP Address,简称EIP)可提供SNAT分配的端口数量有限。当用户访问同一个目的地址的会话数量过多而配置的SNAT规则使用的EIP数量过少时,会造成端口分配失败。
- 当端口分配失败丢弃计数持续增长时,建议您增加SNAT规则中配置的EIP数量。更多信息,请参考创建SNAT IP地址池。
并发丢弃连接速率(countS) NAT网关连接数超过并发连接数限制,而导致连接被丢弃的速率。 新建连接速率(countS) NAT网关每秒可新建的TCP和UDP连接数。 新建丢弃连接速率(countS) NAT网关每秒新建连接数超过每秒最大新建数连接限制,而导致新建连接数被丢弃。 并发连接水位(%) 已消耗连接数占总连接数的百分比。 新建连接水位(%) 已消耗的新建连接数占总新建连接数的百分比。 入方向流量统计 入方向流量速率(bps) 入方向每秒接受的流量,包括: - 从公网来流量速率:公网每秒发送到NAT网关的流量。
- 入VPC流量速率:NAT网关每秒到VPC的流量。
入方向流量(bytes) 入方向所消耗的流量,包括: - 从公网来流量:公网发送到NAT网关的流量。
- 入VPC流量:NAT网关发送到VPC的流量。
入方向包速率(countS) 入方向每秒接受的数据包数量,包括: - 从公网来包速率:公网每秒发送到NAT网关的包数量。
- 入VPC包速率:NAT网关每秒发送到VPC的包数量。
入方向包量(count) 入方向所消耗的数据包数量,包括: - 从公网来包量:公网发送到NAT网关的包数量。
- 入VPC包量:NAT网关发送到VPC的包数量。
出方向流量统计 出方向流量速率(bps) 出方向每秒接受的流量,包括: - 入公网流量速率:NAT网关每秒发送到公网的流量。
- 从VPC来流量速率:VPC每秒发送到NAT网关的流量。
出方向流量(bytes) 出方向所消耗的流量,包括: - 入公网流量:NAT网关发送到公网的流量。
- 从VPC来流量:VPC发送到NAT网关的流量。
出方向包速率(countS) 出方向每秒接受的数据包数量,包括: - 入公网包速率:NAT网关每秒发送到公网的包数量。
- 从VPC来包速率:VPC每秒发送到NAT网关的包数量。
出方向包量(count) 出方向所消耗的数据包数量,包括: - 入公网包量:NAT网关发送到公网的包数量。
- 从VPC来包量:VPC发送到NAT网关的包数量。
查看网关流量监控
异常的ECS实例流量会影响其他ECS实例的SNAT公网访问。开启网关流量监控功能,您可以查看SNAT转发流量监控数据,快速定位流量消耗最大的ECS实例,然后您可以对该ECS实例进行流量管控,实现快速定位并解决故障,提高业务的稳定性。查看网关流量监控前,请确保满足以下条件:
- 您已经登录NAT网关管理控制台创建了包年包月的公网NAT网关实例。
- 您已经开通了网络智能服务的权限,请在网络智能服务开通页面开通权限。
- 登录NAT网关管理控制台。
- 在顶部菜单栏,选择包年包月公网NAT网关实例的地域。
- 在公网NAT网关页面,找到目标包年包月公网NAT网关,然后在操作列单击管理。
- 在目标公网NAT网关详情页面,单击监控页签。
- 单击网关流量情况页签,您可以通过设置查询时间或者输入云服务器ECS的IP地址进行筛选查看网关流量监控数据。
- 在时间栏中设置要查看流量监控数据的时间,时间为分钟级。例如,您设置要查看的时间2023年03月29日15:30,则您可以查看2023年03月29日15:30:00~2023年03月29日15:31:00的流量监控数据。说明
- 开启网关流量监控后,您需要等待15分钟,才能查看网关流量监控数据。
- 网关流量监控功能展示的监控数据可能存在3~5分钟的延迟。例如,您只能在2023年03月29日15:30查看2023年03月29日15:25时间点之前的流量监控数据,而不能查看2023年03月29日15:25时间点之后的流量监控数据。
- 网关流量监控功能可以展示流量消耗最大的前100个ECS实例的流量信息。
- 输入云服务器ECS的IP地址进行筛选查看流量监控数据。
监控数据 单位 说明 入方向流量 Kbps 从公网进入ECS实例的流量。 出方向流量 Kbps 从ECS实例发往公网的流量。 入方向包速率 个/秒 从公网每秒进入ECS实例的包数量。 出方向包速率 个/秒 从ECS实例每秒发往公网的包数量。 并发连接数 个 ECS实例通过NAT网关访问公网的活跃连接数量。 新建连接数 个/秒 ECS实例通过NAT网关每秒发起的新建连接数量。 - 在时间栏中设置要查看流量监控数据的时间,时间为分钟级。例如,您设置要查看的时间2023年03月29日15:30,则您可以查看2023年03月29日15:30:00~2023年03月29日15:31:00的流量监控数据。
查看包年包月公网NAT网关绑定的弹性公网IP监控
- 登录NAT网关管理控制台。
- 在顶部菜单栏,选择包年包月公网NAT网关的地域。
- 在公网NAT网关页面,找到目标包年包月公网NAT网关,然后在操作列单击管理。
- 在目标公网NAT网关详情页面,单击监控页签,然后单击NAT绑定的弹性公网IP监控页签,查看监控指标。
系统默认展示最近1小时内的监控数据。您可以在监控图表上方选择查看1小时内、3小时内、6小时内、12小时内的监控数据,也可以查看自定义时间段内的监控数据。
监控项 说明 流入带宽 从公网进入ECS实例的带宽,单位:bps。 流出带宽 从ECS实例发往公网的带宽,单位:bps。 流入包速率 每秒从公网进入ECS实例的包数量,单位:pps。 流出包速率 每秒从ECS实例发往公网的包数量,单位:pps。 出方向限速丢包速率 限制每秒丢包的数量,单位:pps。 网络流入带宽利用率 从公网进入ECS实例的带宽的利用率。 网络流出带宽利用率 从ECS实例发往公网的带宽的利用率。
创建阈值报警规则
如果您需要监控包年包月公网NAT网关实例的使用和运行情况,您可以通过创建阈值报警规则,实时监控包年包月公网NAT网关实例运行情况,保证业务的稳定。
- 登录云监控控制台。
- 在左侧导航栏,选择 。
- 在报警规则页面,单击创建报警规则。
- 在创建报警规则面板,设置报警规则相关信息,然后单击确认。本文仅列举与NAT网关强相关的配置项。关于其余配置项,请参见创建报警规则。
参数 说明 产品 云监控可管理的产品名称。本文选择增强型NAT网关。 资源范围 报警规则作用的资源范围。取值: - 全部资源:报警规则作用于指定云产品的全部资源上,对于新加入的资源生效。
- 应用分组:报警规则作用于指定云产品的指定应用分组内的全部资源上,对于新加入的资源生效。
- 实例:报警规则作用于指定云产品的指定资源上。
规则描述 报警规则的主体。当监控数据满足报警条件时,触发报警规则。规则描述的设置方法如下: - 单击添加规则。
- 在添加规则描述面板,设置规则名称、监控指标类型、监控指标、阈值、报警级别和报警方式等。
- 单击确定。
说明 关于如何设置复杂的报警条件,请参见报警规则表达式说明。通道沉默周期 报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。 某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。
例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。
生效时间 报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。 报警联系人组 发送报警的联系人组。 应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。
关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系组。
标签 报警规则的标签。包括标签名称和标签值。 高级设置:展开高级设置配置其他参数。
相关文档
云监控侧:
- PutResourceMetricRule:为单个资源的监控项设置阈值报警规则。
- CreateMetricRuleResources:创建一个报警规则关联的资源。