网络智能服务具备丰富的云网络诊断库,覆盖稳定性、安全、性能、成本优化和卓越运营等检查项。通过网络巡检提供云网络架构可观测服务,帮助您精准发现异常并获取优化建议。
使用场景
在您搭建和维护大型网络组网和资源时,由于短时间对云产品的了解有限,可能导致存在与最佳实践有偏差的网络配置场景,后续通过不断的完善配置,将会有大量的网络资源实例,但由于人力难以支撑对网络资源的配置和使用进行校验和检查,可以通过网络巡检能力对整体网络架构和资源进行排查梳理,并为您提供网络优化建议。
巡检项
巡检资源类型 | 巡检类别 | 巡检项 | 巡检说明 | 风险说明 | 风险等级 | 优化建议 |
EIP | 网络稳定性 | EIP带宽水位检查 | 检查在巡检周期间EIP带宽水位的使用情况,统计带宽利用率过高,或带宽超限丢包的发生频次,帮助评估目前资源带宽是否满足业务发展诉求,识别因带宽不足导致业务受损的网络风险。 | 最近一次巡检间隔周期内,触发过公网带宽即将超限风险预警。 | 中 | |
在最近一次巡检间隔周期内,触发过公网带宽超限丢包告警。 | 高 | |||||
EIP运行状态检查 | 检查弹性EIP是否存在运行异常的资源。 | EIP处于禁用或未激活状态。 | 低 | EIP处于禁用或未激活状态,请检查EIP实例是否处于中间态等其他异常状态。 | ||
网络成本优化 | 闲置EIP检查 | 检查弹性EIP是否存在闲置资源。 | EIP未绑定实例。 | 低 | EIP未绑定实例,但仍需进行付费,建议根据业务诉求分析是否需进行EIP实例释放,以节约费用。 | |
NAT | 网络稳定性 | NAT处理水位检查 | 检查在巡检周期间NAT网关的处理水位情况,包括识别并发连接数、新建连接数、流量处理速率和SNAT源端口超负载使用情况,帮助评估目前资源配置是否满足业务发展诉求,识别因资源水位不足导致业务受损的网络风险。 | 在最近一次巡检间隔周期内,触发过NAT会话超限丢弃连接。 | 中 | 请提升NAT网关实例规格,或将NAT网关实例变更为按量计费模式。更多信息,请参见: |
在最近一次巡检间隔周期内,触发过NAT新建会话超限丢弃告警。 | 高 | 请重新分配流经NAT网关实例的流量,或将NAT网关实例变更为按量计费模式以提升流量处理能力。更多信息,请参见: | ||||
在最近一次巡检间隔周期内,触发过SNAT源端口分配失败告警。 | 高 | 请增加SNAT规则的地址池EIP数量。更多信息,请参见创建和管理公网NAT网关实例。 | ||||
CEN | 网络稳定性 | 跨地域带宽水位检查 | 检查在巡检周期间云企业网跨地域带宽水位的使用情况,统计带宽利用率过高或带宽超限丢包的发生频次,帮助评估目前资源带宽是否满足业务发展诉求,识别因带宽不足导致业务受损的网络风险。 | 在最近一次巡检间隔周期内,触发过跨地域连接带宽超限丢包告警。 | 高 | 建议您提升跨地域连接带宽。 |
跨地域连接的流量调度队列限速丢弃。 | 高 | |||||
TR连接高可用性检查 | 检查网络实例接入TR高可用性不足导致故障发生时业务不可用的潜在风险,为了确保网络的高可用性,网络实例被连接至转发路由器TR后,组网最佳实践推荐业务确保转发路由器下配置有冗余链路。 | 检测到VPC连接TR时只使用了单可用区下的资源,当该可用区故障后,无法切换到其他可用区,可能造成您的业务故障。 | 高 | 为了确保网络的高可用性,VPC连接至转发路由器后,需确保转发路由器下配置有冗余链路,创建VPC连接时建议在企业版转发路由器支持的每个可用区中均指定一个交换机实例,以实现VPC连接可用区级别的容灾并减少流量绕行。 | ||
TR配置路由风险检查 | 检查当前TR路由的相关配置是否存在风险,并提供配置优化建议。 | 基础版TR路由表路由条目数量已达到最大配额的80%,超出后新增路由将无法加载到TR路由表中,可能导致网络不通。 | 中 | 建议升级至企业版转发路由器。相对于基础版转发路由器,企业版转发路由器默认提供10000条路由条目额度,并提供自定义路由表、流日志等丰富的功能特性。 | ||
VPC接入TR路由风险检查 | 检查VPC接入TR是否存在路由访问冲突与风险,提供配置优化建议。 | 接入同一个CEN的VPC间存在私网网段重叠,可能造成CEN中的路由冲突。 | 中 | 建议您合理规划VPC网段,使加入到同一个CEN的VPC及交换机使用不重叠的网段。 | ||
VPC连接带宽水位检查 | 检查在巡检周期间云企业网VPC连接带宽水位的使用情况,统计带宽超限丢包的发生频次,帮助评估目前资源带宽是否满足业务发展诉求,识别因带宽不足导致业务受损的网络风险。 | 在最近一次巡检间隔周期里,触发过VPC连接带宽超限丢包告警。 | 高 | 建议为VPC连接开启流日志功能,通过流日志分析业务流量占比是否符合预期。 | ||
VPN | 网络稳定性 | VPN水位限制检查 | 检查在巡检周期间VPN服务水位情况,统计带宽超限风险和BGP动态路由传播超限的发生频次,帮助评估目前VPN服务健康度,识别因资源配置不足导致业务受损的网络风险。 | 在最近一次巡检间隔周期内,触发过BGP动态路由数量超限风险告警。 | 高 | 建议关注,若出现超规格情况建议您根据实际网络规划在对端VPN设备上进行网段聚合。 |
在最近一次巡检间隔周期内,触发过VPN带宽超限风险告警。 | 中 | 请关注这条链路上的实例带宽是否符合实际业务要求,建议升配VPN带宽规格或新购实例扩大VPN的带宽;若无异常可忽略此告警。 | ||||
VPN冗余检查 | 检查VPN冗余配置。 | VPN双隧道中存在一条未协商成功的隧道,导致AZ高可用能力失效。 | 高 | 建议您将该实例的所有隧道都和对端建立IPsec-VPN连接以恢复AZ级高可用能力。具体操作,请参见创建和管理IPsec连接(双隧道模式)。 | ||
VPN实例仍然是单可用区形态,不具备多可用区容灾能力,存在重大隐患。 | 高 | 请为VPN实例开启AZ高可用,并同时启用双隧道。 | ||||
ALB | 网络稳定性 | ALB虚拟IP处理水位检查 | 检查在巡检周期间ALB虚拟IP的负载情况,包括识别会话、连接、QPS和带宽的负载情况,帮助评估目前资源配置是否满足业务发展诉求,识别因资源负载不足导致业务受损的网络风险。 | 在最近一次巡检间隔周期内,触发过ALB会话超限导致新建连接丢失告警。 | 高 | ALB域名解析的单一VIP有新建连接数限额,建议通过CNAME域名解析的方式使用ALB。具体操作,请参见为ALB添加CNAME记录。 |
在最近一次巡检间隔周期内,触发过ALB QPS超限告警。 | 高 | ALB域名解析的单一VIP有QPS限额,建议通过CNAME域名解析的方式使用ALB。具体操作,请参见为ALB添加CNAME记录。 | ||||
在最近一次巡检间隔周期内,触发过ALB私网带宽超限丢包告警。 | 高 | ALB域名解析的单一VIP有带宽限额,建议通过CNAME域名解析的方式使用ALB。具体操作,请参见为ALB添加CNAME记录。 | ||||
ALB高可用部署检查 | 检查ALB监听下的后端服务器是否为多可用区部署,以保障监听服务高可用运行。 | ALB监听的多个后端服务器仅部署在单一可用区(针对默认转发服务器组)。 | 中 | 当前ALB监听部署架构存在AZ级风险,若发生AZ级故障,服务将不可用,建议将监听及转发规则的后端服务器分散部署在两个可用区及以上,减少故障爆发半径;若涉及服务器跨可用区迁移,请参见迁移指引。 | ||
NLB | 网络稳定性 | NLB虚拟IP处理水位检查 | 检查在巡检周期间NLB虚拟IP的负载情况,包括识别新建连接和并发连接的负载情况,帮助评估目前资源配置是否满足业务发展诉求,识别因资源负载不足导致业务受损的网络风险。 | 在最近一次巡检间隔周期内,触发过NLB失败连接数骤增告警。 | 高 | 出现该现象的可能原因:
|
在最近一次巡检间隔周期内,触发过NLB新建连接丢弃告警。 | 高 | 出现该现象的可能原因:
| ||||
在最近一次巡检间隔周期内,触发过NLB新建连接超限告警。 | 高 | 超出NLB单VIP自动弹性上限,连续出现新建连接请求丢弃现象,建议拆分多个NLB实例或联系客户经理单独报备。 | ||||
在最近一次巡检间隔周期内,触发过NLB并发连接超限告警。 | 高 | 超出NLB单VIP自动弹性上限,连续出现新建连接请求丢弃现象,建议拆分多个NLB实例或联系客户经理单独报备。 | ||||
NLB高可用部署检查 | 检查NLB监听下的后端服务器是否为多可用区部署,以保障监听服务高可用运行。 | NLB监听的多个后端服务器仅部署在单一可用区。 | 中 | 当前NLB监听部署架构存在AZ级风险,若发生AZ级故障,服务将不可用,建议将监听的后端服务器分散部署在两个可用区及以上,减少故障爆发半径;若您选择进行服务器跨可用区迁移,请参见迁移指引。 | ||
CLB | 网络稳定性 | CLB处理水位检查 | 检查在巡检周期间CLB的负载情况,包括识别会话、连接和带宽的负载情况,帮助评估目前资源配置是否满足业务发展诉求,识别因资源负载不足导致业务受损的网络风险。 | 在最近一次巡检间隔周期内,触发过CLB带宽超限丢包告警。 | 高 | 建议升配CLB实例带宽。具体操作,请参见按量付费CLB实例变配或包年包月CLB实例变配。 |
在最近一次巡检间隔周期内,触发过CLB会话超限新建连接丢失告警。 | 高 | 建议升配CLB实例或将CLB实例迁移为ALB实例或NLB实例。具体操作,请参见: | ||||
在最近一次巡检间隔周期内,触发过CLB连接失败数骤增告警。 | 高 | 出现该现象的常见原因为后端服务器规格超限、负载过高或业务异常等,建议您检查后端业务状态。 | ||||
VBR | 网络稳定性 | BGP连接状态检查 | 检查在巡检周期间专线BGP连接的运行状态,统计专线端口异常的发生频次,帮助观测运营商专线链路的质量,及时发现稳定性风险。 | 在最近一次巡检间隔周期内,触发过BGP连接故障。 | 高 | 联系线路提供运营商检查物理专线是否有异常。 |
物理专线端口检查 | 检查在巡检周期间物理专线端口的运行状态,统计BGP连接异常的发生频次,帮助观测运营商专线链路的质量,及时发现稳定性风险。 | 在最近一次巡检间隔周期内,触发过专线端口或链路故障告警。 | 高 | 联系线路提供运营商检查物理专线是否有异常。 | ||
VBR静态路由健康配置检查 | 检查VBR连接是否配置了健康检查。 | CEN上配置了静态路由指向VBR,但是没有在CEN上配置相应的健康检查。 | 高 | 将VBR连接至CEN后,您可以通过CEN的健康检查功能探测VBR关联的物理专线的连通性。在CEN和本地数据中心存在冗余路由的场景下,健康检查探测到物理专线故障后支持自动切换到可用路由,保障流量传输不中断。 | ||
VBR上联没有配置健康检查。 | 高 | 本地数据中心通过冗余专线连接到VPC时,建议您在本地数据中心侧和阿里云侧分别配置健康检查来检测物理专线的连通性。当其中一条物理专线检测出故障时,可以顺利切换到另一条物理专线。 | ||||
VBR冗余缺失检查 | 检查VBR冗余配置的完整性,识别专线场景稳定性风险。 | VPC到VBR完全未配置冗余线路。 | 低 | VPC到VBR完全未配置冗余线路,您可以根据业务诉求进行线路冗余方案选型,请参见通过VBR上连实现本地IDC连接上云。 | ||
VPC到VBR部分网段未配置冗余线路。 | 低 | 请确认未配置冗余的路由网段是否存在业务流量;若存在,建议配置冗余线路。您可以根据业务诉求进行线路冗余方案选型,请参见通过VBR上连实现本地IDC连接上云。 | ||||
TR到VBR部分网段未配置冗余线路 | 低 | 请确认未配置冗余的路由网段是否存在业务流量;若存在,建议配置冗余线路。您可以根据业务诉求进行线路冗余方案选型,请参见通过云企业网实现本地IDC连接上云。 | ||||
TR到VBR完全未配置冗余线路。 | 低 | TR到VBR完全未配置冗余线路,您可以根据业务诉求进行线路冗余方案选型,请参见通过云企业网实现本地IDC连接上云。 |
关闭网络巡检任务
暂不支持创建自定义网络巡检任务,网络智能服务默认为您开启免费的网络基础巡检任务,每周进行一次全面网络巡检,提供巡检报告。
支持您关闭巡检任务。
登录网络智能服务管理控制台。
在左侧导航栏选择网络巡检。
在网络巡检页面,找到默认网络巡检任务,在操作列单击关闭巡检。
在弹出的对话框中单击确定。
查看网络巡检报告
网络巡检报告保存时间长度为1年。
登录网络智能服务管理控制台。
在左侧导航栏选择网络巡检。
在网络巡检页面,找到默认网络巡检任务可进行以下操作。
查看最新一次巡检报告详情
在最新一次巡检报告列单击查看详细报告获取网络优化建议。
在巡检报告详情页面,您可以查看巡检报告的基本信息、巡检总结和巡检详情。
在巡检详情页面,可以查看异常结果、优化建议以及受影响的资源。
查看历史报告详情
在最新一次巡检报告列单击查看历史报告。
在历史报告页面历史巡检报告区域,找到目标巡检报告,然后单击巡检报告ID或在操作列单击查看报告。
在巡检报告详情页面,您可以查看巡检报告的基本信息、巡检总结和巡检详情。
在巡检详情页面,可以查看异常结果、优化建议以及受影响的资源。