GA加速广域网设计

更新时间:

概述

本文简介

本卓越架构设计重点介绍了在跨地域、跨境等广域网场景下,用户端(Client)与服务端(Server)之间如何构建一套网络层加速解决方案,以缩短用户端访问服务端的时延,提升用户访问体验。该方案可有效解决游戏、跨境办公、跨境电商、APP出海等场景中,用户访问服务时出现的内容加载慢、内容无法加载以及卡顿等问题。

场景介绍

“加速”是一个常见的词语,在不同的业务场景下可能带来不同的效果与影响。它既可能显著提升用户体验和企业生产效率,也可能由于不合理的设计导致用户体验下降。因此,针对不同业务场景,设计正确且合理的网络加速方案至关重要。加速方案可以分多种类型:

  • 内容层面:利用CDN和DCDN等技术,通过内容分发和就近缓存的方式实现快速访问。

  • 服务端层面:通过程序优化和数据补偿等方式,增强服务端算法能力以实现加速效果。

  • 客户端层面:采用MultiPath类方案,通过WIFI、4G、5G等多路径切换调度,实现最后一公里的最优选路。

  • 客户端-服务端的中间链路层面:通过缩短链路长度,或提升链路传输质量,来实现加速效果。

    1. 缩短链路长度,最佳方法是将业务系统前置部署在尽可能靠近客户端的位置。其次,利用CDN技术进行内容分发,将常用的静态内容缓存在各个分支节点,以便用户可就近访问。

    2. 提升链路传输质量,则是通过网络技术的加持,将访问调度到时延更短、稳定性更高的传输链路上,使客户端的请求可以更高效地到达服务端。(本文重点介绍该场景下的方案设计)

推荐使用全球加速GA(Global Accelerator)产品作为网络加速方案的核心。同时,可根据业务场景,按需搭配DDoS、WAF、CDN、DNS等产品,以实现整体方案的落地。

image

GA作为整体方案的核心,承担了用户侧就近吸流,加速线路上智能调度,以及服务端稳定连接的重要角色。GA支持4层(TCP/UDP)业务和7层(HTTP/HTTPS)业务,并且无论服务源站是否部署在阿里云上,均可以通过GA快速实现网络加速。

image

常见问题

  • GA加速本质:用户通过公网访问服务时,存在众多不确定因素。使用GA可将用户访问请求接入阿里云内网,以提升中间链路的可靠性,增强访问的稳定性,并降低访问时延。

  • 服务端是否需要修改:服务端程序无需任何修改,配置GA终端节点组时只需要填入源站对外提供服务的公网IP或者公网域名即可;如果源站部署在阿里云上,可以直接选择对应云上资源。

  • 如何就近吸流: GA会为每个加速地域自动分配本地的BGP IP,每个GA实例会自动生成一个CNAME域名。通过修改DNS系统中的A记录或者CNAME记录快速实现流量切换。

  • 如何智能调度:GA内部具备一套调度系统,只需配置业务协议和端口,GA即可自动调度最优路径,将流量传送至终端节点组。GA提供智能路由和自定义路由两种调度方式,以满足不同业务场景的需求。

相应的产品说明可参考:什么是全球加速

设计原则

作为网络加速方案,其核心在于提升访问速度。因此,在方案设计过程中应全面考虑各项因素,避免因解决当前问题而引入新的问题。本方案的设计重点关注加速方案的稳定性、安全性、性能以及可观测性,以确保所设计的方案能够简单且高效地实施。

设计关键点

稳定性

在实施GA加速方案时,大多数稳定性设计已被GA产品考虑在内。设计人员需关注的重点是多产品联动时的稳定性。

GA产品自身具备端到端的高可靠性能力:

  • 在创建一个加速地域后,控制台上仅显示两个公网IP,然而其底层实际上是一个集群,并且这些公网IP也采用BGP类型。

  • 加速地域与终端节点组之间通过阿里云内网进行连接,路径多样化,GA产品能够自动选择最优路径。

  • 终端节点组同样采用集群形态,以确保转发的可靠性。

需要方案设计者考虑的要点:

  • 加速和非加速链路之间的切换方式建议:

    • 如果客户端通过域名访问服务器端,建议修改DNS解析记录,推荐使用CNAME解析,生效快,并具备某个加速地区故障后的转移能力;如果使用DNS的A记录解析,则需要DNS本身具备按地域智能解析的能力,以实现客户端访问时的就近吸流。同时,需要考虑DNS TTL过期时间以及浏览器缓存等相关问题。

    • 如果客户端通过公网IP访问服务器端,若客户端有APP,建议通过版本更新或补丁包更新的方式修改预置的源站公网IP;若客户端没有APP,则可直接更换GA加速地域分配的公网IP。

  • 对于源站服务本身的部署建议:

    • 如果源站部署在阿里云上,建议尽量采用集群部署,根据业务对外服务的协议类型选择合适的SLB产品来构建集群系统,并进行后端服务器的多可用区部署。如果业务的重要程度较高,可以考虑多集群部署,分布在不同的Region,并通过GA产品的流量权重能力进行调度。

    • 如果源站不在阿里云上,同样也建议实施业务系统的集群部署。此外,还需考虑两个方面:首先,源站是否对访问源IP有限制,如有限制,可以从GA控制台获取终端节点组出公网IP,并将其加入访问白名单;其次,在配置GA终端节点组时,建议开启健康检查,以实时探测源站的可用性,避免无效的转发。

安全性

在使用GA进行加速方案时,安全性设计主要依据源站的类型及服务需求。如果业务为网站型,至少需结合使用WAF与GA;如果业务为游戏型,则至少需考虑将DDoS与GA结合使用。可根据业务的特点、流量转发路径及防护需求等,按需进行组合。以下是几种常见的模型:

  • Client -> DDoS -> GA -> WAF -> Server

    适用于跨境办公、跨境电商等业务,易受到DDoS攻击和Web攻击。流量首先经过DDoS防护,随后进行加速,接着通过WAF进行清洗,最后发送至真实的源站服务器。

  • Client -> GA -> WAF -> Server

    适用于跨境电商、官网等Web类服务,易受到Web攻击,用户相对分散。可先进行加速,随后经过WAF清洗,最后送达真实的源站服务器。

  • Client -> WAF -> GA -> Server

    适用于跨境电商、官网等Web类服务,易受到Web攻击,用户相对集中。可先进行清洗,随后加速,最后送达真实的源站服务器。

  • Client -> DDoS -> GA -> Server

    适用于游戏、APP类业务,易受到DDoS攻击。可先进行DDoS防护,随后加速,最后送达真实的源站服务器。

性能&弹性

使用GA实施加速方案时,核心关注点在于加速效果。因此,在方案设计阶段,需重点考虑以下几个方面:

  • 加速地域选择:应根据实际用户的分布情况,优先遵循就近原则,其次考虑就大原则。就近原则易于理解,而就大原则指规模大、网络发达的城市节点。例如,当用户与菲律宾和新加坡的距离相近时,应优先选择新加坡,因为其本身作为互联网枢纽,基础网络资源相较于菲律宾更加丰富。

  • 带宽水位设计:建议设计带宽利用率为70%,以确保业务流畅转发,并具备一定的突发处理能力。

  • GA产品规格和计费选择:

    • 对于弹性要求较高的业务,其带宽波峰和波谷较大,推荐采用按量付费模式。该付费模式包括GA实例的按CU计费,以及带宽部分的按流量计费。按CU计费时,所有加速地域集群的处理性能将随业务波动自动弹性伸缩;而按流量计费时,用户进入加速地域的公网流量、加速地域到终端节点组之间的跨地域内网流量以及终端节点组出云的公网流量,都将自动按流量计费。用户只需根据业务波峰设置加速地域的带宽峰值,并确保预留充足的缓冲,以满足最大的弹性能力。

    • 对于流量相对平稳的业务,其带宽波峰和波谷较小,建议选择包年包月的付费模式。根据业务并发量和带宽需求,选择相应的实例规格和带宽包。

可观测

使用GA实施加速方案时,加速效果的衡量、访问数据量大小以及运维排障等,均需要观测能力。GA和周边联动的产品均会在控制台提供相关的运维监控能力,比如带宽曲线、访问日志、操作日志等。如果需要自动化的运维能力,可以使用云监控,配置相关的监控和告警能力。比如选择按带宽费用的用户,可以配置带宽利用率的告警,设置对应的利用率告警阈值,当流量波动触发阈值后,系统会自动通知运维人员,及时升配带宽,避免业务受损。

  • 自动化运维:可以使用云监控配置告警管理,监控加速地域/终端节点组(出入带宽变化、出入丢包率、出入包速率、出入带宽利用率等指标),并配置阈值,触发告警。

  • 故障排查:可以使用GA的操作日志排查是否存在误操作;使用访问日志分析用户访问不通的情况;使用云监控观察通道时延指标(加速地域-终端节点组的时延)以评估转发是否符合预期效果。

应用场景介绍

  • 游戏场景

    游戏是对实时交互性要求最高的场景,通常会通过分区分服、大区同服等方式部署游戏服务器,但无论如何,玩家都希望能够获得丝滑的操作体验,以及实时的技能输出。从游戏类型来看,MOBA和射击类游戏对网络时延的要求最高。从游戏部署架构的角度分析,在大区同服等覆盖范围较大的情况下,网络层面也需针对时延进行相应的补偿。

    无论是平台服还是战斗服,无论是4层(TCP/UDP)业务还是7层(HTTP/HTTPS)业务,无论游戏服的源站是否部署在阿里云上,均可利用GA实现网络加速。同时,可以根据需求灵活搭配DDoS、WAF、CDN、DNS等服务,以实现整体方案的落地。

    推荐使用按量付费,GA实例使用CU按量计费,跨地域带宽使用按流量计费。无需考虑每个加速地域的带宽大小分配,完美契合游戏场景大波峰波谷的流量模型特点。

    当然,针对卡牌、电竞、5v5对战等品类,会涉及海量IP相同端口的部署模型,推荐使用GA产品的自定义路由方案,轻松满足加速需求,提升玩家游戏体验。

  • 跨境办公场景

    企业在“一带一路”倡议下出海,或外企在华发展过程中,都会面临跨境使用邮箱、OA、ERP等各类办公系统的挑战。员工需要办公系统能快速响应以提高工作效率。由于涉及生产相关数据,不能通过公网传输,虽然VPN可能提供一定的解决方案,但由于地理距离的影响,连接速度慢、下载缓慢以及数据上传延迟,都会严重影响办公效率和体验。

    根据员工的地域分布选择就近的加速地域,办公流量的大小相对固定,波峰波谷小,推荐使用按带宽计费,更具性价比。

    同时可以和WAF等安全产品结合,提升效率的同时,可保证数据安全。

  • 跨境电商场景

    随着生活质量的提高,消费者普遍倾向于在全球范围内进行货比三家,且具备相应的条件。同时,某些电商专注于特定细分行业,以高品质的商品吸引来自全球的顾客。然而,部分顾客与网站服务器之间的距离较远,甚至涉及跨境交易,从而导致公网访问体验难以得到保障。这不仅可能导致购物体验不佳,甚至可能引发下错单、付错款等问题,这无论是哪种情况都极为麻烦。

    可以根据用户的分布情况,按需开通对应区域内的加速地域。同时,可以根据网站的流量波形图选择合适的计费方式:波峰波谷小,建议选择按带宽计费;波峰波谷大,建议选择按流量计费。

    因为电商网站既有静态的图片和文字介绍,也有动态的视频和库存更新等,因此可以考虑和CDN产品结合,静态内容通过CDN本地缓存,动态内容通过GA的加速线路回源到源站。

  • APP出海场景

    在移动互联网时代,APP已成为每个人手机空间的主要组成部分。当用户离开常住地,出国旅游、工作等,对于APP的使用需求并不会降低。

    可以根据APP登录的热图,选择热点区域以部署GA的加速地域,当用户尝试连接APP服务器时,GA会根据用户分布情况返回相应的加速IP,从而使用户通过加速线路和APP服务器进行交互,显著提升使用体验。