Serverless应用引擎SAE(Serverless App Engine)能帮助应用极速上云,免运维底层基础设施,降低开发运维成本,白屏化管理应用全生命周期。本文介绍SAE助力SKG全面拥抱Serverless并实现敏捷交付的成功案例。

背景信息

SKG公司是一家专注于高端健康产品的研发、设计与制造的企业,专注为消费者提供精致、时尚的高端产品,以及按摩仪产品体验。

随着市场需求的迅速变化,SKG的IT系统也逐渐面临着库存不准确、线上线下渠道无法协同、部署架构不灵活、IT响应速度过慢等问题,为了能适配销售拓展、提高效率、加强规模化运营,SKG同阿里云达成战略合作,打造基于线上线下打通,并覆盖全渠道应用场景的渠道中台项目。本次渠道中台建设面向SKG线上、线下、礼品等渠道的营销管理,打通经销商、导购、后端SAP多端业务数据,同时整合面向C端会员数据和渠道零售终端销售数据,以全新的互联网架构云化系统能力支撑业务快速发展。

基于底层渠道中台构建的营销运营管理平台、经销商门户、导购终端小程序,需要有多端触达能力,同时满足不同端的个性化业务诉求和访问特点,要求中台有灵活的扩展定制能力、以及适配不同渠道流量需求的弹性能力。

业务痛点

在渠道中台建设之前、SKG主要是租用IDC机房部署应用,也有业务跑在云上,整体是IDC机房+ECS自建应用配套RDS等云产品的混合云架构。整套系统架构需要手工维护的地方比较多,例如应用发布、开源产品搭建接入、云服务集成、集群维护等,基本都是单点管理、手工操作。老系统交付过程中和转维后的痛点如下。针对这些痛点,SAE逐一攻破。

业务痛点为什么选择SAE
敏捷协同、DevOps等的成熟度低:
  • 项目迭代缺少全生命周期管控,对问题和任务进度的跟进主要靠线下沟通,缺少在线化追踪工具。
  • DevOps流程缺少自动化的工具支撑,如业务应用的发布上线,基本都是人肉发布,发布耗时长、流程低效、且容易产生线上安全故障。
无需管理和维护集群与服务器,专注于设计和构建应用程序,最大化利用资源完成应用的生命周期管理,集成基础监控和应用监控能力。
应用上线部署繁琐:
  • 上线需进行资源评估、应用服务器购买、安装配套软件初始化等操作流程较长。
  • 需要搭配集群监控、发布与调度脚本服务治理、配置管理、日志备份等能力,这些都需要单独部署配套组件或系统。
打包镜像或上传代码包,可直接在控制台部署、集成灰度发布能力。无需编写脚本或登录服务器。
自行实施容器化存在上手成本:开发对K8s等容器管理平台底层细节不熟悉、相对比较黑盒,出现问题排查进度较慢。无需单独购买ECS等IaaS层设置,直接选择CPU、内存规格以及一些简单的网络配置。
弹性伸缩不方便:
  • 业务侧有一定的峰谷,而在低谷期资源利用率很低。
  • 扩容需要重新走一套上线流程、且扩容后不容易下机器。
  • 后续中台上线之后、预计会拆出更多的微服务应用、但这些应用因承接的业务场景不同流量不均匀,需要有更灵活的弹性策略。
可实现快速弹性伸缩能力,扩缩容可在控制台直接操作生效。同时,支持按照多维度策略的自动扩缩容能力,能够应对突发流量的弹性需求,扩缩容可随意调整所需的CPU和内存资源,实现精细化控制,资源利用率高。
后期运维成本高:
  • 不仅需要维护应用本身,还需要维护整套基础设施及对应的配套系统。
  • 需要投入较多的额外人力。
基本免运维,无需专门配置运维人员,可由研发人员直接在控制台操作。

解决方案

SKG解决方案逻辑图如下所示。dg_case_studies_SKG

通过大禹提供的CI/CD流水线能力将业务应用自动化部署至SAE,彻底替换原来的人工部署、人肉运维的低效方式,在提升应用部署效率的同时,也有效降低了应用发布变更的风险,实现了可控部署、安全生产的效果。以往类似规模的集群和应用数、至少需要配置2个专门的运维。使用SAE后基本免运维、省去专门运维投入,一些SAE控制台配置操作基本由研发人员兼职即可。以往维护应用集群、经常需要排查K8s集群和ECS底层的一些问题,使用SAE后无需关注这部分内容。

SAE对基于Spring Boot、Spring Cloud、Dubbo等微服务框架开发的应用兼容性较好,同时集成了ACM、ARMS等云产品;屏蔽了部分底层细节,可以一键低配置部署。弹性策略灵活、优化资源方便。

使用效果

项目在实施过程中,SKG深度使用了阿里云飞天技术服务平台——大禹进行在线化交付,通过平台进行统一的管控和赋能。目前SKG渠道中台已上线包括微服务网关、微服务中心、前台Portal、终端小程序、前端Node应用等前中台所属20多个应用全部部署至SAE。上线过程无需花费过多的时间做系统改造或适配,只需在控制台配置,且上线后平台运行平稳。

  • SAE指标

    全部20+应用初始化配置、创建、部署至SAE,只需要2~3个小时。资源成本比单独购买机器节省30%以上。由于SAE支持0.5 Core的规格,开发测试环境资源开销得以降低50%以上。扩容效率则从按天级提高到分钟级。

  • 大禹指标

    通过大禹平台共计交付了近20+应用,提交代码超过180万行,流水线自动化发布应用超过3000次,平均发布时间在100s内;CI/CD自动化部署效率提升300%,零发布故障。