EAS 提供发布策略、灰度切流和版本管理三类能力,帮助您把服务变更安全推上生产、在生产流量上验证新版本,以及在出现问题时快速回退。
概述
发布管理面向发布期——即您主动发起服务变更(新镜像、新参数、新模型等)的整个过程。按场景分为三类能力:
发布变更到生产:通过发布策略(滚动、分批、暂停)控制更新过程的节奏,避免请求中断。基础能力是滚动更新(按比例逐步替换)配合优雅退出;当服务副本规模较大、需要分批推进或中途暂停观察时,使用更新计划做精细控制。
在生产流量上验证:通过灰度发布把生产服务和灰度服务划分到同一个服务群组,按比例切分真实流量,确认无误后再扩大灰度直至全量。
查看历史版本与回退:每次更新都会保留版本快照,可以查看部署历史、对比差异、在出现问题时回滚到指定版本。
发布变更到生产
把变更部署到生产环境时,根据变更风险选择发布策略的组合方式。
滚动更新(默认):所有更新的底层机制,系统按
max_surge(超过期望的副本数)和max_unavailable(最大不可用副本数)逐步创建新副本、替换旧副本,旧副本通过优雅退出处理完存量请求后再下线,整个过程不中断业务。这是服务重启或参数更新时的默认行为。详情请参见滚动更新与优雅退出。更新计划:在滚动更新基础上增加了分批控制与暂停能力。当副本规模达到数十甚至上百个、需要逐批推进并在每批之间验证业务指标时使用,支持手动分批和自动分批两种模式,过程中可随时暂停、调整、回滚。详见更新计划。
常规更新用默认滚动策略即可;大规模、高风险、需要灰度推进的更新,叠加更新计划。
在生产流量上验证
灰度发布通过服务群组实现:将生产服务和灰度服务作为群组内的两个独立服务,由群组提供统一的访问入口,按副本数或自定义权重分配流量。适用于在真实流量上验证新版本——先给灰度服务少量流量,观察无异常后逐步扩大比例直至全量。详见灰度发布。
查看历史版本与回退
在推理服务列表中找到目标服务,在版本列单击当前版本进入版本列表。版本列表支持:
查看部署配置:查看该版本完整的镜像、资源规格、环境变量、启动命令等部署参数。
查看创建用户:定位变更负责人或留存审计记录。
版本对比:选中两个版本对比部署配置差异,快速定位变更点,便于回滚前评估影响或排查更新后异常。
回滚到此版本:将服务恢复到该版本的部署配置(当前版本的按钮自动置灰)。
关于回滚需注意两点:
跨版本兼容性:回滚依赖目标版本的镜像、模型文件、环境变量等资源仍然可用。如果镜像已被删除、外部依赖已变更,回滚可能失败或导致服务异常。
两种回滚方式的选择:
更新已全部完成、需切回旧版本时,使用版本列表回滚,按滚动更新策略执行,不受更新计划影响。
更新仍在进行中(部分副本已切换、未全部完成)且服务启用了更新计划时,推荐用更新计划回滚(手动分批,目标副本数改为 0),已更新的副本会逐步退回,速度更快。