配置快照弹性策略

通过快照功能,您可以有效避免函数调用高峰期间因实例冷启动导致的请求延迟问题。您还可以配置指定时间段或指定指标利用率达到设定阈值后对快照进行扩缩容,保障性能的同时提高实例利用率。

重要
  • 快照用于解决冷启动问题,为时延敏感的在线业务提供更好的服务响应。设置快照后,无论是否使用,您都需要为此付费。快照的单价远远小于弹性实例的单价,帮助您使用少量费用提前锁定资源,快照和弹性实例的费用详情请参见计费概述

  • 仅支持为函数别名或LATEST版本设置快照策略。

开启快照

  1. 登录函数计算控制台,在左侧导航栏,单击函数,在顶部菜单栏选择地域,单击创建函数,然后选择函数类型。

  2. 创建函数页面的弹性配置区域,开启快照,然后根据需求设置快照类型默认快照数,然后单击创建

    说明

    CPU业务无秒级快照,只支持毫秒级快照。

    image

配置快照弹性策略

  1. 在目标函数的详情页面,选择弹性配置页签,在下方弹性策略区域,单击目标快照策略行的编辑

    image

  2. 编辑弹性策略面板,设置快照策略。

    说明
    • 如果您配置了多条快照策略,系统会计算每条策略的快照数,并取当前时间有效的弹性策略中快照数的最大值作为当前快照数量,详情请参见示例说明

    • 配置的快照策略生效期间,配置的默认快照数不生效。某段时间内,如果无有效的快照策略,则当前实际快照数等于您配置的默认快照数

    • 设置定时伸缩/水位伸缩弹性策略

      定时伸缩

      定时伸缩策略适用于函数有明显的周期性规律或可预知的流量高峰。当函数调用并发大于定时快照数时,超出的部分会分配至默认模式的弹性实例。更多信息,请参见定时伸缩

      image

      如图所示,本文示例为指定时区Asia/Shanghai,即北京时间,策略长期有效,每周一至周五10:00将快照扩容至50,22:00再将快照收缩至5。

      水位伸缩

      根据实例的各指标利用率或实例并发利用率,周期性对快照进行一次伸缩。更多信息,请参见水位伸缩

      image

      如图所示,本文示例为指定时区Asia/Shanghai,即北京时间,策略有效区间为2025-07-15 0时至2025-07-31 0时,追踪实例并发利用率指标,并发利用率追踪值为60%,超过60%时开始扩容,扩容上限为100;并发利用率低于60%时开始缩容,缩容下限为10。

      相比上图中CPU函数快照水位伸缩监控的指标并发利用率阈值,GPU函数水位伸缩策略支持监控的指标还包含各资源利用率指标,详见下图。

      image

    • 设置CRON表达式周期弹性伸缩

      如果业务有明显的周期性规律,您也可以通过CRON表达式设置周期性快照伸缩。如下图所示,指定时区Asia/Shanghai,即北京时间,每周一10:00将快照扩容至10,每周五22:00再将快照收缩至1。

      image

观察函数实例变化趋势

在目标函数详情页弹性配置页签,您可以通过观察函数实例变化趋势图,根据快照和弹性实例的数量分布,合理调整快照策略。

image

修改或删除快照策略

登录函数计算控制台,在左侧导航栏选择弹性管理 > 弹性策略,在弹性策略页面的快照策略列表,单击目标策略操作列的编辑或者删除,修改或者删除相应的快照策略。

重要

删除某别名的快照策略将关闭该别名上的所有快照,自动切换为使用弹性实例,此时会有冷启动过程。CPU业务平均冷启动效率为百毫秒级别,取决于应用本身启动速度。GPU业务平均冷启动效率为分钟级别,取决于模型大小与加载速度。

相关文档

  • 关于快照的功能原理及计费方式,请参见极速模式

  • 默认情况下,一个阿里云账号在同一个地域下的所有函数共享上述伸缩限制。当需要限制某个函数的实例数时,您可以配置实例数上限。配置后,当此函数处于执行状态的函数实例总数超过限制后,函数计算将返回流控错误。