配置最小实例数弹性策略

通过设置函数的最小实例数≥1提前锁定弹性资源,可以有效避免函数调用高峰期间因实例冷启动导致的请求延迟问题。另外,还可以配置指定时间段或指定指标利用率达到设定阈值后对最小实例数进行扩缩容,保障性能的同时提高实例利用率。

重要
  • 设置函数的最小实例数≥1用于解决冷启动问题,为时延敏感的在线业务提供更好的服务响应。此时,无论是否使用,都需要为这部分实例付费,处理请求阶段按照弹性实例(活跃)单价计费,未处理请求阶段按照弹性实例(闲置)单价计费。关于弹性实例(活跃)和弹性实例(闲置)的费用计算,请参见计费概述

  • 仅支持为函数别名或LATEST版本设置最小实例数弹性策略。

设置最小实例数

  1. 登录函数计算控制台,在左侧导航栏,单击函数,在顶部菜单栏选择地域,单击创建函数,然后选择函数类型。

  2. 创建函数页面的弹性配置区域,设置最小实例数的值,填写其他必选项,然后单击创建

配置弹性策略

  1. 在目标函数的详情页面,选择弹性配置页签,在下方弹性策略区域,单击目标策略行的编辑

  2. 编辑弹性策略面板,设置最小实例数的动态弹性策略。

    说明
    • 如果您配置了多条弹性策略,系统会计算每条策略触发时的最小实例数,并取当前时间有效的弹性策略中最小实例数的最大值作为当前最小实例数,详情请参见如何计算当前最小实例数?

    • 配置的弹性策略生效期间,初始配置的最小实例数不生效。某段时间内,如果不存在有效的弹性策略,则当前最小实例数等于您初始配置的最小实例数

    • 设置定时伸缩/水位伸缩弹性策略

      定时伸缩

      定时伸缩策略适用于函数有明显的周期性规律或可预知的流量高峰。当函数调用并发大于最小实例数时,超出的部分会自动分配至按量弹性实例。更多信息,请参见定时伸缩

      image

      如图所示,本文示例为指定时区Asia/Shanghai,即北京时间,策略长期有效,每周一至周五10:00将最小实例数扩容至50,22:00再将最小实例数收缩至5。

      水位伸缩

      根系统周期性采集实例并发利用率内存利用率GPU实例的资源利用率指标,满足条件时,对最小实例数进行扩缩容,详见水位伸缩

      image

      如图所示,本文示例为指定时区Asia/Shanghai,即北京时间,策略有效区间为2025-07-15 0时至2025-07-31 0时,追踪实例并发利用率指标,并发利用率追踪值为60%,超过60%时开始扩容,扩容上限为100;并发利用率低于60%时开始缩容,缩容下限为10。

      CPU函数最小实例数水位伸缩监控的指标包括实例并发利用率内存利用率,GPU函数水位伸缩策略支持监控的指标实例并发利用率GPU资源相关利用率指标,详见下图。

      CPU函数

      GPU函数

      image

      image

    • 设置CRON表达式周期弹性伸缩

      如果业务有明显的周期性规律,您也可以通过CRON表达式设置周期性扩缩容最小实例数。如下图所示,指定时区Asia/Shanghai,即北京时间,每周一10:00将最小实例数扩容至10,每周五22:00再将最小实例数收缩至1。

      image

修改或删除最小实例数弹性策略

登录函数计算控制台,在左侧导航栏选择弹性管理 > 弹性策略,在弹性策略页面的弹性策略列表,单击目标策略操作列的编辑或者删除,修改或者删除相应的最小实例数弹性策略。

重要

删除某别名的最小实例数弹性策略将关闭该别名上预留的所有实例,自动转为按请求弹性,此时会有冷启动过程。CPU业务平均冷启动效率为百毫秒级别,取决于应用本身启动速度。GPU业务平均冷启动效率为分钟级别,取决于模型大小与加载速度。

相关文档

如果需要限制某个函数的实例数,您可以配置函数配额。配置后,当此函数处于执行状态的函数实例总数超过限制后,函数计算将返回流控错误。