实例类型及使用模式
函数计算提供的实例类型包含弹性实例和GPU实例,这两种实例均支持按量模式和预留模式。在按量模式下是根据请求的时长进行计费,如果想提高实例的资源利用率,可以使用单实例多并发。如果您想解决冷启动问题,可以选择预留模式,在该模式下计量的时间是从实例启动完成开始,到您主动释放为止。本文为您介绍两类实例的实例模式、计费方式及实例规格。
实例类型
弹性实例:函数计算的基本实例。适用于突发流量和计算密集等各种场景。
GPU实例:提供Ampere以及Turing架构的GPU实例。主要适用于音视频、AI人工智能和图像处理等场景。在不同的场景中,将不同的业务负载下沉至GPU硬件加速,从而提升业务处理效率。
重要GPU实例仅支持通过容器镜像方式部署。
使用GPU实例过程中,为了确保您的业务正常进行,请加入钉钉用户群(钉钉群号:11721331),并提供以下信息。
组织名称,例如您所在的公司名称。
您的阿里云账号ID。
您使用GPU实例的地域,例如华南1(深圳)。
联系方式,例如您的手机号、邮箱或钉钉账号等。
实例模式
弹性实例和GPU实例均支持两种实例模式:按量模式和预留模式。两种实例模式说明如下。
按量模式
基本概念
按量模式是指函数实例的分配和释放完全由函数计算系统负责。函数计算会根据函数的调用量自动进行实例扩缩容,在调用增加时创建实例,在请求减少后销毁实例。整个过程中,通过请求自动触发实例创建。如果实例在一段时间内(一般为3~5分钟)不处理请求,会自动销毁。首次发起调用时,需要等待实例冷启动。
您的阿里云账号(主账号)在单个地域内默认的按量实例上限数为300。如果您需要提高该限制,请加入钉钉用户群(钉钉群号11721331)申请。
计费方式
在按量模式下,函数执行时长的计量从请求执行函数开始,到请求执行完毕结束。按量模式下,同一个实例同一时间可以执行一个请求,也可以并发执行多个请求。更多信息,请参见设置实例并发度。
在没有函数调用请求时不分配实例,所以不会产生费用。只有发生函数调用时才会产生费用。关于具体的产品定价和计费,请参见计费概述。
如果您希望提高实例资源利用率,建议根据业务对资源的诉求,配置您的实例为单实例多并发。在这种方案下,当多个任务同时在一个实例上执行时,CPU或者内存将被抢占式共享,有效提高资源利用率。
单实例单并发执行时长
按量模式下,一个实例执行一个请求时,执行时长的计量是从请求到达实例开始,到请求执行完毕为止。
单实例多并发执行时长
按量模式下,一个实例并发执行多个请求时,执行时长的计量是从第一个请求到达实例开始,到最后一个请求执行完毕为止。并发执行请求时,可以复用资源节省费用。

预留模式
基本概念
预留模式是将函数实例的分配和释放交由您管理,当配置预留函数实例后,预留的函数实例将会常驻,直到您主动将其释放。函数计算会优先将函数调用请求调度至预留的函数实例,当函数请求的并发超过预留的函数实例处理能力时,超出部分的请求被转发至按量模式的实例。关于删除预留模式的实例,请参见配置弹性伸缩规则。
如果您希望解决冷启动问题,预留模式是最佳方案。建议您根据业务资源预算选择固定数量预留、根据波峰波谷特性选择指定时间段预留或者按照水位阈值选择自动伸缩方案。预留后,实例的平均冷启动时延将明显降低。
闲置模式
弹性实例
根据是否被分配vCPU资源,弹性实例可以分为活跃实例和闲置实例两种状态。默认情况下,闲置模式功能处于关闭状态。
活跃实例
正在处理请求的实例,或者关闭了闲置模式功能开关的实例为活跃实例。关闭了闲置模式,预留模式的实例无论是否正在处理请求,函数计算始终为其分配vCPU资源,让实例始终处于活跃状态,以保证实例可以在没有请求时正常运行后台任务。
闲置实例
在预留模式中,启用了闲置模式功能开关的实例为闲置实例。开启闲置模式后,当预留的实例没有请求时,函数计算会将实例的vCPU冻结,使其进入闲置状态。闲置vCPU使用不计费,这将为您节省大量的成本。
您可以根据业务情况选择是否启用闲置模式。
使用成本
如果您需要预留模式来消除冷启动,又担心预留成本过高,建议启用闲置模式。此时,您可以为闲置状态的预留实例支付较少的费用,实现无冷启动的响应调用需求。
后台任务
如果您的函数需要运行后台任务,建议关闭闲置模式。例如:
使用依赖于内置调度或后台功能的应用框架,或依赖的中间件需要定期汇报心跳。
使用Go语言的Goroutine轻量级线程、Node.js语言的async函数或Java语言的异步线程执行异步操作。
GPU实例
根据是否被分配vCPU和GPU资源,GPU实例可以分为活跃实例和闲置实例两种状态。默认情况下,GPU实例的闲置模式功能处于关闭状态。
活跃实例
正在处理请求的实例,或者关闭了闲置模式功能开关的实例为活跃实例。开启闲置模式后,当预留的实例没有请求时,函数计算会将实例的vCPU和GPU冻结,使其进入闲置状态。
闲置实例(需提交申请)
在预留模式中,启用了闲置模式功能开关的实例为闲置实例。闲置vCPU使用不计费,闲置GPU使用将按照内存单价来进行计费,这将为您节省大量的成本。
GPU实例的闲置模式目前只针对整卡显存使用,即您的容器GPU配置必须为16 GB(T4卡型)或24 GB(A10卡型)。若您需要使用,请单击闲置GPU实例申请链接进行使用资格申请。
计费方式
实例规格
弹性实例
弹性实例包含以下实例规格,您可以根据业务需求选择不同配置的实例。
vCPU(核)
内存规格(MB)
代码包大小上限(GB)
函数执行时长上限(s)
磁盘大小上限(GB)
带宽能力上限(Gbps)
0.05~16
取值说明:必须为0.05的倍数。
128~32768
取值说明:必须为64的倍数。
10
86400
10
取值说明:
512 MB,默认值。
10 GB。
5
说明vCPU大小(单位为核)与内存大小(单位为GB)的比例必须设置在1∶1到1∶4之间。
GPU实例
GPU实例包含以下实例规格,您可以根据业务需求选择不同配置的实例。
实例规格
卡型
vGPU显存(MB)
vGPU算力(卡)
vCPU(核)
内存规格(MB)
fc.gpu.tesla.1
Tesla系列T4卡型
1024~16384(对应1 GB~16 GB)
取值说明:必须为1024 MB的倍数。
取值为vGPU显存(GB)/16。例如,配置vGPU显存为5 GB,则vGPU最高可得5/16张卡算力。
说明:由函数计算系统自动分配,无需手动配置。
取值为0.05~(vGPU显存(GB)/2)。
取值说明:必须为0.05的倍数。具体信息,请参见GPU规格配置表。
取值为128~(显存(GB)*2048)。
取值说明:必须为64的倍数。具体信息,请参见GPU规格配置表。
fc.gpu.ampere.1
Ampere系列A10卡型
1024~24576(对应1 GB~24 GB)
取值说明:必须为1024 MB的倍数。
取值为vGPU显存(GB)/24。例如,配置vGPU显存为5 GB,则vGPU最高可得5/24张卡算力。
说明:由函数计算系统自动分配,无需手动配置。
取值为0.05~(vGPU显存(GB)/3)。
取值说明:必须为0.05的倍数。具体信息,请参见GPU规格配置表。
取值为128~((显存(GB)*4096)/3)。
取值说明:必须为64的倍数。具体信息,请参见GPU规格配置表。
函数计算GPU实例同时支持以下资源规格。
镜像大小(GB)
函数执行时长上限(s)
磁盘大小上限(GB)
带宽能力上限(Gbps)
ACR企业版(标准版):10
ACR企业版(高级版):10
ACR企业版(基础版):10
ACR个人版(免费):10
86400
10
5
说明实例规格设置为g1等同于设置为fc.gpu.tesla.1。
目前支持GPU实例T4卡型的地域包括华东1(杭州)、华东2(上海)、华北2(北京)、华北3(张家口)、华南1(深圳)、日本(东京)、美国(弗吉尼亚)和新加坡。
目前支持GPU实例A10卡型的地域包括华东1(杭州)、华东2(上海)、日本(东京)和新加坡。