创建GPU函数

更新时间: 2025-08-21 14:10:56

如果需要使用流行AI项目,如Stable Diffusion WebUI、ComfyUI、RAG、TensorRT等底层需要使用GPU实例来加速计算的应用,推荐以镜像方式部署函数应用。将容器镜像作为函数的交付物,提升开发和交付效率。

创建函数

  1. 登录函数计算控制台,在左侧导航栏,单击函数

  2. 在顶部菜单栏,选择地域,然后在函数页面,单击创建函数

  3. 在弹出的对话框,根据提示和实际场景,选择GPU函数类型,然后单击创建GPU函数

  4. 创建GPU函数页面,设置以下配置项,然后单击创建

    • 基础配置:输入函数名称,唯一用于标识函数的符号,在同一账号及地域下,函数名称必须唯一且符合命名规范。

    • 弹性配置:选择实例类型,常驻实例和弹性实例无法同时使用,且函数创建完成后,实例类型不支持切换。

      • 弹性实例

        配置项

        说明

        示例

        实例类型

        选择弹性实例,按请求量自动弹性伸缩,无请求后实例自动回收,即按使用量计费,不使用不收费。

        弹性实例

        GPU 卡型

        选择GPU卡型。关于各种卡型支持的规格,请参见实例类型和规格

        Ada 系列

        规格方案

        根据您的业务情况,设置函数的显存vCPU内存磁盘规格。设置规格后,实际调用函数产生的各资源使用量均按照规格乘以占用时长计量,详情请参见计费概述

        说明
        • 磁盘中所有目录可写,共享磁盘的空间。

        • 磁盘大小与底层执行函数的实例生命周期一致,实例被系统回收后,磁盘上的数据也会消失。如您需要对文件进行持久化保存,可以选择挂载NAS或OSS。具体操作,请参见配置NAS文件系统配置OSS对象存储

        • 显存:48 GB

        • vCPU:8 vCPU

        • 内存:64 GB

        • 磁盘:512 MB(不计费,函数计算提供512 MB的磁盘免费使用额度)

        单实例并发度

        您可以为GPU函数配置单实例多并发,即单个函数实例可以同时处理多个请求。具体操作,请参见配置单实例并发度

        20

        闲置模式

        开启该功能后,当实例处于无请求的闲置状态时,会将实例上的 vCPU 和 GPU 冻结,从而大幅降低成本。当有新请求时实例进入活跃状态,vCPU 和 GPU 自动解冻,热启动效率大于 2 秒,与模型大小相关;如果关闭该功能,实例上的 vCPU 和 GPU 会始终处于可用状态,同时采用活跃单价进行计费。

        开启

        最小实例数

        如果您的业务对延迟敏感,选择弹性实例后,建议设置最小实例数≥1,提前锁定资源,降低冷启动延迟。

        说明

        设置最小实例数≥1后,如果未配置最小实例数弹性策略或某段时间内,无有效的弹性策略,则当前最小实例数为此处设置的最小实例数。

        如果配置了多条弹性策略,系统会计算每条策略触发时的最小实例数,并取当前时间有效的弹性策略中最小实例数的最大值作为当前最小实例数

        更多信息,请参见如何计算当前最小实例数?

        1

      • 常驻实例

        配置项

        说明

        示例

        实例类型

        选择常驻实例,即从已购买的常驻资源池分配实例给函数。

        希望成本可预测、业务时延敏感、资源利用率高的场景,推荐您使用常驻实例,保障业务稳定性。

        常驻实例

        常驻资源池

        常驻资源池是可以为目标函数分配的常驻实例池,常驻资源池的 GPU 卡型必须和目标函数基础配置中的 GPU 卡型保持一致。

        如果您的常驻资源池剩余额度不足,请单击操作列的扩容,然后按照界面提示进行扩容。更多信息,请参见常驻资源池(包年包月)

        • 常驻资源池:fc-pool-****

        • GPU卡型:Ada

        规格方案

        根据您的业务情况,设置函数的显存vCPU内存磁盘规格。设置规格后,实际调用函数产生的各资源使用量均按照规格乘以占用时长计量,详情请参见计费概述

        说明
        • 磁盘中所有目录可写,共享磁盘的空间。

        • 磁盘大小与底层执行函数的实例生命周期一致,实例被系统回收后,磁盘上的数据也会消失。如您需要对文件进行持久化保存,可以选择挂载NAS或OSS。具体操作,请参见配置NAS文件系统配置OSS对象存储

        显存:48 GB

        vCPU:8 vCPU

        内存:64 GB

        磁盘:512 MB(不计费,函数计算提供512 MB的磁盘免费使用额度)

        常驻实例数

        根据常驻资源池的资源情况为目标函数分配常驻实例数。

        1

        单实例并发度

        您可以为GPU函数配置单实例多并发,即单个函数实例可以同时处理多个请求。具体操作,请参见配置单实例并发度

        20

    • 函数代码:配置函数的运行环境和代码相关信息。

      配置项

      说明

      示例

      运行环境

      • 使用示例镜像:选择函数计算提供的示例镜像,快速体验部署镜像函数。您需要从配置项容器镜像下方镜像列表中选择目标镜像。

      • 使用ACR中的镜像:单击配置项容器镜像下方的选择 ACR 中的镜像,在弹出的选择容器镜像面板,选择已创建的容器镜像实例ACR 镜像仓库,然后在下方选择镜像区域找到目标镜像并在其右侧操作列单击选择。更多信息,请参见创建自定义镜像函数

      自定义镜像 > 使用示例镜像

      容器镜像

      选择目标镜像。

      SpringBoot Web 应用示例镜像

      启动命令

      程序的启动命令。如果不配置启动命令,则默认使用镜像中的Entrypoint/CMD。

      监听端口

      您的代码中的HTTP Server所监听的端口。

      9000

      执行超时时间

      设置超时时间。执行超时时间默认为60秒,最长为86400秒。

      60

    • 实例预热:AI推理场景,配置实例预热实现模型预热,解决模型初次请求耗时较长的问题。

      配置项

      说明

      示例

      实例预热

      实例预热

      通过配置Initializer回调程序,在函数实例启动成功之后,处理请求之前,通过运行指定脚本或调用接口进行模型加载,提前预热,优化冷启动。

      更多关于Initializer回调程序的介绍,请参见配置实例生命周期

      开启

      超时时间

      设置Initializer回调程序超时时间。

      60

      预热程序类型

      支持配置执行指令调用代码两种类型的Initializer回调程序实现模型预热。

      执行指令

      指令内容

      配置执行指令内容。支持用户自定义Shell实现方式,例如/bin/bash 、 /bin/sh/bin/csh/bin/zsh等,需要确保函数运行时环境支持对应的Shell实现方式。

      参见回调方法实现

    • 权限、网络、存储:配置函数访问角色、网络和存储挂载等。

      配置项

      说明

      示例

      函数角色

      函数计算平台会使用这个RAM角色来生成访问的阿里云资源的临时密钥,并传递给代码。更多信息,请参见使用函数角色授予函数计算访问其他云服务的权限

      mytestrole

      允许访问 VPC

      用于开启允许函数访问VPC内资源。更多信息,请参见配置网络

      开启

      专有网络

      允许访问 VPC选择时必填。创建新的VPC或在下拉列表中选择要访问的VPC ID。

      fc.auto.create.vpc.1632317****

      交换机

      允许访问 VPC选择时必填。创建新的交换机或在下拉列表中选择交换机ID。

      fc.auto.create.vswitch.vpc-bp1p8248****

      安全组

      允许访问 VPC选择时必填。创建新的安全组或在下拉列表中选择安全组。

      fc.auto.create.SecurityGroup.vsw-bp15ftbbbbd****

      允许默认网卡访问公网

      是否允许函数通过默认网卡访问公网。

      重要

      使用固定公网IP地址功能时,必须关闭允许函数默认网卡访问公网,否则配置的固定公网IP地址不生效。更多信息,请参见配置固定公网IP地址

      开启

      挂载 NAS 文件系统

      为函数配置NAS文件系统,用于持久化存储函数间共享数据,例如多个推理函数共享的模型。

      如果选择自动配置,系统默认使用已有名称为Alibaba-Fc-V3-Component-Generated的通用型NAS文件系统,如果当前账号下没有符合条件的NAS,系统会自动创建。

      开启

      挂载 OSS 对象存储

      为函数挂载OSS对象存储,用于持久化存储日志、业务文件等。具体操作,请参见配置OSS对象存储

      开启

    • 日志、链路追踪

      配置项

      说明

      示例

      日志功能

      用于设置将函数的执行日志持久化保存到日志服务,方便您进行代码调试、故障分析和数据分析等。更多信息,请参见配置日志

      • 自动配置:自动选择以serverless-<region_id>开头的日志项目。

        该日志项目每个地域仅创建一个,不会重复创建,如系统查询到当前地域下已有此日志项目,将直接使用。

      • 自定义配置:需手动指定目标日志项目日志库

      开启

    • 更多配置

      配置项

      说明

      示例

      时区

      选择函数的时区。此处设置函数的时区后,将自动为函数添加一条环境变量TZ,其值为设置的目标时区。

      UTC

      标签

      为函数设置标签便于分组管理函数,需同时设置标签键和标签值。

      key : value

      资源组

      选择函数所在资源组,使用资源组对函数进行分组管理。

      默认资源组

      环境变量

      通过环境变量,在不修改代码的前提下灵活调整函数的行为,详见配置环境变量

      {
          "BUCKET_NAME": "MY_BUCKET",
          "TABLE_NAME": "MY_TABLE"
      }

编辑函数

函数创建完成后,如果需要变更镜像,您可以在函数详情页的配置页签,编辑运行时,详见下图。

image

更多修改,例如修改环境变量、日志存储等设置,请参见配置函数

删除函数

登录函数计算控制台,单击函数,选择地域,在目标函数的操作列,选择image > 删除,然后在弹出的对话框,确认要删除的函数已无任何触发器、最小实例数弹性策略等绑定资源后,再次确认删除。

获取函数ARN

资源ARN(Aliyun Resource Name)用于在代码中定位阿里云资源。可以获取函数的ARN,便于引用函数。

  1. 登录函数计算控制台,在左侧导航栏,单击函数

  2. 在顶部菜单栏,选择地域,然后在函数页面,单击目标函数。

  3. 函数详情页面,单击右侧的复制 ARN获取目标函数的ARN。

    image

相关文档

上一篇: 创建任务函数 下一篇: Serverless GPU概述
阿里云首页 函数计算 相关技术圈