通过EAS控制台的自定义部署,可以快速全面了解EAS所提供的服务部署能力,适用于各类AI推理场景。
场景化部署对LLM、ComfyUI等常见应用提供了简化的配置流程,新手用户建议优化尝试。
部署操作
登录PAI控制台,在页面上方选择目标地域,并在右侧选择目标工作空间,然后单击进入EAS。
在推理服务页签,单击部署服务。然后在自定义模型部署区域,单击自定义部署。
根据下方参数说明完成配置后,单击部署。
服务状态变为运行中即表示部署成功,可进行服务调用。
具体操作示例可参见模型在线服务 EAS 快速入门。
参数说明
基本信息
所属群组 : 用于流量统一管理,支持灰度发布、异构资源或异步推理等。详情参见灰度发布。
环境信息
支持两种部署方式:镜像部署(推荐)和processor部署,详见部署原理。
镜像部署:通过镜像、代码及模型挂载的方式快速进行AI推理服务的部署。
processor部署:通过模型和Processor(包含在线预测逻辑的程序包)进行推理服务的部署。详见Processor部署。
对于AIGC、视频处理等长耗时推理场景,建议开启异步服务,实现异步调用。详情请参见部署异步推理服务。
镜像部署(推荐)
支持异步服务和开启Web应用。若镜像中包含WebUI,开启Web应用后,平台将自动开启Web服务器,可直接访问前端页面。
参数 | 描述 |
镜像配置 | 支持以下几种配置方式: |
直接挂载 | 支持通过OSS、NAS等方式挂载模型与代码文件。配置方法参见服务存储挂载。 |
数据集 | 使用数据集可以进行版本管理,详见创建及管理数据集。 |
运行命令 | 设置镜像启动命令,例如: 同时需指定端口号,即镜像启动后监听的本地HTTP端口。 重要 EAS引擎监听固定的8080和9090端口,因此需要避免使用这两个端口。 |
processor部署
部署方式选择processor部署时,参数配置如下表所示:
参数 | 描述 |
模型配置 | 您可以通过以下任何一种方式配置模型文件:
|
Processor种类 | 支持所有的预置官方Processor和自定义Processor,关于预置官方Processor的更多信息,详情请参见预置Processor。
|
资源信息
在资源信息区域配置以下参数。
参数 | 描述 |
资源类型 | |
GPU共享 | 当资源类型选择EAS资源组或灵骏资源配额时,支持打开GPU共享功能。详见GPU共享。 |
实例数 | 建议配置多个服务实例,以避免单点部署带来的风险。 当资源类型选择 EAS资源组时,您需要为每个服务实例配置GPU、CPU和内存(GB)参数。 |
部署资源 | 如果您领取了免费资源包,支持在华北2(北京)、华东2(上海)、华东1(杭州)、华南1(深圳)、西南1(成都)、华南2(河源)地域,使用试用活动页签的免费机型,详情请参见免费试用领取、使用和释放。 当资源类型选择公共资源时:
|
服务接入
EAS提供了多种服务接入方式。
参数 | 描述 |
网关选择 |
|
专有网络 (VPC) | 配置专有网络(VPC)、交换机和安全组名称参数,可以为EAS服务开通VPC高速直连、访问公网等。详情请参见EAS网络配置。 |
关联负载均衡NLB | 您可将当前的EAS服务关联到什么是网络型负载均衡NLB实例上,从而实现负载均衡的自主可用。详情请参见通过关联负载均衡NLB调用。 |
关联服务发现Nacos | 您可将当前的EAS服务关联到微服务注册配置中心上,通过Nacos等引擎实现对EAS服务多实例的发现与同步,详情请参见通过关联服务发现Nacos调用。 |
自定义鉴权 | 鉴权token默认后台自动生成,如果您需要自定义服务访问的鉴权token可进行配置。 |
服务功能
在服务功能区域,支持配置以下参数:
参数 | 描述 |
内存缓存加速 | EAS通过将模型文件缓存到本地目录中,来提高读取数据的速度,减少延时。更多关于该功能的详细介绍及配置方法,请参见内存缓存本地目录。 |
LLM智能路由 | 打开开关,并选择LLM智能路由。如果没有可选的LLM智能路由,您可以单击新建LLM智能路由进行创建,详情请参见LLM智能路由。 LLM智能路由是一种特殊的EAS服务,可以与LLM推理服务绑定。当LLM推理服务有多个后端实例时,LLM智能路由能够根据后端负载进行动态分发,保证后端实例处理的算力和显存尽可能均匀,提升集群资源使用水位。 |
服务配置
服务的全部配置会以JSON形式显示在服务配置区域。
附录:部署原理
使用EAS进行模型部署时,支持镜像部署和Processor部署两类部署方式,对比介绍如下。
镜像部署(推荐)
使用镜像方式部署时,EAS通过拉取容器镜像服务ACR中的环境镜像、挂载存储云产品(对象存储OSS、文件存储NAS),来获取部署前所需的准备内容,包括运行环境、模型以及其他相关文件(如模型前后处理代码等)。
EAS镜像部署的流程图如下。
此方式的部署要点如下。
如果您使用的镜像中集成了WebUI应用的部分,支持开启Web应用。平台会自动开启Web服务器,从而帮助您直接访问前端WebUI页面。
PAI为您提供了多个典型场景的官方镜像便于您高效一键部署,您也可以结合业务需求自行开发模型并制作镜像,制作完成的镜像需上传至阿里云镜像服务ACR中,便于部署时选择使用。
建议您将模型和模型的前后处理代码文件上传至存储云产品,后续通过挂载方式来获取对应内容,而非直接打包至自定义镜像中,在后续模型需频繁迭代更新时,可方便地替换模型。
使用镜像部署时,建议您自行构建一个HTTP Server,后续使用EAS部署好服务后,EAS会将调用服务的请求转发至您自行开发的HTTP Server中,自建的HTTP Server需避开EAS系统监听端口8080和9090。
使用自定义镜像进行部署时,请务必将您的镜像上传至ACR中再进行使用,否则可能导致在部署时镜像拉取失败。如果您使用DSW进行模型开发训练,也需将镜像上传至ACR中才可在EAS中使用。
如果您的自定义的镜像、预热数据等内容可在其他多种场景下应用,您也使用PAI AI资产的镜像和数据集功能,将其沉淀为对应的AI资产进行统一管理。当前EAS不支持使用NAS-CPFS类型的数据集。
Processor部署
准备好模型和Processor文件等服务部署前的准备内容后,分别上传至存储云产品(OSS、NAS),EAS通过挂载存储云产品来获取部署前所需的准备内容进行服务部署。
EAS Processor部署流程如下。
此方式的部署要点如下。
PAI为您提供了多个典型场景的官方Processor供您使用,您也可以结合业务需求自行开发模型并开发自定义Processor文件,完成后分别上传至阿里云存储产品OSS或NAS。
建议您将模型和Processor文件独立开发分别存储,后续可在部署时配置模型挂载路径,Processor文件中可使用get_model_path参数来获取配置的模型路径,便于后续模型需频繁迭代更新时,可方便地替换模型。
使用Processor部署时,EAS会根据您选用的推理框架自动拉取官方环境镜像来部署服务,并基于Processor文件自动为您部署一个HTTP Server用于接收后续调用服务的请求。
使用Processor方式部署时,您需要保障模型的推理框架和Processor文件的开发符合开发环境要求,不如镜像部署方式灵活高效,因此更建议您使用镜像方式进行模型部署。