模型训练完之后,当您想要在其他应用中访问时,可以使用EAS将模型部署为在线服务。本文为您介绍如何部署模型。
了解PAI-EAS
模型在线服务EAS(Elastic Algorithm Service)是PAI提供的模型在线服务平台,可支持您一键部署模型为在线推理服务或AI-Web应用。它提供了的弹性扩缩容、资源组管理、版本控制、资源监控等功能,可以支撑您以较低的资源成本获取高并发且稳定的在线算法模型服务。更多内容请参见EAS模型服务概述。
模型部署
在使用EAS部署模型时可以采用控制台部署、EASCMD客户端部署、python SDK部署三种方式,初次部署时建议您先使用EAS控制台的方式部署,操作更加简单。
使用EAS控制台自定义部署(推荐)
使用控制台部署模型的操作步骤如下:
登录PAI控制台,在页面上方选择目标地域,并选择目标工作空间,然后单击进入EAS,在推理服务页签,单击部署服务 > 自定义部署。
参数配置,以下介绍服务部署页的关键参数配置,完整的配置参数请参见服务部署:控制台。
部署方式:选择镜像部署。
镜像配置:镜像提供模型运行的环境,您可以选择官方镜像、自定义镜像或输入镜像地址。如果您是在DSW开发的模型,可以直接使用DSW的镜像制作功能,将镜像上传至ACR中并在EAS中使用,操作步骤如下:
代码配置和运行命令:您可以将应用启动文件放在OSS中并配置挂载地址,然后在启动命令处填写相应命令。本文使用如下简单案例进行测试。
三方库配置:在三方库配置处,您可以添加镜像中缺失的三方库,示例如下:
使用EASCMD部署
如果您使用官方DSW镜像,则已预置EASCMD客户端(路径:/home/pai/bin
)。具体操作,请参见服务部署:EASCMD。
使用Python SDK部署
您也可以在DSW中安装EAS Python SDK,通过此SDK代码将模型部署为EAS在线服务。具体操作,请参见使用EAS Python SDK部署模型。
服务调用测试
在模型部署成功后,可以使用EAS在线调试功能测试服务接口。操作如下:
在EAS实例列表页,单击实例名称进入实例信息页,然后再单击选择在线调试。
以上文的web.py应用为例,输入请求地址 ,然后单击发送请求,如果返回“hello World!”则请求成功。
如果您想要使用公网地址调用,或者VPC地址调用,请参见服务调用方式。