本文介绍如何将PAI-REC引擎部署到EAS。
PAI-REC控制台推荐方案部署成功如下示例:
在左侧导航栏选择推荐方案定制 > 部署记录,将部署状态筛选条件设置为成功,确认列表中对应推荐方案的部署状态显示为成功。
引擎服务部署成功后,我们可以将其部署到EAS(模型在线服务)上。
1.引擎配置
在PAI-Rec控制台左侧导航栏的系统配置中单击引擎配置,进入引擎配置页面。在当前开发环境下拉框中选择目标环境(如日常),页面下方将展示已有配置单列表(包含序号、配置单名称、更新时间等列)。单击创建配置单可新建配置。
在创建配置单之前首先需要准备数据源,然后再进行后续配置发布即可。根据业务需求进行引擎配置,具体可参考引擎配置单。
注:
在不同的开发环境下,配置单详情中需要注意区分配置不同的RunMode。
● daily:日常
● prepub:预发
● product:生产
示例(在日常环境下创建):
{
"RunMode": "daily",
"ListenConf": {
"HttpAddr": "",
"HttpPort": 8000
},
"ABTestConf": {
"Host": "",
"Token": ""
},
"FilterConfs": [],
"RecallConfs": [
{
"Name": "user2item_recall",
"RecallType": "UserCustomRecall",
"RecallCount": 500,
"DaoConf": {
"AdapterType": "hologres",
"HologresName": "xxx",
"HologresTableName": "uti_demo"
}
}
]
}
2.服务管理
在左侧导航栏展开系统配置,单击服务管理进入服务管理页面。页面提供创建服务按钮,服务列表展示各服务的名称及预发环境状态(如运行中或未部署)。
我们会将服务管理与PAI-EAS配合,将引擎服务部署到EAS上。需要在EAS上部署预发与生产的引擎服务,预发与生产的部署流程相同,均能按照以下流程完成部署。
1.基础配置
在基础配置页面,填写服务名称(需与PAI-EAS中的服务名称保持一致),填写服务描述,选择地域(如华东1(杭州)),选择镜像名称(官方镜像或用户自定义镜像),镜像选择需与所在地域对应,设置镜像版本(如2.0.0),填写镜像密钥,并选择推荐引擎配置(需与所配置的引擎配置单对应)。
2.EAS配置
在EAS资源组中选择公共资源组。EAS配置文件区域包含预发环境配置和正式环境配置两个页签。部署时需将配置中的AccessKey、AccessSecret及image镜像版本号替换为实际值,需准备2个PAI-EAS实例,预发环境服务名称需添加_prepub后缀。
根据控制台引导进行基础配置与EAS配置,将配置信息复制,并跳转至PAI-EAS控制台。在EAS控制台:点击部署服务,选择自定义部署进入配置详情。
将从PAI-REC控制台复制的EAS配置信息,添加进对应配置编辑模块,并完成专有网络配置。
在专有网络配置区域,分别选择VPC、交换机和安全组(若无已有资源,可通过右侧链接创建)。
在EAS控制台页面,单击顶部部署服务按钮,从下拉菜单中选择自定义部署进入配置页面,页面左侧为JSON配置编辑区域,右侧为专有网络等资源配置区域。
点击部署,等待运行,运行成功则部署到EAS上成功
若遇到报错,可参考EAS常见问题。
3.预发&生产发布
在预发发布页面,将是否发布到预发环境设置为立刻发布,填写发布标题和发布内容,在镜像版本区域选择接口获取并选择对应版本,然后单击执行发布。
生产发布同理。
回到服务管理,完成PAI-REC自动验证后发布,在服务管理就能看到该服务的详情。
该服务的预发环境状态和生产环境状态均显示为运行中,表示发布成功。