部署服务

更新时间:
复制为 MD 格式

本文介绍如何将PAI-REC引擎部署到EAS。

PAI-REC控制台推荐方案部署成功如下示例:

在左侧导航栏选择推荐方案定制 > 部署记录,将部署状态筛选条件设置为成功,确认列表中对应推荐方案的部署状态显示为成功

引擎服务部署成功后,我们可以将其部署到EAS(模型在线服务)上。

1.引擎配置

PAI-Rec控制台左侧导航栏的系统配置中单击引擎配置,进入引擎配置页面。在当前开发环境下拉框中选择目标环境(如日常),页面下方将展示已有配置单列表(包含序号、配置单名称、更新时间等列)。单击创建配置单可新建配置。

在创建配置单之前首先需要准备数据源,然后再进行后续配置发布即可。根据业务需求进行引擎配置,具体可参考引擎配置单

在不同的开发环境下,配置单详情中需要注意区分配置不同的RunMode。

● daily:日常

● prepub:预发

● product:生产

示例(在日常环境下创建):

{
    "RunMode": "daily",
    "ListenConf": {
        "HttpAddr": "",
        "HttpPort": 8000
    },
    "ABTestConf": {
        "Host": "",
        "Token": ""
    },
    "FilterConfs": [],
    "RecallConfs": [
        {
            "Name": "user2item_recall",
            "RecallType": "UserCustomRecall",
            "RecallCount": 500,
            "DaoConf": {
                "AdapterType": "hologres",
                "HologresName": "xxx",
                "HologresTableName": "uti_demo"
            }
        }
    ]
}

2.服务管理

在左侧导航栏展开系统配置,单击服务管理进入服务管理页面。页面提供创建服务按钮,服务列表展示各服务的名称及预发环境状态(如运行中或未部署)。

我们会将服务管理与PAI-EAS配合,将引擎服务部署到EAS上。需要在EAS上部署预发与生产的引擎服务,预发生产的部署流程相同,均能按照以下流程完成部署。

1.基础配置

在基础配置页面,填写服务名称(需与PAI-EAS中的服务名称保持一致),填写服务描述,选择地域(如华东1(杭州)),选择镜像名称(官方镜像或用户自定义镜像),镜像选择需与所在地域对应,设置镜像版本(如2.0.0),填写镜像密钥,并选择推荐引擎配置(需与所配置的引擎配置单对应)。

2.EAS配置

EAS资源组中选择公共资源组EAS配置文件区域包含预发环境配置正式环境配置两个页签。部署时需将配置中的AccessKey、AccessSecretimage镜像版本号替换为实际值,需准备2PAI-EAS实例,预发环境服务名称需添加_prepub后缀。

根据控制台引导进行基础配置与EAS配置,将配置信息复制,并跳转至PAI-EAS控制台。在EAS控制台:点击部署服务,选择自定义部署进入配置详情。

将从PAI-REC控制台复制的EAS配置信息,添加进对应配置编辑模块,并完成专有网络配置。

专有网络配置区域,分别选择VPC交换机安全组(若无已有资源,可通过右侧链接创建)。

EAS控制台页面,单击顶部部署服务按钮,从下拉菜单中选择自定义部署进入配置页面,页面左侧为JSON配置编辑区域,右侧为专有网络等资源配置区域。

点击部署,等待运行,运行成功则部署到EAS上成功

若遇到报错,可参考EAS常见问题

3.预发&生产发布

在预发发布页面,将是否发布到预发环境设置为立刻发布,填写发布标题发布内容,在镜像版本区域选择接口获取并选择对应版本,然后单击执行发布

生产发布同理。

回到服务管理,完成PAI-REC自动验证后发布,在服务管理就能看到该服务的详情。

该服务的预发环境状态和生产环境状态均显示为运行中,表示发布成功。