通用模型训练插件支持推荐召回场景的自动模型训练、超参优化及模型评估,您只需要配置召回策略和数据过滤策略即可得到深度优化的模型。同时,通用模型训练插件与PAI-EAS高效对接,您可以将测试通过的模型一键部署为RESTful服务。本文介绍使用通用模型训练插件进行推荐召回的详细流程。

前提条件

  • 已完成OSS授权,详情请参见OSS授权
  • 已创建OTS实例,详情请参见创建实例
  • 已将推荐召回使用的召回策略和数据过滤策略存储在OTS中,详情请参见OTS创建数据表

操作流程

使用通用模型训练插件进行推荐召回的流程如下:
  1. 步骤一:创建实例

    创建用于推荐召回的实例。

  2. 步骤二:配置召回策略

    配置召回策略可以从海量的待推荐数据中通过算法缩小待推荐物品的范围。

  3. 步骤三:配置数据过滤策略

    配置数据过滤策略是指配置一些业务策略,进一步减少推荐候选集(系统会自动实现相同推荐结果的去重)。

  4. 步骤四:测试及部署

    系统根据召回策略和数据过滤策略将推荐方案自动配置成在线测试服务,测试通过后可以将该方案部署到PAI-EAS。

步骤一:创建实例

  1. 进入通用模型训练页面。
    1. 登录PAI控制台
    2. 在左侧导航栏,选择AI行业插件 > 通用模型训练
  2. 通用模型训练页面,单击创建实例
  3. 创建实例页面,配置参数。
    参数 描述
    实例类型 选择实例类型推荐召回。系统支持以下实例类型
    • 图片分类
    • 推荐召回
    实例名称 长度为1~20个字符,以大写字母、小写字母或中文开头,只能包含中文、字母、下划线(_)或数字。
    实例说明 实例的简要说明,便于区分各实例。
    储存依赖 使用推荐召回服务,需要将训练数据存储到阿里云表格存储OTS(Tablestore)中,详情请参见OTS创建数据表。如果没有进行OTS授权,则单击下方的授权
    实例绑定 选择一个已创建的OTS实例。
  4. 单击确认

步骤二:配置召回策略

  1. 通用模型训练页面,单击目标推荐召回实例操作列下的打开
  2. 召回策略配置的配置向导页面,配置召回策略。
    推荐召回支持以下召回策略,您可以根据实际需要选择合适的召回策略:
    • 协同过滤召回:推荐领域经典的召回策略,根据人和物品的相关性生成召回结果。
    • 语义召回:通常应用于新闻推荐,根据人物感兴趣的文章类型进行召回。
    • 自定义召回:基于业务生成User-item的召回策略。
    各召回策略的页面参数如下表所示。
    区域 参数 描述
    协同过滤召回 策略名称 长度为1~20个字符,以大写字母或小写字母开头,只能包含字母、数字或下划线(_)。
    User-Item数据表 选择召回策略的OTS User数据表。将鼠标悬停至User-Item数据表后的问号图标,查看数据表格式说明。
    Item-Item数据表 选择召回策略的OTS Item数据表。将鼠标悬停至Item-Item数据表后的问号图标,查看数据表格式说明。
    召回数量 该召回策略下,返回的召回数量。取值为正整数。如果召回结果的数量小于配置的召回数量,则以实际召回结果为准。
    语义召回 策略名称 长度为1~20个字符,以大写字母或小写字母开头,只能包含字母、数字或下划线(_)。
    User-Topic数据表 选择召回策略的OTS User数据表。将鼠标悬停至User-Topic数据表后的问号图标,查看数据表格式说明。
    Topic-Item数据表 选择召回策略的OTS Item数据表。将鼠标悬停至Topic-Item数据表后的问号图标,查看数据表格式说明。
    召回数量 该召回策略下,返回的召回数量。取值为正整数。如果召回结果的数量小于配置的召回数量,则以实际召回结果为准。
    自定义召回策略 策略名称 长度为1~20个字符,以大写字母或小写字母开头,只能包含字母、数字或下划线(_)。
    Item数据表 选择召回策略的OTS数据表。将鼠标悬停至Item数据表后的问号图标,查看数据表格式说明。
    召回数量 该召回策略下,返回的召回数量。取值为正整数。如果召回结果的数量小于配置的召回数量,则以实际召回结果为准。
  3. 单击添加到策略列表,该召回策略显示在右侧的已添加策略列表中。
  4. 可选:参考以上步骤,添加多个召回策略。
  5. 单击下一步

步骤三:配置数据过滤策略

  1. 数据过滤策略配置的配置向导页面,配置参数。
    推荐召回支持以下过滤策略,您可以根据实际需要选择合适的过滤策略:
    • 基于历史曝光数据的过滤策略。

      过滤掉历史上已经对该用户推荐过的数据,PAI推荐召回方案会记录历史上针对每个用户推荐过的商品列表,并且实现过滤功能。

    • 基于User-item关系对的过滤策略。
      如果召回结果出现某User,则过滤该User对应的item。数据表格式如下。数据格式
    • 基于item的过滤策略。
      如果召回结果出现该itemid,则过滤该item。数据表格式如下。数据表格式
    各过滤策略的页面参数如下表所示。
    区域 参数 描述
    历史曝光数据过滤 策略配置 策略名称 长度为1~20个字符,以大写字母或小写字母开头,只能包含字母、数字或下划线(_)。
    User-item数据表 选择过滤策略的OTS数据表。将鼠标悬停至User-Item数据表后的问号图标,查看数据表格式说明。
    自定义过滤策略(U-I过滤)策略配置 策略名称 长度为1~20个字符,以大写字母或小写字母开头,只能包含字母、数字或下划线(_)。
    User-item数据表 选择过滤策略的OTS数据表。将鼠标悬停至User-Item数据表后的问号图标,查看数据表格式说明。
    自定义过滤策略(I策略过滤)策略配置 策略名称 长度为1~20个字符,以大写字母或小写字母开头,只能包含字母、数字或下划线(_)。
    item数据表 选择过滤策略的OTS数据表。将鼠标悬停至Item数据表后的问号图标,查看数据表格式说明。
  2. 单击添加到策略列表,该过滤策略显示在右侧的已添加策略列表中。
  3. 可选:参考以上步骤,添加多个数据过滤策略。
  4. 单击部署并测试

步骤四:测试及部署

  1. 部署确认对话框,核对已配置的召回策略和过滤策略,并单击确认
  2. 测试模块区域,输入UserID召回结果数量1
  3. 单击发送测试请求
  4. 调试信息区域,查看返回的推荐内容。如果对模型结果满意,单击前往EAS部署,将服务部署到PAI-EAS,形成RESTful请求。
    关于如何将服务部署到PAI-EAS,请参见控制台上传部署
    说明 将服务部署到PAI-EAS会产生额外的费用,详情请参见PAI-EAS计费说明