文档

基于etrec的U2I2I召回

更新时间:

本文为您介绍推荐解决方案-etrec召回的实现方法。

数据集

pai_online_project.rec_sln_demo_behavior_table

字段名

类型

描述

request_id

BIGINT

埋点ID/请求ID

user_id

BIGINT

用户唯一ID

exp_id

STRING

实验ID

page

STRING

页面

net_type

STRING

网络类型

event_time

BIGINT

行为时间

item_id

BIGINT

内容ID

event

STRING

行为类型

playtime

DOUBLE

播放时长/阅读时长

ds

STRING

分区列名

etrec召回

  1. 进入Designer页面

    1. 登录PAI控制台

    2. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。

    3. 在工作空间页面的左侧导航栏选择模型开发与训练 > 可视化建模(Designer),进入Designer页面。

  2. 构建工作流

    1. Designer页面,单击预置模板页签。

    2. 在模板列表的推荐解决方案-etrec召回区域,单击创建

    3. 新建工作流对话框,配置参数(可以全部使用默认参数)。

      其中:工作流数据存储配置为OSS Bucket路径,用于存储工作流运行中产出的临时数据和模型。

    4. 单击确定。您需要等待大约十秒钟,工作流可以创建成功。

    5. 在工作流列表,双击推荐解决方案-etrec召回工作流,进入工作流。

    6. 系统根据预置的模板,自动构建工作流,如下图所示。image..png

      组件编号

      描述

      1

      行为权重。

      2

      准备Item-to-Item30天的训练样本。

      3

      通过对用户历史交互的Item进行加权统计,提高了召回U2I Trigger的准确性。

      4

      EtrecI2I协同过滤模型训练。

      5

      EtrecI2I Score拆分成KKV形式的分区表。

      6

      关联U2I Trigger和I2I表,计算U2I2I召回Top500的结果。

  3. 运行工作流并查看输出结果

    1. 填写全局变量image..png

    2. 单击画布上方的运行

    3. 工作流运行结束后,在DataWorks上查看MaxComputerec_sln_demo_etrec_u2i2i_score_v1,具体操作,请参见查看表详情image..png