本文为您介绍推荐解决方案-etrec召回的实现方法。
数据集
pai_online_project.rec_sln_demo_behavior_table
字段名  | 类型  | 描述  | 
request_id  | BIGINT  | 埋点ID/请求ID  | 
user_id  | BIGINT  | 用户唯一ID  | 
exp_id  | STRING  | 实验ID  | 
page  | STRING  | 页面  | 
net_type  | STRING  | 网络类型  | 
event_time  | BIGINT  | 行为时间  | 
item_id  | BIGINT  | 内容ID  | 
event  | STRING  | 行为类型  | 
playtime  | DOUBLE  | 播放时长/阅读时长  | 
ds  | STRING  | 分区列名  | 
etrec召回
进入Designer页面
登录PAI控制台。
在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。
在工作空间页面的左侧导航栏选择模型开发与训练 > 可视化建模(Designer),进入Designer页面。
构建工作流
在Designer页面,单击预置模板页签。
在模板列表的推荐解决方案-etrec召回区域,单击创建。
在新建工作流对话框,配置参数(可以全部使用默认参数)。
其中:工作流数据存储配置为OSS Bucket路径,用于存储工作流运行中产出的临时数据和模型。
单击确定。您需要等待大约十秒钟,工作流可以创建成功。
在工作流列表,双击推荐解决方案-etrec召回工作流,进入工作流。
系统根据预置的模板,自动构建工作流,如下图所示。

组件编号
描述
1
行为权重。
2
准备Item-to-Item30天的训练样本。
3
通过对用户历史交互的Item进行加权统计,提高了召回U2I Trigger的准确性。
4
EtrecI2I协同过滤模型训练。
5
EtrecI2I Score拆分成KKV形式的分区表。
6
关联U2I Trigger和I2I表,计算U2I2I召回Top500的结果。
运行工作流并查看输出结果
填写全局变量

单击画布上方的运行。
工作流运行结束后,在DataWorks上查看MaxCompute表rec_sln_demo_etrec_u2i2i_score_v1,具体操作,请参见查看表详情。
