本文为您介绍推荐解决方案-etrec召回的实现方法。
数据集
pai_online_project.rec_sln_demo_behavior_table
字段名 | 类型 | 描述 |
request_id | BIGINT | 埋点ID/请求ID |
user_id | BIGINT | 用户唯一ID |
exp_id | STRING | 实验ID |
page | STRING | 页面 |
net_type | STRING | 网络类型 |
event_time | BIGINT | 行为时间 |
item_id | BIGINT | 内容ID |
event | STRING | 行为类型 |
playtime | DOUBLE | 播放时长/阅读时长 |
ds | STRING | 分区列名 |
etrec召回
进入Designer页面
登录PAI控制台。
在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。
在工作空间页面的左侧导航栏选择模型开发与训练 > 可视化建模(Designer),进入Designer页面。
构建工作流
在Designer页面,单击预置模板页签。
在模板列表的推荐解决方案-etrec召回区域,单击创建。
在新建工作流对话框,配置参数(可以全部使用默认参数)。
其中:工作流数据存储配置为OSS Bucket路径,用于存储工作流运行中产出的临时数据和模型。
单击确定。您需要等待大约十秒钟,工作流可以创建成功。
在工作流列表,双击推荐解决方案-etrec召回工作流,进入工作流。
系统根据预置的模板,自动构建工作流,如下图所示。
组件编号
描述
1
行为权重。
2
准备Item-to-Item30天的训练样本。
3
通过对用户历史交互的Item进行加权统计,提高了召回U2I Trigger的准确性。
4
EtrecI2I协同过滤模型训练。
5
EtrecI2I Score拆分成KKV形式的分区表。
6
关联U2I Trigger和I2I表,计算U2I2I召回Top500的结果。
运行工作流并查看输出结果
填写全局变量
单击画布上方的运行。
工作流运行结束后,在DataWorks上查看MaxCompute表rec_sln_demo_etrec_u2i2i_score_v1,具体操作,请参见查看表详情。