在推荐业务场景中,使用PAI-Studio提供的整套FM-Embedding方案可以快速获得User和Item对应的特征向量,您只需要在召回模块对该特征向量进行乘积,即可得到User对Item的评分结果。本文为您介绍如何使用FM算法和Embedding提取算法,快速生成User和Item的特征向量。
背景信息
智能推荐包括召回和排序模块。召回模块中,通常使用向量分别表示User(用户)和Item(待推荐的内容),且通过User与Item的向量乘积判断User对Item的兴趣程度。该实验基于真实的推荐场景数据,其完整业务流程已预置在PAI-Studio模板中,您仅通过拖拽组件即可快速生成User和Item的特征向量。
数据集
原始数据包括如下字段。
实验的原始数据示例如下。
字段名 | 类型 | 描述 |
---|---|---|
userid | STRING | 用户ID。 |
age | DOUBLE | 用户年龄。 |
gender | STRING | 用户性别 |
itemid | STRING | 商品ID。 |
price | DOUBLE | 商品价格。 |
size | DOUBLE | 商品大小。 |
label | DOUBLE | 目标列,含义如下:
|

实现推荐召回
- 进入PAI-Studio控制台。
- 登录PAI控制台。
- 在左侧导航栏,选择 。
- 在PAI可视化建模页面,单击进入机器学习。
- 构建实验。
- 运行实验并查看输出结果。
- 单击画布上方的运行。
- 实验运行结束后,右键单击画布中的Embedding提取-1,在快捷菜单,单击查看数据,即可查看User特征向量。
- 右键单击画布中的Embedding提取-2,在快捷菜单,单击查看数据,即可查看Item特征向量。