在推荐业务场景中,使用PAI-Designer提供的整套FM-Embedding方案可以快速获得User和Item对应的特征向量,您只需要在召回模块对该特征向量进行乘积,即可得到User对Item的评分结果。本文为您介绍如何使用FM算法和Embedding提取算法,快速生成User和Item的特征向量。
前提条件
已创建工作空间,详情请参见创建工作空间。
背景信息
智能推荐包括召回和排序模块。召回模块中,通常使用向量分别表示User(用户)和Item(待推荐的内容),且通过User与Item的向量乘积判断User对Item的兴趣程度。该工作流基于真实的推荐场景数据,其完整业务流程已预置在PAI-Designer模板中,您仅通过拖拽组件即可快速生成User和Item的特征向量。
数据集
原始数据包括如下字段。
工作流的原始数据示例如下。
字段名 | 类型 | 描述 |
---|---|---|
userid | STRING | 用户ID。 |
age | DOUBLE | 用户年龄。 |
gender | STRING | 用户性别 |
itemid | STRING | 商品ID。 |
price | DOUBLE | 商品价格。 |
size | DOUBLE | 商品大小。 |
label | DOUBLE | 目标列,含义如下:
|

实现推荐召回
- 进入PAI-Designer页面。
- 登录PAI控制台。
- 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。
- 在工作空间页面的左侧导航栏选择 ,进入Designer页面。
- 构建工作流。
- 运行工作流并查看输出结果。
- 单击画布上方的运行。
- 工作流运行结束后,右键单击画布中的Embedding提取-1,在快捷菜单,单击 ,即可查看User特征向量。
- 右键单击画布中的Embedding提取-2,在快捷菜单,单击 ,即可查看Item特征向量。