推荐解决方案-排序的输入包括经过特征工程处理后的用户特征表、物品特征表、用户行为表,输出为排序模型,可用于模型部署。本文为您介绍推荐解决方案-排序的实现方法。
前提条件
已运行推荐解决方案-特征工程工作流模板生成排序需要的数据集,具体操作请参见特征工程。
rec_sln_demo_user_table_preprocess_all_feature_v2
rec_sln_demo_item_table_preprocess_all_feature_v2
rec_sln_demo_behavior_table_preprocess_v2
实现排序
进入Designer页面。
登录PAI控制台。
在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应的工作空间。
在工作空间页面的左侧导航栏选择 ,进入Designer页面。
构建工作流。
在Designer页面,单击预置模板页签。
在模板列表,单击推荐解决方案-排序区域的创建。
在新建工作流对话框配置参数(可以全部使用默认参数)。
其中: 工作流数据存储配置为OSS Bucket路径,用于存储工作流运行中产出的临时数据和模型。
单击确定。您需要等待大约十秒钟,工作流可以创建成功。
系统根据预置的模板,自动构建工作流,如下图所示。
组件编号
描述
1
排序模型的样本。
2
根据fg.json文件,对样本做FG操作,详情请参见fg文档。
3
统计数值类特征的等频分箱,boundaries用于对数值类特征做离散化。
4
统计枚举类特征的唯一值数,用于设置模型的embedding_dim和hash_bucket_size。
5
打散rec_sln_demo_sorting模型的30天样本数据形成训练样本。
6
汇总rec_sln_demo_rec_sln_demo_sorting_30d_binning_v2表和rec_sln_demo_rec_sln_demo_sorting_30d_count_v2表结果,计算Feature配置信息和Step配置信息。
7
根据组件编号6节点的计算结果,在EasyRec配置文件中填充配置信息。
说明该节点只需执行一次。
8
模型训练需先执行一次组件编号7节点,生成EasyRec配置文件。