文档

排序

更新时间:

推荐解决方案-排序的输入包括经过特征工程处理后的用户特征表、物品特征表、用户行为表,输出为排序模型,可用于模型部署。本文为您介绍推荐解决方案-排序的实现方法。

前提条件

已运行推荐解决方案-特征工程工作流模板生成排序需要的数据集,具体操作请参见特征工程

  • rec_sln_demo_user_table_preprocess_all_feature_v2

  • rec_sln_demo_item_table_preprocess_all_feature_v2

  • rec_sln_demo_behavior_table_preprocess_v2

实现排序

  1. 进入Designer页面。

    1. 登录PAI控制台

    2. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应的工作空间。

    3. 在工作空间页面的左侧导航栏选择模型开发与训练 > 可视化建模(Designer),进入Designer页面。

  2. 构建工作流。

    1. 在Designer页面,单击预置模板页签。

    2. 在模板列表,单击推荐解决方案-排序区域的创建

    3. 新建工作流对话框配置参数(可以全部使用默认参数)。

      其中: 工作流数据存储配置为OSS Bucket路径,用于存储工作流运行中产出的临时数据和模型。

    4. 单击确定。您需要等待大约十秒钟,工作流可以创建成功。

    5. 系统根据预置的模板,自动构建工作流,如下图所示。image.png

      组件编号

      描述

      1

      排序模型的样本。

      2

      根据fg.json文件,对样本做FG操作,详情请参见fg文档

      3

      统计数值类特征的等频分箱,boundaries用于对数值类特征做离散化。

      4

      统计枚举类特征的唯一值数,用于设置模型的embedding_dimhash_bucket_size

      5

      打散rec_sln_demo_sorting模型的30天样本数据形成训练样本。

      6

      汇总rec_sln_demo_rec_sln_demo_sorting_30d_binning_v2表和rec_sln_demo_rec_sln_demo_sorting_30d_count_v2表结果,计算Feature配置信息和Step配置信息。

      7

      根据组件编号6节点的计算结果,在EasyRec配置文件中填充配置信息。

      说明

      该节点只需执行一次。

      8

      模型训练需先执行一次组件编号7节点,生成EasyRec配置文件。