您可以通过PAI-Studio预置的FM算法模板,快速构建推荐模型。

背景信息

FM(Factorization Machine)算法兼顾特征之间的相互作用,是一种非线性模型,适用于电商、广告及直播等推荐场景。PAI-Studio提供的FM算法模板包括FM训练、FM预测及评估组件。

操作步骤

  1. 进入PAI-Studio控制台首页。
    1. 登录PAI控制台
    2. 在PAI控制台首页,选择模型开发和训练 > Studio-可视化建模
    3. PAI可视化建模页面,单击操作列下的进入机器学习进入PAI-Studio控制台首页
  2. 构建实验。
    1. 在左侧导航栏,单击首页
    2. 模板列表FM算法实现推荐模型区域,单击从模板创建
    3. 新建实验页面,输入名称描述
    4. 单击确定
    5. 等待大约十秒钟,实验构建成功后如下图所示。FM模型
  3. 配置FM训练组件参数。
    1. 单击实验中的FM训练组件。
    2. 在右侧的字段设置页签,配置输入数据。
      参数 描述
      特征列 特征数据的格式为key:value,多个特征以英文逗号(,)分隔。
      标签列 仅支持DOUBLE类型。
      PAI-Studio提供的FM算法仅支持LibSVM格式数据(针对其他格式数据,可以通过Onehot组件将其转化为LibSVM格式数据),且输入数据必须包括特征列和标签列,如下图所示。输入数据
    3. 在右侧的参数设置执行调优页签,配置训练参数。
      针对1.2亿条样本数据、130万特征数据场景,建议参考如下表格进行参数配置,其他参数使用默认值。您可以结合实际数据量级,适当地调整训练参数。
      页签 参数 描述
      参数设置 学习率 建议配置为0.005。如果训练发散,则适当减小该参数值。
      维度 建议配置为1,1,16
      数据块大小 如果特征数据量小于200万,则建议配置为1000000。如果特征数据量大于200万,则无需手动配置。
      执行调优 节点个数 建议配置为32。如果数据量超大,则适当增大该参数值。
      单个节点内存大小 建议配置为16384 MB。
  4. 单击画布上方的运行
  5. 右键单击实验中的二分类评估组件,在快捷菜单,单击查看评估报告
    基于预置模板案例的数据,PAI-Studio FM算法生成模型的AUC值约为0.97。评估结果