交替最小二乘ALS(Alternating Least Squares)算法的原理是对稀疏矩阵进行模型分解,评估缺失项的值,从而得到基本的训练模型。在协同过滤分类方面,ALS算法属于User-Item CF(Collaborative Filtering),兼顾UserItem项,也称为混合CF。

组件配置

PAI-Studio提供ALS算法模板,您可以在PAI-Studio控制台首页的ALS实现音乐推荐区域,单击从模板创建,快速构建ALS实验。因为系统不支持使用PAI命令配置ALS矩阵分解组件的参数,所以只能通过可视化方式配置该组件参数。
页签 参数 描述
字段设置 user列名 输入数据源中,用户ID列的名称。该列数据必须是BIGINT类型。
item列名 输入数据源中,item项的列名。该列数据必须是BIGINT类型。
打分列名 输入数据源中,用户对item项的打分所在的列名。该列数据必须是数值型。
参数设置 因子数 默认值为10,取值范围为(0,+∞)
迭代数 默认值为10,取值范围为(0,+∞)
正则化系数 默认值为0.1,取值范围为(0,+∞)
是否采用隐式偏好模型 隐式偏好模型开关。
隐式偏好系数 默认值为40,取值范围为(0,+∞)
执行调优 节点个数 取值范围为1~9999。
单个节点的内存大小 取值范围为1024 MB~64*1024 MB。
例如,使用如下数据作为ALS算法模板的输入数据,可以获得输出的X矩阵和Y矩阵:
  • 输入数据源输入数据源
  • 输出的X矩阵X矩阵
  • 输出的Y矩阵Y矩阵
如果预测user1994556636项的评分,则将如下两个向量相乘即可。
#向量x。
[-0.14220297,0.8327106,0.5352268,0.6336995,1.2326205,0.7112976,0.9794858,0.8489773,0.330319,0.7426911]
#向量y。
[0.71699333,0.5847747,0.96564907,0.36637592,0.77271074,0.52454436,0.69028413,0.2341857,0.73444265,0.8352135]