本文通过PAI提供的文本分析组件,实现简单的商品标签自动归类系统。
背景信息
通常每件商品的描述会包含很多维度标签。例如,一双鞋子的商品描述可能是“韩都少女英伦风系带马丁靴女磨砂真皮厚底休闲短靴”。一个包的商品描述可能是“天天特价包包2016新款秋冬斜挎包韩版手提包流苏贝壳包女包单肩包”。这些维度可以包含时间、产地及款式等,如何按照特定维度将数以万计的商品进行归类是电商平台的难题之一,其中最大的挑战是如何从商品描述中抽取维度标签。PAI提供的文本分析组件可以自动学习标签词语,从而实现标签自动归类。
数据集
本实验数据是整理的一份2016年双十一购物清单,共两千多条商品描述,每一行表示一件商品的标签聚合,如下图所示。

相似标签自动归类
- 进入PAI-Studio控制台。
- 登录PAI控制台。
- 在左侧导航栏,选择 。
- 在PAI可视化建模页面,单击进入机器学习。
- 创建空白实验。
- 构建实验流程并运行。
在文档使用中是否遇到以下问题
更多建议
匿名提交