电商行业算法版介绍
搜索效果的好坏在电商行业中直接决定着GMV的转化,这也是电商企业不断深耕突破的技术难题。行业算法版根据多年积累的行业经验打造了特有的电商行业垂直解决方案,借助达摩院先进的智能语言处理技术,贴合行业痛点与需求,提供了电商专属查询分析能力、内置好行业排序表达式及行业算法能力,降低接入门槛,实现一键式配置,提升接入效率的同时也为企业提供更优质的搜索效果。
二者功能差异
功能列表 | 通用版 | 行业模板 |
一站式配置 | 创建应用后,需要手动创建并配置查询分析、排序策略和下拉提示模型。 | 结合电商行业常见搜索场景,选择所需能力及功能,同时提供应用结构模板和索引结构模板,实现一键式配置,降低新用户使用门槛。 |
查询分析 | 针对通用行业提供同义词拓展、停用词省略、拼写纠错、词权重分析、类目预测等能力。 | 针对电商通用行业及潮流、母婴、汽车、餐饮等常用垂类提供增强版分析器与查询分析功能。结合电商行业商品及用户特征,更精准的构建索引并识别用户查询意图,与通用版相比效果更优。 |
策略排序 | 创建应用后,需要结合业务场景手动配置并调试相应的排序策略。 | 在应用结构模板和索引结构模板基础上,提供电商行业常用基础排序、业务排序表达式,无需额外配置即可满足大部分电商行业排序效果需求。 |
功能迭代 | 定期更新分析器、查询分析等系统默认词典。 | 根据电商行业的名词、产品等变化,不断迭代更新,优化原有分词、查询分析能力,提供更高时效性的服务保障。 |
查询分析效果对比
行业算法版较通用版相比在查询分析功能上做出了更深入的优化,不仅在通用版的基础上更新了常见bad case,而且针对电商行业集各家之所长,丰富已有词库,如下根据各个功能举例:
分词:(以空格分词)
query | 通用版 | 行业增强版 |
汉本萃 纽崔莱 | 汉 本 萃 纽崔莱 | 汉本萃 纽崔莱 |
小金管遮瑕膏 | 小金 管 遮瑕 膏 | 小 金管 遮瑕 膏 |
苏泊尔空气炸锅 | 苏泊尔 空气 炸 锅 | 苏泊尔 空气 炸锅 |
寻梦环游记吉他 | 寻梦 环 游记 吉他 | 寻梦 环游记 吉他 |
炸街西装套装 | 炸 街 西装 套装 | 炸街 西装 套装 |
喜戈洗发水 | 喜 戈 洗发 水 | 喜戈 洗发 水 |
橘朵单色眼影 | 橘 朵 单色 眼影 | 橘朵 单色 眼影 |
实体识别:
query | 通用版 | 行业增强版 |
苹果 11 壳 女款 | 苹果:品类 11:数字 壳:普通词 女款:人群 | 苹果:品牌 11:数字 壳:品类 女款:人群 |
汉本萃 纽崔莱 | 汉本萃:普通词 纽崔莱:品牌 | 汉本萃:品牌 纽崔莱:品牌 |
蔬菜苗 | 蔬菜苗:新词 | 蔬菜苗:品类 |
美瞳 | 美瞳:普通词 | 美瞳:品类 |
同义词:
query | 通用版 | 行业增强版 |
阔腿裤女2021年新款 | 阔腿裤 女 2021年 新款 | 阔腿裤(腿裤 阔脚裤 甩裤)女 2021年 新款 |
汉本萃纽崔莱 | 汉本萃 纽崔莱 | 汉本萃 纽崔莱(nutrilite) |
运动鞋女跑步鞋 | 运动鞋 女 跑步鞋(跑鞋) | 运动鞋 女 跑步鞋(跑鞋 慢跑鞋 健步鞋) |
苏泊尔空气炸锅 | 苏泊尔 空气 炸锅 | 苏泊尔(supor 苏泊儿 苏伯尔) 空气 炸锅 |
洗碗机西门子 | 洗碗机 西门子 | 洗碗机 西门子(siemens) |
拼写纠错:
query | 通用版 | 行业增强版 |
无刚圈文胸 | 无刚圈文胸 | 无钢圈文胸 |
putizhu | putizhu | 菩提珠 |
baisiwa | baisiwa | 白丝袜 |
红色baobao 女包 | 红色baobao 女包 | 红色包包 女包 |
sushe 冰箱 | sushe 冰箱 | 宿舍 冰箱 |
chuanglian欧美 | chuanglian欧美 | 窗帘欧美 |
孕妇装dama | 孕妇装dama | 孕妇装大码 |
u型枕 nami | u型枕 nami | u型枕 纳米 |
按磨器 腰部 | 按磨器 腰部 | 按摩器 腰部 |
yami | yami | 雅蜜 |
yingyang | yingyang | 营养 |
jiankang | jiankang | 健康 |
呀高 | 呀高 | 牙膏 |
独享型转行业算法版
行业算法版支持应用从独享型通用行业转为电商行业算法版,具体操作下:
(1)在实例管理页面选择一个通用版应用,点击 更多,选择转为行业增强版,会跳转到售卖页:
(2) 升级为电商行业算法版后,在实例管理下找到对应的实例点击详情,点击 行业模板适配,对应用进行变更:
(3)应用变更,步骤为:功能选择 --> 应用结构, --> 索引结构 --> 数据源:
1)功能选择:模板功能选择包括查询分析、排序策略和周边服务:
2)应用结构:支持自动生成应用结构
注意:字段标签用于快速生成索引结构,查询分析规则和排序策略,请务必在应用结构中添加字段标签所对应的字段名称,操作见如上截图。
3)索引结构:
注意:索引标签用于快速生成查询分析规则,排序策略,请务必在索引结构中添加索引标签所对应的索引名称,操作见如上截图。
4)数据源:(下面以RDS数据源为例进行说明)
(5)搜索结果排序:
如果排序表达式中引用的字段有变更,需要编辑或者删除失效的排序表达式。
(6)修改查询分析:
修改查询分析时需注意以下3点:
原先查询分析引用的索引类型改成电商增强;
查询分析中实体识别如有引用干预词典,干预词典的类型也需要改成行业-电商通用分析的分析器;
(7)修改配置完成后,选择是否同步增量数据以及是否需要线下版本变更后自动发布上线:
如果此处选择了“不同步,线下应用将全新推送数据”,那么在版本构建期间如有增量数据进入应用,则不会同步到构建中的版本里。
如果此处选择了“不需要”自动发布上线,那么后续手动切换,需要在线下应用详情页中点击“发布上线”。
(8)配置完成及测试:
注意事项
电商行业算法板的创建流程可参考文档:电商行业算法版
独享型通用行业应用可转为电商行业算法版,此操作不可逆;
电商行业算法版仅适用于独享型应用;
如果是共享型应用需变规格到独享型再进行电商行业算法版适配,需要线上应用规格与实例规格一致(同为独享型)后再进行电商行业算法版适配操作;
应用结构中务必添加字段标签所对应的字段名称,否则会报错;
索引结构中务必添加索引标签所对应的索引名称,否则不能进行下一步: