更新时间:2020-08-20 18:12
干预词典是在系统无法正确纠错时,提供一种途径供用户自定义纠错行为。通过创建干预词典,并在查询分析中配置拼写检查功能时,选择对应的干预词典,可以实现对纠错的干预。
目前支持对系统内置的拼写纠错词典进行人工干预。用户实现干预操作的过程通常有以下四步:
控制台--->功能扩展--->词典管理
,进入查询分析干预词典页后,点击页面右上角的“创建”。选择了词典类型后,为词典命名,干预词典创建完成,词典会出现在页面的词典列表中。手机冲电器 -> 手机充电器
手机冲电器哪个牌子好
,假设其分词后的语义term为:手机|冲|电器|哪个|牌子|好
,那么纠错会被干预成手机充电器哪个牌子好
苹果手机冲电器价格
,假设其语义term被切分为:苹果手机|冲|电器|价格
,没有连续的语义term能够匹配上干预词条,该query就不会被干预。1.位置靠前的干预词条优先:
例如: 干预词条:中国建社->中国建设
和建社很行->建设银行
, query:中国建社很行
, 两条干预数据均在query中有连续语义term的匹配,但是由于干预词条在query中有重叠,选择位置靠前的干预词条生效,最终纠错结果为中国建设很行
。
2.位置相同的情况下,干预词条长度(语义term个数)优先:
例如: 干预词条开法->开发
和开法搜嗦->开放搜索
,query:开法搜嗦真优秀
,最终纠错结果为开放搜索真优秀
3.一个query可以有多个包含匹配的干预生效。
注意:
干预词条:
手机冲电器->手机充电器
query:
query:手机冲电器哪个排子好
结果:干预后结果:手机充电器哪个排子好
,将这个query再进行系统模型的纠错,在保证手机冲电器->手机充电器
干预生效的前提下,系统会进行进一步纠错,得到结果手机充电器哪个牌子好
。
业务场景:某电商导购类业务在OpenSearch的应用实例中配置使用了查询分析规则,规则包含拼写纠错功能,但是在线上发现了badcase,于是决定使用干预功能。
badcase:用户搜索Query“福健”,返回的结果不多,但是都完整包含了“福建”关键词,实际上该查询的相关结果有很多都没有召回。
问题诊断:用户的输入Query错误,正确的写法应该是“福建”,系统的拼写纠错没有识别出错误写法。
解决方案:新建拼写纠错干预词典,在Query“福健”下干预添加纠正词“福建”,再将该拼写纠错词典应用在线上使用的查询分析规则中。
操作步骤:
1.控制台—->功能扩展—->词典管理,创建拼写纠错词典:
填写“名称”,词典类型选择“拼写纠错”:
2.在新建的拼写纠错干预词典里新增干预词条,Query栏填写“福健”,纠正词栏填写“福建”,干预类型选择“添加”:
3.在查询分析界面把刚刚创建的“拼写纠错干预词典”先应用在一个未上线的查询分析规则中,以便进行搜索效果测试:
4.搜索测试是否符合预期效果。发现搜索结果召回了改写成“福建”的结果,符合预期:
在文档使用中是否遇到以下问题
更多建议
匿名提交