更新时间:2020-10-26 17:49
目前实体识别的干预主要包括两个对实体识别结果本身的干预,以及实体类型重要性的干预。当实体识别的结果不准时,可以通过实体识别的干预来进行解决。
通过创建实体干预的词典,并在查询分析中实体识别中配置相应的干预词典,可以干预实体识别的结果。
由于语义实体是和分词器密切相关的,因此,创建实体识别干预词典时,必须选择分析器。且在查询分析配置使用时,只有索引对应的分析器和干预词典的分词器一致,才能被选择使用。
注意:
为了方便用户使用,当前系统提供默认的实体重要性配置。用户可以根据实际业务情况,自主的调整配置。这块调整会影响query的改写规则。
注意:
目前支持对系统内置的实体识别词典进行人工干预。用户实现干预操作的过程通常有以下四步:
控制台--->功能扩展--->词典管理
,进入查询分析干预词典页后,点击页面右上角的“创建”。选择了词典类型后,为词典命名,干预词典创建完成,词典会出现在页面的词典列表中。业务场景:某电商导购类业务在OpenSearch的应用实例中配置使用了查询分析规则,规则包含实体识别功能,但是在线上发现了badcase,于是决定使用干预功能。
badcase:用户搜索Query“香奈儿气垫”,默认的实体识别,将“香奈儿”归类为“普通词”;“气垫”归类为“材质”。 改写query后为,title:’气垫’ RANK title:’香奈儿’。但业务上“香奈儿”不是普通词。
问题诊断:业务特殊专有名词,需要进行实体识别干预。
解决方案:新建实体识别干预词典,再将该干预词典应用在线上使用的查询分析规则中。
操作步骤:
1.在控制台—->功能扩展—->词典管理,创建实体识别词典::
填写“名称”,词典类型选择“实体识别”,干预词条选择“电商类型的分析器”(仅支持电商分词类型配置实体识别):
2.在新建的实体识别干预词典里新增干预词条,填写query,并修改系统识别结果:
原始的错误识别实体结果:
干预后的结果:
注意:干预类型中,完整匹配表示输入Query与干预Query完全相同时进行干预;部分匹配表示输入Query与干预Query完全相同时进行干预。
3.在查询分析界面把刚刚创建的“实体识别干预词典”先应用在一个未上线的查询分析规则中,以便进行搜索效果测试:
注意:是否忽略空格功能指当在使用实体识别干预时是否忽略query中的空格(默认不开启),例:输入Query:“连衣裙 女” ,干预词条:“连衣裙女”,选择“是”则按干预词典中的实体词进行干预,选择“否”则不进行干预。
4.搜索测试是否符合预期效果:(召回了有关“香奈儿气垫”的doc)
在文档使用中是否遇到以下问题
更多建议
匿名提交