本文阐述了查询中每个词在文本中的重要性,并将其量化为权重。权重较低的词可能不参与召回,以避免当用户输入包含此类低权重词的查询时,仍受这些词的限制而导致召回结果过少。
功能介绍
示例:查询词:“OpenSearch好不好”:
未使用词权重改写前的query为:query=default:'opensearch' AND default:'好不好'
经过词权重处理后改写query为:query=default:'opensearch' RANK default:'好不好'
因此,只要包含“opensearch”的文档都可以被召回。
功能使用流程
开放搜索控制台选择左侧导航栏中的“召回配置”下方对应的“查询分析配置”,选择对应的应用名和应用类型(线上/线下)点击创建:
输入“规则名称”,选择“索引范围”,选择“行业类型”,功能选择选中“词权重”,点击“确定”:
规则创建完毕后,可以进行搜索效果测试:
测试效果:
查看查询分析过程:
调试无误后,在查询分析界面,切换到“索引视角”,将对应的自定义查询分析设置为默认查询分析:
设置默认自定义查询分析后的界面效果:
词权重干预词典
业务场景不一样,query分词后的term其权重也会有所差异,会存在系统内置词典对词权重的设定与用户需求有差异的情况出现。因此,提供了干预功能,供用户自定义词权重。通过创建词权重干预词典,并在查询分析中生效该干预词典,就可以起到词权重的干预效果。具体词权重干预词典配置及原理,请点击此处。
该文章对您有帮助吗?