文档

词权重

更新时间:

功能介绍

该功能主要分析了查询中每一个词在文本中的重要程度,并将其量化成权重,权重较低的词可能不会参与召回。这样可以避免当用户输入的查询词中包含一些权重低的词时,仍然按用户输入的查询词限制召回,导致命中结果过少。

例:查询词:“OpenSearch好不好”:

未使用词权重改写前的query为:query=default:'opensearch' AND default:'好不好'

经过词权重处理后改写query为:query=default:'opensearch' RANK default:'好不好'

因此,只要包含“opensearch”的文档都可以被召回。

功能使用流程

1.开放搜索控制台选择左侧导航栏中的“召回配置”下方对应的“查询分析配置”,选择对应的应用名和应用类型(线上/线下)点击创建

image

2.输入“规则名称”,选择“索引范围”,选择“行业类型”,功能选择选中“词权重”,点击“确定”

image

3.规则创建完毕后,可以进行搜索效果测试:

image测试效果:image

查看查询分析过程:

image

4.调试无误后,在查询分析界面,切换到“索引视角”,将对应的自定义查询分析设置为默认查询分析

image

5.设置默认自定义查询分析后的界面效果:

image

词权重干预词典

业务场景不一样,query分词后的term其权重也会有所差异,会存在系统内置词典对词权重的设定与用户需求有差异的情况出现。因此,提供了干预功能,供用户自定义词权重。通过创建词权重干预词典,并在查询分析中生效该干预词典,就可以起到词权重的干预效果。具体词权重干预词典配置及原理,请点击此处

  • 本页导读 (0)
文档反馈