词权重

本文阐述了查询中每个词在文本中的重要性,并将其量化为权重。权重较低的词可能不参与召回,以避免当用户输入包含此类低权重词的查询时,仍受这些词的限制而导致召回结果过少。

功能介绍

示例:查询词:“OpenSearch好不好”:

未使用词权重改写前的query为:query=default:'opensearch' AND default:'好不好'

经过词权重处理后改写query为:query=default:'opensearch' RANK default:'好不好'

因此,只要包含“opensearch”的文档都可以被召回。

功能使用流程

  1. 开放搜索控制台选择左侧导航栏中的“召回配置”下方对应的“查询分析配置”,选择对应的应用名和应用类型(线上/线下)点击创建

    image

  2. 输入“规则名称”,选择“索引范围”,选择“行业类型”,功能选择选中“词权重”,点击“确定”

    image

  3. 规则创建完毕后,可以进行搜索效果测试:

    image测试效果:image

    查看查询分析过程:

    image

  4. 调试无误后,在查询分析界面,切换到“索引视角”,将对应的自定义查询分析设置为默认查询分析

    image

  5. 设置默认自定义查询分析后的界面效果:

    image

词权重干预词典

业务场景不一样,query分词后的term其权重也会有所差异,会存在系统内置词典对词权重的设定与用户需求有差异的情况出现。因此,提供了干预功能,供用户自定义词权重。通过创建词权重干预词典,并在查询分析中生效该干预词典,就可以起到词权重的干预效果。具体词权重干预词典配置及原理,请点击此处