更新时间:2020-12-18 10:23
模糊搜索是指在用户搜索意图不明确时,搜索引擎将用户的查询(query)与待检索的内容(doc)进行模糊匹配,找出与查询相关的内容。是否相关主要从两个方面衡量:一是query是doc中某些内容的全拼或者简拼;二是query中内容直接在doc中出现。模糊搜索无法精确理解用户的查询意图,返回的结果中可能包括了一大批用户不想要的信息,所以在使用模糊搜索时一定要结合自己的实际场景,慎重使用。
模糊搜索主要用户搜索意图不明确或者数据较少想返回更多查询结果的时候。主要包括以下场景。
介绍:拼音搜索是指doc中的数据为中文,而希望使用全拼或者简拼进行查询的搜索。
案例:
文档内容为:开放搜索
query分别为:”kai”、”kaifang”、”sousuo”、 “kaifangsousuo”、”k”、”kf”、”ss”、”kfss”,
均能将此条doc召回
注意事项:
介绍:前缀搜索是指搜索以指定前缀开头的内容的检索。
案例:
#模糊搜索支持的前缀标识符为’^’,如果用户想搜以138开头的手机号
query可写成”^138”(注意是双引号查询)
注意事项:
介绍:后缀搜索是指搜索以指定后缀结尾的内容的检索。
案例:
#模糊搜索支持的后缀标识符为’$’,如果用户想搜以9527结尾的手机号
query可以写成”9527$”(注意是双引号查询)
注意事项:
介绍:模糊搜索支持单字或单字母搜索。单字或单字母这种使用场景主要是为了扩大召回结果,返回的结果可能不是很准确。
案例:
#文档内容为:’开放搜索 open search’
query=default:’放’ 或者 query=default:’o’ 都能将其召回
介绍:短语查询按双引号限制位置关系,并且只有连续的字母和数字可以用短语查询。
案例:
#1.query=default:"开放搜索"
仅能召回文档内容为“xxx开放搜索xxx”的文档,不能召回“xxx搜索 开放xxx”的文档;
#2.query=default:"华为P"
不能召回“华为P20”的文档,因为不符合“只有连续的字母和数字可以用短语查询”的规则。这种场景请使用单引号进行查询。
注意事项:
用户创建应用时,将需要进行模糊搜索的字段设置为short_text,并给该字段设置一个模糊分析器即可使用模糊搜索。模糊搜索返回的结果默认按照命中的词在字段的前后位置进行排序。比如某个应用的title字段需要模糊搜索,doc1的内容为开放搜索,doc2的内容为喜欢使用开放搜索,当搜索”kfss”时,doc1默认会排在doc2的前面。模糊搜索在用于查询意图不明确时能够很好满足用户的需求,但在使用过程中需要注意如下限制:
在文档使用中是否遇到以下问题
更多建议
匿名提交