文档

中文通用分析器

分析器介绍

中文通用分析器(chn_standard),基于中文语义分词,适用于全网通用行业的分析器。中文分析器按照检索单元(最小粒度)进行分词,并且支持扩展分词。例如:文档字段内容为“菊花茶”,分词之后的结果为“菊花 茶 花茶”,其中花茶是茶的扩展分词。

例如:
原始内容:菊花茶 
中文通用分析器:菊花  茶 花茶

分词干预

修改高级配置中的chn_standard.dict并发布上线即可进行分词干预。分词干预的词条是一个中粒度的词条,引擎内部会对干预的词条再次进行切分成检索粒度。比如干预“搜索引擎”的分词时,在词条中添加搜索引擎,搜索引擎还会继续分词成“搜索”、“引擎”两个词。

注意事项

  • 该分析器只适用于TEXT类型字段,在配置schema的时候指定分析器为chn_standard。

  • 本页导读 (0)
文档反馈