text_relevance

特征函数项

特征函数项可以用到排序表达式中(大部分仅支持精排表达式),可以通过各种语法及语句的组合得到强大的排序功能。

其中特征函数参数出现的文档字段需根据对应函数文档提示,创建为索引或属性.

text_relevance : 关键词在字段上的文本匹配度。

1.详细用法:

text_relevance(field_name,index_name,params )

2.参数:

  • field_name:字段名,必选,该字段需要为中文基础分词、中文基础分词、自定义分词、单字分词等类型,并且配置了索引字段。

  • index_name:field_name对应的索引名称,可选。

  • params :算分逻辑,可选默认为sum,true表示由查询分析扩展出的索引分组文档打分取max,false表示由查询分析扩展出的索引分组文档打分取sum。(例,query=index:'肯德基',同义词扩展:query=index:'肯德基' OR index:'kfc')。

3.返回值:

float,值域为[0,1]

4.适用场景:

场景1:在精排中对title和body进行文本算分,权重比为3:1 text_relevance(title)*3+text_relevance(body)

场景2:在精排中对title字段对应的索引title_index进行文本算分,并且查询分析扩展后的索引分组文本打分结果取sum,text_relevance(title,title_index,false)

5.注意事项:

  • 函数参数依赖字段需创建为索引

  • 主要衡量角度:命中词在query中所占比重;命中词在字段中所占比重;命中词在字段中出现的频率;字段中命中词之间的顺序关系与query中命中词之间的顺序关系。

  • 该feature目前只用于精排排序。