全部产品

query_min_slide_window

更新时间:2017-06-07 13:26:11

特征函数项

特征函数项可以用到排序表达式中(大部分仅支持精排表达式),可以通过各种语法及语句的组合得到强大的排序功能。其中特征函数参数出现的文档字段需根据对应函数文档提示,创建为索引或属性.

query_min_slide_window:查询词在某个字段上命中的分词词组个数与该词组在字段上最小窗口的比值

  1. 详细用法:
    query_min_slide_window(field_name, in_order=false)

  2. 参数:
    field_name:要统计的字段,该字段需要为TEXT、中文基础分词、自定义分词、单字分词、英文分词、模糊分词类型。
    in_order:true|false,默认为false。表示进行滑动窗口比较时,窗口中词组的顺序是否必须和查询词中的保持一致。

  3. 返回值:
    float,值域为[0, 1]

  4. 适用场景:
    场景1:计算查询词在title上的最小窗口
    query_min_slide_window(title)

    场景2:判断title字段中是否存在于查询词中相同的子序列
    if(query_min_slide_window(title, true) > 0.99, 1, 0)

  5. 注意事项:

  • 函数参数依赖字段需创建为对应类型索引
  • 可以用于精排表达式;
  • 从字面上衡量query在field_name字段上紧密度情况;
  • 影响滑动窗口计算的有两个因素,query在field_name字段上命中的term的个数和包含这些term的最小窗口。