并行查询

功能介绍

并行查询是基于图化架构对查询功能的扩展,将一次查询任务拆分给多个线程,来减少整体查询的延时。用户可以在query中指定并行查询的并发度。并行查询功能适用于容易发生seek timeout,导致召回结果不完全的搜索场景,例如:

  • 存在较为复杂计算逻辑的业务,包括复杂的过滤、统计、算分。

  • 计算存储分离集群,索引字典的lookup和倒排seek经常发生对远端存储的访问。

用法

  • 确定searcher worker运行环境为多核多线程

  • Ha3官方提供2、4、8、16路并行查找功能

  • 在启动参数中,描述ha3 worker需要加载几路并行(ha云上版本默认开启,用户不需要配置),格式如下--env paraSearchWays=2,4,8表示该worker支持2、4、8路并行,如果不指定该启动参数,worker会默认打开2、4路并行

  • 在query中通过指定并行查询图所在的biz,实现对并行功能的访问,例如config=cluster:general.para_search_2, ...."para_search_2"表示该次查询使用2路并行

  • 在query中通过指定并行查询图所在的biz,实现对并行功能的访问,例如config=cluster:daogou.para_search_2, ...."para_search_2"表示该次查询使用2路并行