CagraHnsw配置

build参数

参数值

类型

默认值

说明

proxima.cagra_hnsw.index.graph_degree

int

64

图索引中每个节点(向量)的邻居数量。该参数影响索引质量和查询性能。增加该值通常会提高召回率,但会增加索引构建时间和内存占用,并可能降低查询QPS。

取值约束:必须是 32 的倍数。

proxima.cagra_hnsw.index.intermediate_graph_degree

int

128

最终产出图索引前需要对点的邻居进行裁剪,此参数用于控制裁剪前点的邻居数量,proxima.cagra_hnsw.index.graph_degree为裁剪后的邻居数量。

取值约束:必须是 32 的倍数,且必须大于或等于 proxima.cagra_hnsw.index.graph_degree

search参数

参数名

类型

默认值

说明

proxima.hnsw.searcher.ef

uint32

500

用于控制在线检索时考察的子图范围大小。该值越大,召回越高,性能越差,建议取值[100,1000]。

proxima.hnsw.searcher.max_scan_ratio

float

用于控制在线检索时扫描点的比例,该值越大召回越高,性能越差。

proxima.hnsw.searcher.brute_force_threshold

uint32

用于控制在线检索时最少扫描的点的个数,如果该数值大于单分片的文档个数,查询退化为暴力检索。