向量检索算法 | 优势 | 劣势 | 场景 |
量化聚类(Quantized Clustering) | CPU、内存资源占用较低。 |
| 适用于亿级别数据集,对数据准确性和查询延迟要求不是非常高的场景。 |
HNSW(Hierarchical Navigable Small World) | 召回率高、查询速度快。 | CPU、内存资源占用较高。 | 适用于千万级别数据集,并且对数据准确性和查询延迟有严格要求的场景。 |
linear | 召回率100%。 |
| 适用于万级别的数据。 |
QGraph(Quantized Graph) | CPU、内存资源占用低,耗时短,查询性能高。 | 召回率较HNSW低。 | 适用于海量数据(十亿级以上),对查询耗时和查询性能要求较高,对准确性要求不苛刻的场景。 |
CAGRA | GPU算法,性能是CPU的数倍甚至数十倍。 | GPU成本高,性价比在低QPS场景下不明显。 | 适用于高QPS,低耗时要求的场景。 |
DiskANN 说明 仅数据节点规格族为SSD时支持DiskANN算法 | 索引可以放磁盘,内存占用低。 | 查询耗时较高,吞吐低。 | 大数据量(数十亿级),内存有限,延迟不敏感场景。 |
该文章对您有帮助吗?