单doc多向量检索

功能说明:用户可以在一个doc中的某个向量字段中存储多个向量内容进行检索,例如向量维度为128维,向量字段中可以存储256(两个向量)、384(三个向量)等等向量维度的整数倍个向量,查询时可以通过向量命中字段中的任何一个向量进行召回。

使用场景:在长文本切片后,将每个切片的文档进行向量化,可以将所有切片向量存储在一个向量字段中进行检索。

使用说明

这里以一个128维的向量进行举例:

image.png

向量字段为vector,向量索引是128维,如果需要单doc多向量检索,只需要在推送数据时给vector字段推送128的整数倍的向量即可,不同向量的分隔符和vector字段的多值分隔符保持一致即可,例如多值分隔符为逗号,一个字段里存3个向量可以:

image.png

检索时使用正常的检索方式,检索128维的向量即可,被检索的doc中命中其中一个向量该doc就会被召回。

在排序算分阶段,如果一个doc中的多个向量均被命中,则以多个向量中最优(欧式距离是分数越小越相关,内积距离是分数越大越相关)的分数为该doc的向量相似度得分。