向量索引通用配置

在配置表时索引结构部分可以对向量索引进行高级配置,以下将详细说明这些高级版配置的参数含义。

在创建表时,第四步配置索引结构中,有关于向量索引的通用配置:

cn向量索引结构配置.png

高级配置展开如下:

image.png

各配置说明如下:

配置

可选值

含义

向量维度

-

向量维度是指向量所具有的特征或属性的数量。向量维度的大小决定了向量所能表达的信息和特征的复杂程度。向量维度的配置需要根据用户的向量模型生成的向量进行配置。

距离类型

  • 欧式距离(SquareEuclidean)

  • 内积距离(InnerProduct)

欧式距离向量得分越小越相关。

内积距离向量得分越大越相关。

向量索引算法

  • Qc

  • HNSW

  • Linear

  • QGraph

  • CAGRA

详情可参考:向量介绍

实时索引

  • true

  • false

选择true则表示开启实时索引,用户通过API推送的实时数据,实例可实时构建向量,以供实时查询。

实时索引参数

{"proxima.oswg.streamer.segment_size":2048}

建议保持默认值

实时检索参数

-

不同的向量索引算法该参数的配置方式不同,详情可参考:

向量分隔符

可自定义

向量检索时各维度使用的分隔符(如vector:'1.05066,0.15610,0.156145...' 其中分隔符为逗号)

线性构建的阈值

默认为5000

表示数据量在5000以内用线性。

忽略有问题的向量数据

  • true

  • false

当向量维度不正常,向量数据为空时,该参数配置为true,则不影响全量/批次增量数据的构建。