名词解释

实例相关

名称

解释

副本数

单张表的全量索引数据冗余的份数(可用于查询)。

网络信息

包括专有网络(VPC)、公网访问等信息。

API入口

SDK操作实例时使用。

查询测试

通过控制台对实例表数据进行检索。

变更历史

记录用户各项运维操作的历史记录和变更进度。

指标监控

展示查询节点和数据节点资源指标。

报警管理

与实例相关指标的报警指标、报警规则、报警联系人配置。

表相关

表基础信息

名称

解释

数据分片

索引数据存储的数据节点个数。

设置分片数时,各索引表分片数需保持一致。要求至少一个索引表分片数为1,其余索引表分片数一致。

数据更新资源数

数据更新所用资源数,每个索引默认免费提供2个4核8G的更新资源,超出免费额度的资源将产生费用。

场景模板

向量检索版提供3类模板供用户配置数据:

  • 通用模板:空模板,支持创建文本索引和向量索引,不预置任何字段及索引。

  • 向量-图片搜索:适用于通过文本描述或图片搜索其他图片内容的场景,模板内预置相关字段及索引,简化配置步骤。

  • 向量-文本语义搜索:文本向量化,适用于进行语义分析理解、构建问答式搜索等场景,模板内预制相关字段与索引,简化配置步骤。

数据处理

在选择向量-图片搜索向量-文本语义搜索时,需要选择数据处理方式,向量检索版提供两种数据处理方式:

  • 已有向量数据,即用户有自己的向量模型,不需要引擎生成向量,向量检索版实例用于向量查询。

  • 需将原始数据转为向量数据:即用户没有自己的向量模型,需要引擎将文本或图片生成向量,进行向量检索。

索引重建

将MaxCompute或OSS上的数据构建成索引的过程就叫做索引重建,产出的索引称为全量索引,索引的版本称为全量版本。

数据源信息

名称

解释

MaxCompute数据源

全量数据源,原始数据按照分区存储在MaxCompute中,增量数据可通过API推送。

API数据源

实时增量数据源,通过API推送进行数据更新。

OSS数据源

全量数据源,原始数据按照OSS的Bucket存储在OSS中,增量数据可通过API推送。

字段和索引

名称

解释

字段

字段是文档的组成单元,包含字段名称和字段内容。

多值字段

一个字段含有多个不同的值,每个值都是独立的。

主键

唯一标识一篇文档的字段。

文档

文档是可搜索的结构化数据单元,文档包含一个或多个字段,但必须有主键字段,向量检索版实例通过主键值来确定唯一的文档。主键重复则文档会被覆盖。

字段类型

每个字段所属的类型(数值、浮点、字符串等)。

向量字段

存储向量的字段,字段类型为多值Float。

需要embedding字段

存储需要被Embedding的字段(如文本、或者base64的图片),字段类型为String或Text。

多值分隔符

默认使用ha3分割符^] 进行切分(其对应UTF编码为\x1D),也可以输入自定义多值分隔符。

向量索引的包含字段

每个向量索引可包含3个字段:

  • 主键字段:字段配置中唯一的主键字段。

  • 命名空间字段:非必填项,用于进行向量检索分类或过滤。

  • 向量字段:字段配置中唯一的向量字段。

向量维度

可理解为生成的向量数组的长度。

距离类型

在向量空间中,计算两个向量之间距离的不同方法或度量方式。

向量索引算法

向量索引算法是一种用于快速搜索和检索大规模向量数据的算法。在向量检索中,常用的方法是计算两个向量之间的距离,并根据距离的大小来进行排序和检索。

实时索引

实时的向量数据Build索引。

普通索引

非向量索引,包括关键字索引。

运维相关

名称

解释

索引重建

在不变更数据来源、字段配置、索引结构的情况下,重新进行一次索引的全量构建。

停止使用/恢复使用

停止/启用表。

FSM触发和执行机制

变更类型

允许重复触发

说明

ha3_biz_apend

由系统自动触发,有且仅有一个,该变更直到实例正确添加索引表并成功构建索引后才会结束。

update_biz_depend_index_fsm

由系统自动触发有且仅有一个,该变更直到索引表成功构建索引才会自动结束。

multi_biz_activate

可以理解为实例初始化,

一个实例有且仅有一个,该变更直到实例正确添加索引表并成功构建索引后才会自动结束。

自动触发全量

检测新的数据分区后自动执行,最新的变更和历史变更并存。

手动触发全量

最新的变更和历史变更并存。

在线资源

针对同一个Zone的情况下,最新的变更执行前会终止所有旧的变更。

  • FSM:有限状态机(Finite State Machine,简称FSM)又称有限状态自动机或简称状态机,是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。

  • 重复触发:是否允许多次触发该变更类型。