名词解释
实例相关
名称 | 解释 |
副本数 | 单张表的全量索引数据冗余的份数(可用于查询) |
网络信息 | 包括专有网络(VPC)、公网访问等信息 |
API入口 | SDK操作实例时使用 |
查询测试 | 通过控制台对实例表数据进行检索 |
变更历史 | 记录用户各种运维操作的历史记录和变更进度 |
指标监控 | 展示查询节点和数据节点资源指标 |
报警管理 | 与实例相关指标的报警指标、报警规则、报警联系人配置 |
表相关
表基础信息
名称 | 解释 |
数据分片 | 索引数据存储的数据节点个数(分片数设置时,各索引表分片数需保持一致;或至少一个索引表分片数为1,其余索引表分片数一致,规则详情可见参考文档) |
数据更新资源数 | 数据更新所用资源数,每个索引默认免费提供2个4核8G的更新资源,超出免费额度的资源将产生费用,详见:产品文档 |
场景模板 | 向量检索版提供了3类模板供用户配置数据:
|
数据处理 | 在选择“向量-图片搜索”或“向量-文本语义搜索”时,需要选择数据处理方式,向量检索版提供两种数据处理方式:
|
索引重建 | 将MaxCompute或oss上的数据构建成索引的过程就叫做索引重建,产出的索引成为全量索引,索引的版本称为全量版本。 |
实时 | API推送的数据实时生效,这一流程成为实时。 |
数据源信息
名称 | 解释 |
MaxCompute数据源 | 全量数据源,原始数据按照分区存储在MaxCompute中。增量数据可通过API推送 |
API数据源 | 实时增量数据源,通过API推送进行数据更新。 |
OSS数据源 | 全量数据源,原始数据按照OSS的bucket存储在OSS中。增量数据可通过API推送 |
字段和索引
名称 | 解释 |
字段 | 字段是文档的组成单元,包含字段名称和字段内容。 |
多值字段 | 一个字段含有多个不同的值,每个值都是独立的。 |
主键 | 唯一标识一篇文档的字段。 |
文档 | 文档是可搜索的结构化数据单元。文档包含一个或多个字段,但必须有主键字段,向量检索版实例通过主键值来确定唯一的文档。 主键重复则文档会被覆盖。 |
字段类型 | 每个字段所属的类型(数值、浮点、字符串等等) |
向量字段 | 存储向量的字段,字段类型为多值FLOAT |
需要embedding字段 | 存储需要被embedding的字段(比如文本、或者base64的图片),字段类型为STRING或TEXT |
多值分隔符 | 默认使用ha3分割符^] 进行切分(其对应utf编码为\x1D),也可以输入自定义多值分隔符 |
向量索引的包含字段 | 每个向量索引可包含3个字段:
|
向量维度 | 可理解为生成的向量数组的长度 |
距离类型 | 在向量空间中,计算两个向量之间距离的不同方法或度量方式。 |
向量索引算法 | 向量索引算法是一种用于快速搜索和检索大规模向量数据的算法。在向量检索中,常用的方法是计算两个向量之间的距离,并根据距离的大小来进行排序和检索。 |
实时索引 | 实时的向量数据build索引 |
普通索引 | 非向量索引,包括关键字索引 |
运维相关
名称 | 解释 |
索引重建 | 在不变更数据来源、字段配置、索引结构的情况下,重新进行一次索引的全量构建 |
停止使用/恢复使用 | 停止/启用表 |
FSM触发和执行机制
变更类型 | 允许重复触发 | 说明 |
ha3_biz_apend | 否 | 由系统自动触发有且仅有一个,该变更可能持续运行好几天,直到实例正确添加索引表并成功构建索引后才会自动结束。 |
update_biz_depend_index_fsm | 否 | 由系统自动触发有且仅有一个,该变更可能持续运行好几天,直到索引表成功构建索引才会自动结束。 |
multi_biz_activate | 否 | 可以理解为实例初始化, 一个实例有且仅有一个,该变更可能持续运行好几天,直到实例正确添加索引表并成功构建索引后才会自动结束。 |
自动触发全量 | 是 | 发现新的数据分区后自动执行,最新的变更和历史变更并存 |
手动触发全量 | 是 | 最新的变更和历史变更并存 |
在线资源 | 是 | 针对同一个zone的情况下,最新的变更执行前会终止所有旧的变更 |
FSM:有限状态机(Finite State Machine:FSM)又称有限状态自动机或简称状态机,是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。
重复触发:是否允许多次触发该变更类型