本文将介绍如何在已有的召回引擎版实例中配置向量索引,并简单演示使用SDK方式通过向量查询检索召回引擎版实例数据。
购买OpenSearch召回引擎版实例
购买实例可参考购买OpenSearch召回引擎版实例。
配置表
新购买的实例,在其详情页中,实例状态为“待配置”,并且会自动部署一个与购买的查询节点和数据节点的个数及规格一致的空集群,之后需要为该集群配置表基础信息>数据同步>索引结构>索引重建,之后才可正常搜索。
表基础信息配置,需要自定义表名称,设置分片数,设置数据更新资源数:
说明
表分片最大为256个(建议不超过实例数据节点数的3倍)
数据更新资源数默认有2个免费资源,数据量超过2,按n-2 计费,n是单表的数据更新资源总数
数据同步,配置全量数据源(目前支持的数据源有MaxCompute数据源和API推送数据源、对象存储OSS)这里以MaxCompute数据源为例:点击“添加数据源”,数据源类型选择“MaxCompute”,设置project、accesskeyID、accesskeyId、accesskeySecret、Table、分组键partition,可按需选择是否开启“自动索引重建”:
数据源配置成功后,下一步配置索引结构:
3.1. 设置字段,至少需要定义2个字段主键字段和向量字段(向量字段需要设置为多值float类型):
如果需要带有类目的向量,可以再加一个类目字段,类型要求单值或多值的整数类型:
属性和字段内容压缩:
属性字段可以选择是否压缩,表单模式下选项为不压缩/压缩;开发者模式中为no_compressor/file_compressor
字段内容可以选择是否压缩,默认为不压缩,默认多值和STRING类型选择uniq,单值数值类型是equal
文档内容是否对您有帮助?