实践教程

更新时间: 2025-02-27 14:27:42

本文将介绍如何在已有的召回引擎版实例中配置向量索引,并简单演示使用SDK方式通过向量查询检索召回引擎版实例数据。

购买OpenSearch召回引擎版实例

购买实例可参考购买OpenSearch召回引擎版实例

配置表

新购买的实例,在其详情页中,实例状态为“待配置”,并且会自动部署一个与购买的查询节点和数据节点的个数及规格一致的空集群,之后需要为该集群配置表基础信息>数据同步>索引结构>索引重建,之后才可正常搜索。

image.png

  1. 表基础信息配置,需要自定义表名称,设置分片数,设置数据更新资源数

image.png

说明
  • 表分片最大为256个(建议不超过实例数据节点数的3倍)

  • 数据更新资源数默认有2个免费资源,数据量超过2,按n-2 计费,n是单表的数据更新资源总数

  1. 配置数据源(目前支持的数据源有“MaxCompute数据源”、“API推送数据源”、“对象存储OSS”、“数据湖构建(DLF)”)这里以MaxCompute数据源为例:点击“添加数据源”,数据源类型选择“MaxCompute”,设置AccessKey、AccessKey Secret、项目名 (Project)、表名 (Table)、 表数据分区 (Partition),可按需选择是否开启“自动索引重建”。

image

  1. 数据源配置成功后,下一步配置索引结构

设置字段,至少需要定义2个字段主键字段向量字段(向量字段需要设置为多值float类型):

image.png

如果需要带有类目的向量,可以再加一个类目字段,类型要求单值或多值的整数类型:

image.png

属性和字段内容压缩

  • 属性字段可以选择是否压缩,表单模式下选项为不压缩/压缩;开发者模式中为no_compressor/file_compressor

  • 字段内容可以选择是否压缩,默认为不压缩,默认多值和STRING类型选择uniq,单值数值类型是equal

上一篇: 配置钉钉群报警 下一篇: 图片向量化检索最佳实践
阿里云首页 智能开放搜索 OpenSearch 相关技术圈