快速入门

更新时间:
复制 MD 格式

前置条件

  1. 成功注册阿里云账号并通过实名认证

  2. 开通阿里云账号并登录控制台时,会提示先创建access key才能继续使用。

  • 创建及使用应用依赖access key参数,主账号下access key参数不能为空。

  • 在为主账号创建access key参数后,还可以再创建RAM子账号access key通过RAM子账号进行访问,RAM子账号赋予对应的访问权限,请参考RAM鉴权

  1. 需要用户拥有VPC环境,详情可什么是专有网络VPC进行查看。

说明:

如果需要使用子账号操作召回引擎版实例,请使用主账号为子账号授予AliyunSearchEngineFullAccessAliyunSearchEngineReadOnlyAccess 权限

购买实例

实例购买可参考:购买OpenSearch召回引擎版实例

配置集群

说明:

新购买的实例,在其详情页中,实例状态为“待配置”,并且会自动部署一个与购买的查询节点和数据节点的个数及规格一致的空集群。

1、选择需要配置的实例,点击配置

2、按要求提填写表名称,选择分片数,数据更新资源数,然后点击下一步。

说明

名称:由字母、数字或下划线组成,最大25字符。

分片数:请填写不超过256的正整数, 用于提升全量构建速度、单次查询性能。

数据更新资源数:实时数据更新资源数,调整资源可以扩大消费实时数据的并发数,从而提高TPS。

3、配置数据源(目前支持的数据源有“MaxCompute + API 数据源”、“OSS + API 数据源”、“API 数据源”、数据湖构建(DLF)),本文以MaxCompute数据源为例,配置完参数可按需选择是否开启“自动索引重建”,校验通过后,点击下一步。

配置 MaxCompute 数据源时需填写以下参数:AccessKeyAccessKey Secret项目名(Project)(以字母开头,仅包含字母、数字和下划线,长度 3~28 位)、表名(Table)(以字母开头,仅包含字母、数字和下划线,长度 1~128 位)、表数据分区(Partition)(多级分区间使用逗号分隔)。填写完成后单击 校验 按钮通过数据来源校验,方可单击 下一步

4、勾选主键、属性字段、搜索结果展示字段、选择数据是否压缩和对应的字段对应的分析方式

属性和字段内容压缩

  • 属性字段可以选择是否压缩,默认为不压缩,选择file_compressor表示开启压缩

  • 字段内容可以选择是否压缩,默认为不压缩,默认多值和STRING类型选择uniq,单值数值类型是equal

说明
  • 如果开启了属性压缩,建议前往「集群管理-节点状态-表加载策略」编辑索引加载方式,以此降低对性能的影响。

  • 配置分析方式的字段类型必须为TEXT类型。

  • 支持复制字段操作,复制出的新字段(DUP字段)与原字段内容保持一致(推送不一致内容时,将采用原字段内容覆盖),如期望字段内容不一致,请手动删除DUP字段高级配置中的copy from配置

  • 当数据中缺少字段或字段为空时,系统将自动补充默认值,数字类型默认补0,STRING类型默认补空字符串,支持自定义默认值

5、给需要进行索引检索的字段配置对应的索引,配置完成后点击下一步。

5、配置索引:在索引设置页面,设置索引名称索引类型(如 TEXTSTRING)、包含字段数据压缩方式,可单击查看/修改调整高级配置,单击 + 新增索引行,完成后单击下一步

6、点击确认创建,等待版本构建完成。

确认信息无误后,单击 确认创建。系统将自动基于选定的并发资源进行索引构建,构建完成后的索引将自动在当前实例中启用。

查看索引重建进度

点击左侧导航栏变更历史选择近3天可查看具体的构建进度。

查询测试

可在功能扩展>查询测试中进行简单的搜索测试,召回引擎版支持的查询方式有HA查询SQL查询RESTAPI查询三种。

选择查询方式为 HA查询 后,在 query 输入框中输入查询语句(例如 id:'1',格式参考提示 daogou:part_ids=0|2),设置 cluster(如 general)和 config(如 start:0,hit:10,format:json),提交后页面下方将展示请求 URL、匹配条数、耗时及各字段返回值。

说明

注意事项

重要

  • 付费方式暂时仅支持按量付费;

  • 购买实例时设置的用户名和密码可在实例详情页进行修改;

  • 集群名称在购买实例时由系统为用户指定使用的集群,用户暂时无法修改;

  • 索引重建需按照每次消耗的资源量付费,详情可参考召回引擎版计费概述