通用行业模板配置

更新时间:
复制为 MD 格式

前提条件

  1. 成功注册阿里云账号并通过实名认证

  2. 第一次开通阿里云账号并登录控制台时,会提示先创建access key才能继续使用。

  • 创建及使用应用依赖access key参数,主账号下access key参数不能为空。

  • 在为主账号创建access key参数后,还可以再创建RAM子账号access key通过RAM子账号进行访问,RAM子账号赋予对应访问权限,请参考访问鉴权规则

创建应用

步骤:

  1. 创建并购买应用

  2. 配置应用:定义应用结构->定义索引结构->配置数据源->创建成功

  3. 搜索测试

  4. 使用搜索算法中心和扩展功能(如:查询分析、排序配置等等)

首先通过控制台进入后,选择对应的区域,创建的实例类型最后单击创建实例

1. 购买应用

购买应用分为:包年包月以及按量付费,选择对应的区域根据实际需求按需购买即可,购买流程如下:

在购买页面中,选择商品版本(行业算法版、高性能检索版、向量检索版或召回引擎版),填写应用名称,选择行业类型集群偏好,按需配置存储容量计算资源,选择资源组后,单击立即购买

在确认订单页面核对配置信息,勾选服务协议,单击立即开通。开通成功后,页面提示恭喜,开通成功!,新购实例一般需要 1~5 分钟完成生产,可单击管理控制台进入实例管理。

2. 配置应用

应用初始化完成后,状态变更为待配置,此时可以单击配置进入下一步定义应用结构:

2.1 定义应用结构

目前提供了 4 种应用结构创建方式,同时OpenSearch高级版提供了多表支持功能,以方便业务复杂场景下调用。

主辅表数据关联关系

通过手动创建应用结构方式,为应用创建多个表时,多表之间数据关联关系描述如下:

  • 目前主辅表,仅支持 N:1 或 1:1 的关系,不支持 1:N(即多表数据关联关系中,多的一方只能是主表,且主表只能有1个)。

  • 主辅表需通过应用表外键与辅表主键进行数据关联,且表外键只能关联辅表主键。

  • 最多只支持2层关联。多表数据关联支持

  • a->表b,表b->表c

  • a->表d

  • 不支持超过2层多表数据关联

  • a->表b,表b->表c,表c->表d

  • 不支持环状多表数据关联

  • a->表b,表b->表a

  • 数据模型

image

定义应用结构流程:

1、通过模板创建应用结构。用户可以将自己定义的应用结构创建成模板,可以通过已有模板快速创建出一个新的应用。如您的已有模板中有自定义的分析器,需在新实例中创建后再导入模板配置。

2、通过上传文档创建应用结构。您可以上传已有的数据文件(仅支持JSON格式),系统会自动解析并创建出初始的应用结构(注意字段类型等需要重新定义)。

3、通过数据源创建应用结构。适用于通过RDS、MaxCompute等数据源同步的场景,可以快速由源表结构创建出初始的应用结构,节省手动构造的工作量,降低出错概率。这里以RDS为例,其他数据源操作类似,具体详见RDS数据源配置

单击通过数据源创建选项卡后,在弹出面板中选择数据源类型(RDSMaxComputePOLARDB),单击+ 新建数据库。在连接数据库对话框中填写 RDS 实例 ID数据库名用户名密码,单击连接

4、通过手动创建应用结构,在非以上三种场景使用。

手动创建时,输入表名并选择主表或辅表类型,配置字段(设置字段名称主键类型),最多可添加 10 张表,完成后单击下一步

2.2 定义索引结构

  • 需放到 query子句中的字段,必须创建为索引(浮点型不支持创建为索引),分词方式详情请参见行业算法版表结构

  • 需放到 filter子句,sort子句,及函数中涉及字段有明确标识,需设置为属性的字段必须创建为属性字段

  • 分词字段类型无法配置为属性字段,例如 TEXT,SHORT_TEXT等都不支持,只支持数值字段类型及不分词字段类型配置为属性字段,例如 int,int_array,float,float_array,double,double_array,literal,literal_array 等字段类型。

索引结构配置页面包含三部分:索引字段列表(配置倒排索引,设置索引名称、包含字段和分析方式)、属性字段列表(配置正排索引,用于过滤、统计、聚合和排序)和默认展示字段列表(配置搜索结果中展示的字段)。

2.3 同步数据源

首先关联数据源,关联成功后,选择数据表,单击“>>”选中后,确认:

确认后默认进入字段映射界面:

界面中显示 OpenSearch 表字段与数据源字段的对应关系,同名字段会自动映射,不一致时可通过+ 添加数据手动添加映射。

字段映射界面可以同时设置数据源插件说明

可选插件包括 HTMLTagRemoverJsonKeyValueExtractorKeyValueExtractorStringCatenateExtractor,选择插件后可配置字段列表字段连接符等参数。

说明

若需要数据源实时同步功能,可以参考:DTS实时同步

2.4 创建成功

应用结构、索引结构和数据源全部配置完成后,页面显示应用配置成功,单击返回应用列表回到实例管理页面。

3. 搜索测试

数据上传成功后就可以开始搜索体验,我们在控制台中内置了“搜索测试”页面方便用户搜索测试,主要包含查询子句和查询参数,可以根据具体搜索需求自行配置进行搜索测试(详情请参见API概览SDK简介),此处以控制台中搜索测试页面为例。通过单击子句或参数后的“+”按钮,在弹出的下拉框中选择添加需要的查询子句或参数,再填写对应查询子句或参数内容,最后单击“搜索”按钮进行搜索效果测试。

使用方法

1.左侧导航栏,“功能扩展”下进入“搜索测试”页。输入必填参数query子句。

页面顶部选择待测试的应用和环境,在 query 输入框中填写查询条件(如 id:'300'),可通过子句区域添加 config 等子句,单击搜索查看结果。

2.同时可以添加更多的子句以及参数。

子句说明

查询子句-query子句

过滤子句-filter子句

排序子句-sort子句

打散子句-distinct子句

统计子句-aggregate子句

自定义子句-kvpair子句

翻页子句-config子句

参数说明

展示字段fetch_fields,多个展示字段按分号分隔;

查询规则qp,设置查询分析的名称;

粗排表达式first_rank_name,设置基础排序的名称;

精排表达式second_rank_name,设置业务排序的名称;

结果摘要配置-summary,请查看搜索结果摘要

类目预测和原始Query用法:设置类目预测名称,以及查询词;

重查策略re_search,请查看搜索处理

业务信息biz、用户IDuser_id,请查看搜索处理

A/B Test,设置A/B Test的名称;

禁用参数disable,设置想禁用的功能,例disable=qp.

更多进阶功能,请查看对应功能的产品文档,文档中都有操作流程步骤。