配置流程演示
1.在OpenSearch-行业算法版控制台中>实例管理页面单击创建实例。
2.在购买页中商品版本选择“行业算法版”,行业类型选择“电商行业”,根据实际业务需求集群偏好可选择“独享集群-通用型/计算型/存储型”,其他配置信息与通用行业模板配置相同。
3.购买后,确认订单:
在确认订单页面,核对参数配置信息(地域、应用名称、版本类型、行业类型、存储容量、计算资源等)和费用信息,勾选服务协议后提交订单。
4.开通成功后,在实例管理-->应用列表中找到对应的应用单击“配置”,配置应用需要依次按照如下步骤进行:功能选择-->应用结构-->索引结构-->数据源-->完成。
(1)功能选择:
模板功能包括查询分析大类,排序策略大类和周边服务大类:
查询分析类包括电商纠错包、电商词权重、电商停用词包、电商同义词包、文本向量化和电商实体识别;排序策略类包括多路搜索、文本相关性和向量相关性;周边服务类包括下拉提示。模板功能默认全选,也可根据业务需求自定义选择。
(2)应用结构:
应用结构的创建有4种方式:通过数据源创建,手动创建,模板上传和文档上传,下面以通过数据源创建为例进行说明
在应用结构页面,选择通过数据源创建方式。页面上方显示字段标签(商品标题、品牌名称、类目名称、商品描述、是否促销、上架时间、商品销量),单击标签可自动在下方表格中添加对应字段。
注意:字段标签是用于快速生成行业增强索引结构、查询分析规则和排序策略的,请务必在应用结构中添加字段标签所对应的字段名称。
(3)索引结构:
在索引结构页面,索引标签包括类目名称索引、默认索引、向量索引和标题索引,单击标签可自动生成对应索引。索引字段列表展示各索引名称、标签、包含字段和分析方式。需将vector索引的索引标签选择为向量索引,分析方式设置为向量-电商向量通用。
注意:
-
索引标签是用于快速生成查询分析规则、排序策略的,第一次配置电商行业算法版请务必在索引结构中添加索引标签所对应的索引名称。
-
选择配置向量索引标签的索引需要设置为“向量-电商向量通用”分析器。
-
非第一次配置电商行业算法版,加入电商向量分析器,无向量标签配置。
(4) 数据源:(下面以RDS数据源为例进行说明)
填写数据源配置信息:
在左侧面板中单击添加数据源,在弹出的增加数据源对话框中选择数据源类别(支持RDS、MaxCompute和POLARDB三种云数据源),然后依次选择数据库和数据表,单击确定。
设置字段映射:
在字段映射步骤中,将OpenSearch表字段与RDS源字段进行映射。单击添加数据添加需要同步的字段,完成映射后单击确定。
(5) 配置完成:
页面显示行业增强版应用配置完成。接下来可以:1. 使用已选行业模板查询分析功能包配置查询分析;2. 使用已选排序策略模型配置排序策略;3. 配置使用下拉提示功能。
查询测试
搜索测试
索引构建完成后可在功能扩展>搜索测试页面对电商行业算法版的行业文本分析器对应的索引进行测试:在query栏输入查询子句,单击搜索即可查看搜索结果。
#以default索引为例,query子句填入:
default:'牛肉'
向量检索
如需测试向量检索功能请按如下流程操作:
1.先在搜索算法中心>召回配置>查询分析配置页行业算法版默认生成的查询分析sys_default中配置文本向量化功能:单击sys_default进入编辑规则对话框,在功能配置中勾选文本向量化,将向量索引设置为vector,单击确定。
2.在功能扩展>搜索测试页中添加固定参数进行测试:在参数栏添加上述参数后,单击搜索即可查看向量检索的搜索结果。
#必要参数说明
query=default:'牛肉'
qp=sys_default
raw_query=牛肉
可在查询分析过程中查看向量结果:单击搜索结果中的查询分析过程链接,可查看各分析步骤的结果,包括拼写纠错、归一化、分词、停用词、词权重、同义词等,以及文本向量化的向量索引、向量维度信息。
注意:
-
向量索引需要配置查询分析-文本向量化功能后才会生效;
-
配置查询分析的索引需要是“行业-电商通用分析”,并且行业选择“电商增强”,在文本向量化功能中选择配置了“向量-电商向量通用”的分析器。
多路召回
电商行业算法版默认会为用户实例生成一个名为sys_strategy多路搜索策略,如需测试多路搜索功能,需要在功能扩展>搜索测试页配置特定参数,可参考如下案例:在参数栏添加上述参数后,单击搜索即可查看多路召回的搜索结果。
#必要参数说明
query=default:'牛肉'
qp=sys_default
raw_query=牛肉
search_strategy=sys_strategy
注意事项
-
通用版应用可转为行业算法版,行业算法版应用不可转为通用版;
-
行业算法版仅适用于独享集群应用;
-
电商行业模板schemaDemo参考:电商行业模板schemeDemo.json
-
“向量-电商向量通用”索引无法单独使用,需要依赖配置“行业-电商通用分析”的索引配置查询分析-文本向量化功能才会生效;
-
应用结构中务必添加字段标签所对应的字段名称,否则会报错;
如果未添加字段标签,系统将弹出提示“请选择必要的字段标签”,无法继续操作。
-
索引结构中务必添加索引标签所对应的索引名称,否则无法进行下一步;
如果未添加索引标签,下一步按钮将置灰不可点击,无法继续配置。