全部产品
云市场

5分钟快速入门

更新时间:2019-08-29 11:09:09

尊敬的用户,阿里云管理控制台计划于2016年6月1日开始不再保障 IE8 浏览器下的可用性,查看详情。建议您尽快 升级浏览器,或者使用Chrome、Firefox。

我们希望用户能通过本示例自行完成一个小的搜索服务,并对OpenSearch使用流程有一定的了解。

创建应用

创建标准版与创建高级版应用流程基本一致,主要区别是标准版不支持多表。因此您可以直接参考下面的创建高级版应用流程:
1

购买应用

购买应用分为:预付费(包年包月)以及后付费(按量付费),购买流程分别如下图所示:
2

3

4

5

配置应用

购买完成后,应用进入初始化阶段,此时状态为生产中
6

应用初始化完成后,状态变更为待配置,此时可以点击配置进入下一步定义应用结构:
7

定义应用结构

目前提供了 4 种方式的应用结构创建方式,同时OpenSearch高级版提供了多表支持功能,以方便业务复杂场景下调用。

主辅表数据关联关系

通过手动创建应用结构方式,为应用创建多个表时,多表之间数据关联关系描述如下:

  • 目前主辅表,仅支持 N:1 或 1:1 的关系,不支持 1:N(即多表数据关联关系中,多的一方只能是主表,且主表只能有1个)。
  • 主辅表需通过应用表外键与附表主键进行数据关联,且表外键只能关联辅表主键。
  • 最多只支持2层关联。

多表数据关联支持

  • 表a->表b,表b->表c
  • 表a->表d

不支持超过2层多表数据关联

  • 表a->表b,表b->表c,表c->表d

不支持环状多表数据关联

  • 表a->表b,表b->表a

数据模型

join

定义应用结构流程:

  • 1、通过模板创建应用结构。系统默认提供了几种常用的模板样式,用户也可以将自己定义的应用结构创建成模板,可以通过已有模板快速创建出一个新的应用。
  • 2、通过上传文档创建应用结构。您可以上传已有的数据文件(仅支持JSON格式),系统会自动解析并创建出初始的应用结构(注意字段类型等需要重新定义)。
  • 3、通过数据源创建应用结构。适用于通过RDS、ODPS等数据源同步的场景,可以快速由源表结构创建出初始的应用结构,节省手动构造的工作量,降低出错概率。这里以RDS为例,其他数据源操作类似,具体详见数据源配置
    8
    9
    10
    11
  • 4、通过手动创建应用结构,非以上三种场景使用。

12
13

定义索引结构

  • 需放到 query子句中的字段,必须创建为索引(浮点型不支持创建为索引),分词方式详情请参见字段和分词类型
  • 需放到 filter子句,sort子句,及函数中涉及字段有明确标识,需设置为属性的字段必须创建为属性
  • 分词字段类型无法配置为属性,例如 TEXT,SHORT_TEXT等都不支持,只支持数值字段类型及不分词字段类型配置为属性,例如 int,int_array,float,float_array,double,double_array,literal,literal_array 等字段类型。

14

同步数据源

15

点击“编辑”开始配置数据源插件

16

选择相应数据源处理插件并填写相关参数,点击“保存”即配置数据源插件成功。
17

创建成功

18

数据上传

上面我们是以RDS为例,激活应用后会默认开始导入全量数据,可以在应用管理 - 基本配置 - 索引重建中看到具体进度。当然也可以调用OpenSearch SDK/API来上传数据。
aa

搜索测试

数据上传成功后就可以开始搜索体验,我们在控制台中内置了
搜索测试页面方便用户搜索测试,主要包含查询子句和查询参数,可以根据具体搜索需求自行配置进行搜索测试(详情请参见APIJava SDK/Php SDK),此处以控制台中搜索测试页面为例。

通过单击子句或参数功能按钮,在弹出的下拉框中选择添加需要的查询子句或参数,再填写对应查询子句或参数内容,最后单击搜索按钮进行搜索效果测试。

20

高级查询场景

过了1个月后,小明感觉OpenSearch功能的确强大,计划把原来的功能继续扩大,充分利用OpenSearch各种自定义的功能,来获得更优的搜索体验。

配置查询意图理解

单击右上角的添加规则按钮,添加一个未上线的查询分析/类目预测/实体识别规则:

21

选择对应功能修改适用范围(目前仅TEXT类型的索引字段可以配置该功能)。点击“+”添加自定义干预词典。

22

选择类目预测功能时需要选择相应已创建的类目预测模型。

23

若所选行业为电商行业,则可以选择实体识别功能,可设置各实体类型的重要性。

24

规则创建完毕后,可以进行搜索效果测试,选择设置默认规则,调试无误后勾选为默认规则后对线上查询生效。
25)
26)
27

配置搜索结果排序

i. 搜索结果排序主界面:
28)
单击修改表达式按钮在打开的界面中,单击左下角的+号,可以添加粗精排表达式,也可以对现有粗精排表达式编辑或删除:
29

温馨提示:

  • 默认粗排为static_bm25文本匹配度。
  • 默认不配置精排,以粗排分为主。

ii. 添加新粗排表达式或编辑现有表达式

30

温馨提示:

  • 粗排对性能影响较大,尽量选择最有代表性的字段。
  • 各项权重值定义,需要根据实际场景来不断调整。
  • 粗排表达式名称可以在搜索时,通过设置first_rank_name参数进行动态添加使用。

iii. 添加新精排表达式或编辑现有表达式

31

温馨提示:

  • 可以直接在文本框中根据自己的搜索排序需求编写对应表达式。
  • 可以通过单击字段内置函数数学函数选择需要的字段或函数项进行插入,再进行修改。
  • 精排表达式名称可以在搜索时,通过设置second_rank_name参数进行动态添加使用。

iv. 保存表达式配置

32

温馨提示:

  • 可直接将配置好的表达式设置为默认直接应用于线上服务,也可以不设置为默认通过搜索时指定对应参数动态使用(本案例采用动态指定参数进行测试)。

搜索测试

在搜索测试界面单击参数功能按钮,选择添加first_rank_namesecond_rank_name并填写上面自定义的粗精排表达式名称,单击搜索测试文档召回效果。

33

查看应用监控信息

应用列表界面点击应用名后点击左侧云监控可查看应用监控内容:
34

35

开启一键报警及配置报警规则

36

37

配置报警规则时,在左侧列表选择云服务监控中的开放搜索开始配置。
38
39