Elasticsearch引擎实例概述

简介

对于搜索场景,更多客户熟悉开源技术栈,在搭建搜索业务时,选择ES/Solr等开源引擎负责搜索的召回环节,然后在召回引擎以外训练NLP、排序等算法能力,不仅耗时耗力,而且大部分处于高投入低回报的状态;而开放搜索的Elasticsearch引擎则基于阿里巴巴在搜索领域的积累,通过安装相应的阿里云Elasticsearch插件来提供给阿里云Elasticsearch算法能力(包括行业分词和查询分析的功能),从而减少了用户对算法模块的投入,可以将大部分的精力放在业务转化、丰富产品功能等需求上。感兴趣?立即试用!

流程图

1.在开放搜索控制台创建一个类型为Elasticsearch引擎的开放搜索实例并且关联Elasticsearch实例(规格不小于2核16G);

2.在开放搜索控制台安装分词插件到Elasticsearch引擎,此过程触发Elasticsearch集群重启,之后可提供给Elasticsearch引擎以下功能:

12.1.Elasticsearch可通过设置mapping来使用开放搜索的通用及行业分词器(IT、电商、教育);

12.2.该插件可在用户向Elasticsearch发起查询请求时访问开放搜索的查询分析服务,用于改写Query,过程如下:

122.2.1.当用户向Elasticsearch发起查询请求时(match_opensearch),首先该插件会向查询分析服务发起请求,用来获取query的改写结果;

122.2.2.该插件会将查询分析服务返回的改写后的query提供给Elasticsearch,之后Elasticsearch根据改写后的query查询集群实际数据,最终将召回结果返回给客户端;

3.开放搜索还提供自定义分词查询分析干预词典的能力,在开放搜索控制台配置后会即使生效。

总的来说就是:开放搜索的Elasticsearch引擎实例作为一个阿里云Elasticsearch的插件,运行在用户的阿里云Elasticsearch集群中,提供给Elasticsearch分词能力、query改写能力。

优势

  • 丰富Elasticsearch的分词库,除通用分词外还增加行业分词其中包括电商、IT内容、教育。

  • 赋予Elasticsearch理解Query搜索意图的能力,通过对Query进行一系列智能分析(拼写纠错、同义词改写、词权重、停用词、实体识别)理解用户搜索意图,改写用户搜索Query,使召回结果更符合需求。