SQL与OpenSearch查询语法的实现对比-智能开放搜索 OpenSearch-阿里云

OpenSearch的主战场虽然在“搜索”上，但是对大部分的Sql用法也是有很好的支持的，虽然语法可能不尽相同，但是实现的效果大致一样，因此，下文将一一介绍Sql主流的功能，在OpenSearch里是如何实现的。

常见用法对比

大部分的开发者应该对SQL是再熟悉不过了，因此这里反客为主，咱们以SQL执行逻辑的顺序去介绍OpenSearch是如何实现如下的操作单元的，如下是SQL的执行逻辑：

(1)FROM(2)ON(3)JOIN(4)WHERE(5)GROUP BY(6)WITH {CUBE | ROLLUP}(7)HAVING(8)SELECT(9)DISTINCT (10)ORDER BY(11)LIMIT 。

1.FROM：

SQL：from后面一般接的是表名，也可以接一个数据集（一个能查询部分数据的SQL，这里不考虑嵌套这种复杂结构）。
OpenSearch：是以应用为表单位，一个应用对应一种业务逻辑，因此在搜索的时候无需指定表名，只需要在SDK（以Java SDK的搜索Demo为例）中指定对应的（host、appname、accessKey、secret）即可。

2.WHERE：

SQL：类似于过滤，保留符合条件的数据。
OpenSearch：两种子句可以实现过滤（query和filter），二者的区别则query是倒排索引，查询效率高，但功能没有filter灵活，无法实现带表达式的计算逻辑，而filter是正排索引，查询效率要低于query，但支持表达式和函数的计算逻辑，功能更丰富。

3.GROUP BY ：

4.WITH 和 HAVING的功能OpenSearch 现阶段暂时无法支持，需要用户在返回的结果中自行实现

5.SELECT：

6.DISTINCT ：

SQL：根据某个字段值对比，删除重复的记录。
OpenSearch：同样通过distinct子句实现该功能，并且在功能上比SQL的distinct更为丰富，不仅可以去重，还可以打散，有点像分组topN的概念。

7.ORDER BY：

SQL：用于根据某个字段，或者某个表达式的结果进行排序（正序/倒序）
OpenSearch：可以通过sort子句时实现，当然OpenSearch的排序，不仅仅是根据某个字段排序，还可以通过文档得分进行排序，还可以根据算法模型，对文档进行干预，再结合文档分和字段内容，跟文档进行综合排序，排序的方式很多具体可以参考排序策略配置。

8.LIMIT ：

1.LIKE和 NOT LIKE：

SQL：用于模糊匹配，如：like '%北京%'，检索字段内容中包含‘北京’的记录
OpenSearch：query子句用于召回的逻辑，是对字段内容进行分词，将分词后的item匹配上的记录进行返回，加上OpenSearch提供了丰富并且强大的分析器，可以完美替代，并弥补SQL中like效率低的问题；not like 也可以通过query子句中ANDNOT的用法进行代替。

2.IN：

SQL：IN 操作符允许在 WHERE 子句中规定多个值，如：WHERE column_name IN ( value1 , value2 ,...);
OpenSearch：可以在filter里配置in/not实现。