全文检索
表格存储提供了匹配查询和短语匹配查询,以实现全文检索功能。查询时会根据分词情况匹配数据,并支持高亮显示查询词。本文介绍Java SDK全文检索相关的数据查询和数据处理功能。
背景信息
创建多元索引时,您可以为Text类型字段指定分词类型。默认分词类型为单字分词。更多信息,请参见分词。
数据查询
可用于全文检索的数据查询功能请参见下表说明。
功能 | 说明 | 适用场景 |
MatchQuery采用近似匹配的方式查询表中包含指定短语的数据。表格存储会先对Text类型的列值和查询关键词按照设置好的分词器做切分,然后按照切分好后的词去查询。 | 适用于大数据分析、内容搜索、知识管理、社交媒体分析、日志分析、智能问答系统、合规审查等场景。 | |
MatchPhraseQuery采用近似匹配的方式查询表中包含指定短语且短语顺序匹配的数据。只有分词后的多个词在行数据中以同样的顺序和位置存在时,才表示行数据满足查询条件。 | 适用于大数据分析、内容搜索和个性化推荐等场景。 |
数据处理
全文检索过程中涉及到数据处理功能请参见下表说明。
功能 | 说明 |
在搜索结果中对与查询词匹配或相关的文本进行高亮显示,帮助用户快速识别到所需的相关查询内容,提高信息检索的效率。 |