本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。
全文索引Search服务用来解决复杂的多维查询和全文检索。
警告 HBase增强版的全文索引特性目前处于关闭状态,相关能力已全面迁移到Lindorm中,更强大、更成熟、更好用,详情参见Lindorm Searchindex。
Solr是构建在Apache Lucene上的企业级搜索平台,是分布式全文检索的最佳实践之一,支持各种复杂的条件查询和全文检索,具有广泛的用户基础。通过深度融合HBase与Solr,我们推出了既能满足大数据海量存储,又可以支持复杂多维查询和全文检索的Search服务。
Search服务适用于:需要保存海量数据,并且需要各种条件组合查询的业务。例如:
- 物流场景,需要存储大量轨迹物流信息,并需根据任意多个字段组合查询。
- 交通监控场景,保存大量过车记录,同时会根据车辆信息任意条件组合检索出感兴趣的记录。
- 网站会员、商品信息检索场景,一般保存大量的商品/会员信息,并需要根据少量条件进行复杂且任意的查询,以满足网站用户任意搜索需求等。
Search服务的整体数据流如上图,数据写入HBase后,BDS负责将数据实时同步到Solr中。在此架构下,HBase服务、数据同步通道BDS和Solr都是以独立集群的方式存在,您可以分别对各个集群进行管理:如果Solr处理能力不足,只需要扩容Solr集群;如果BDS同步能力不足,可以单独扩容BDS。HBase/BDS/Solr可以针对不同的使用场景选择不同的机型,独立的部署形态大幅提升了系统的稳定性。
与二级索引的区别
HBase增强版提供二级索引,可以低成本的解决非主键查询问题,适用于查询列比较固定的场景。如果业务场景需要复杂的多维组合查询,需要考虑使用Search服务。
与开源Solr的区别
Search服务深度融合HBase和Solr,用户无需关注各个服务的运行,只需要通过简单的API/Shell操作就可以将HBase与Solr建立关联。
Search服务基于开源Solr深度定制,完全兼容开源Solr API,在系统稳定性、读写性能、监控告警上做了大量工作,提供更加可靠、高性能的企业级搜索平台。
服务开通
开通Search服务需要三步:
- 创建增强版HBase集群;
- 创建BDS集群;
- HBase集群创建成功后,在HBase控制台页面单击
全文索引
,完成Search实例的购买和关联。
具体参见开通指南。
使用指南
最佳实践
参见最佳实践。
文档内容是否对您有帮助?