本文介绍HBase的优势。
类别 | 云数据库HBase增强版(Lindorm) | HBase开源版 | |
核心功能 | HBase API | 支持 | 支持 |
数据模型 | 支持宽列(HBase API)、表格(SQL-Like API)、队列等多种,对其他模型感兴趣的话,请联系我们。 | 仅支持宽列 | |
全局二级索引 | 内置,查询透明、高性能、按需冗余非索引列,请参见二级索引。 | 依赖外部组件,复杂。 | |
全文检索 | 智能集成搜索引擎Solr,提供面向海量数据的存储、多维查询、全文索引等统一访问的混合型能力,请参见全文索引服务。 | 不支持 | |
性能 | 吞吐性能 | 单机吞吐是开源HBase的7倍,请参见测试结果。 | 无优化 |
请求毛刺 | P99延迟是开源HBase的1/10,请参见测试结果。 | 无优化 | |
成本 | 数据压缩 | 深度优化的ZSTD算法,JNA重写,可杜绝Core dump,并且基于字典采样优化,压缩率比snappy提高50%,数据压缩比可高达10:1。 | 默认为Snappy,使用ZSTD需依赖Hadoop-3.0,存在Core Dump的概率。 |
编码 | IndexableDelta算法,相比DIFF算法,保持相同压缩率,访问速度快一倍。 | 推荐DIFF,随机访问较慢。 | |
冷热分离 | 冷热数据自动分层存储,冷数据使用高压缩和廉价存储介质,减少70%成本,热数据可提升访问性能15%,请参见冷热分离。 | 不支持 | |
存储介质 | 支持高效云盘、SSD云盘、本地HDD、本地SSD。支持冷存储(OSS)、容量型云盘(超性价比云盘,即将发布)。 | N/A | |
可靠性 | 主备双活 | 成熟,支持自动容灾切换、双集群请求并发等高级能力,支持与自建HBase构建混合主备,请参见主备双活。 | 无优化,不支持切换。 |
备份恢复 | 支持100TB+规模的数据备份至OSS,并提供与规模无关的RTO(<30分钟)、按需备份、指定时间点恢复等高级能力,请参见开通备份恢复。 | 不支持 | |
MTTR | 深度优化,宕机恢复速度是开源HBase的10倍。 | 不支持 | |
多租户 | 认证与ACL | 支持易用的账号密码认证和ACL管理,请参见用户和ACL权限管理。 | 较复杂 |
资源隔离 | 支持RS Group功能,实现租户间的资源物理隔离。 | 不支持 | |
运维诊断 | 运维工具 | 界面化集群管理工具,支持表,Namespace,Group,ACL等管理,请参见集群管理系统。 | HBase Shell |
数据查询 | HBase Shell+集群管理系统内支持图形化SQL交互查询,请参见数据查询。 | HBase Shell | |
生态 | 数据搬迁 | 支持HBase各个版本之间的在线、跨版本、自动化、高效搬迁,应用零影响、零改造,请参见LTS(原BDS)服务介绍。 | 只能离线迁移 |
MySQL数据同步 | 请参见LTS(原BDS)服务介绍,支持MySQL数据到HBase的全量同步、在线实时同步。 | 借助工具、不支持在线增量。 | |
Spark分析 | 产品化深度集成,支持Spark SQL分析HBase,HBase数据到Spark(HDFS/OSS)的增量归档,离线分析结果回流到HBase等。 | 无优化,数据集成需要较大开发。 | |
MaxCompute | 产品化集成,请参见全量导出MaxCompute。 | 数据集成需要较大开发。 | |
日志服务(SLS) | 请参见LTS(原BDS)服务介绍,支持SLS数据到HBase的日志服务(SLS)增量导入。 | 数据集成需要较大开发。 | |
服务能力 | 可用性SLA | 提供SLA保障,单集群99.9%,双集群高可用99.95%。 | N/A |
运维成本 | 全托管,无需复杂的数据库运维投入。 | N/A | |
技术团队 | 由多名Apache社区PMC&Committer组成的专家队伍提供技术服务支持。 | N/A | |
实践经验 | 支持9年天猫双十一,阿里部署上万台。 | N/A |