什么是云原生数据库PolarDB分布式版

本文介绍什么是云原生数据库PolarDB分布式版,也称为PolarDB分布式版,本手册中简称为PolarDB-X

产品简介

PolarDB分布式版PolarDB for Xscale,简称“PolarDB-X”)。

PolarDB-X是阿里云面向高吞吐、大存储、低延时、易扩展和超高可用的云时代数据库使用需求自主设计研发的高性能云原生分布式数据库产品。

PolarDB-X始终保持对阿里巴巴集团"双十一购物狂欢节"所有相关业务的全面支撑。历经十余年淬炼,PolarDB-X具备了强数据一致性、高系统稳定性、快速集群弹性等核心关键特性,并在司法财税、交通物流、电力能源等公共事业领域有广泛深入应用。

PolarDB-X坚定遵循自主可控、开放生态的发展思路,持续围绕MySQL开源生态构建分布式能力,以求最大程度降低用户的学习使用成本。

PolarDB-X产品形态上,秉持的理念是“在业务无需分布式时,客户不应为此付出成本”,采用集中式和分布式一体化架构,可以支撑业务从小到大的发展。

image

产品特性

PolarDB-X依托云资源和容器化部署能力,整体采用了基于存储计算分离的Shared-Nothing系统架构,该架构可以方便用户根据业务需要按需进行分层容量规划。全面兼容MySQL开源生态,从SQL 语法、事务行为、生态工具等多个维度都做了深度兼容,应用无需或者修改少量代码即可从 MySQL 迁移到 PolarDB-X

PolarDB-X聚焦云原生分布式数据库,支持单机集中式到大规模分布式平滑演进,最小1个节点、最大1024节点(PB级存储)。

image

金融级高可用

PolarDB-X采用数据多副本架构,为了保证副本间的强一致性(RPO=0),采用Paxos的多数派复制协议,每次写入都要获得超过半数节点的确认,即便其中1个节点宕机,集群也仍然能正常提供服务。Paxos算法能够保证副本间的强一致性,彻底解决副本不一致问题。

PolarDB-X提供多种高可用形态,比如同城单机房3副本、同城三机房3副本、两地三中心5副本等,满足不同金融级别的容灾诉求。

透明分布式

让用户以单机MySQL数据库使用体验操作分布式数据库是PolarDB-X一贯追求的目标。为此PolarDB-X提供简单易用的透明分布式能力:

  • 默认主键拆分,让移植到PolarDB-X的数据和业务摆脱对设计"分区键"的依赖。

  • 高性能强一致分布式事务,PolarDB-X采用自研的X-Paxos协议保证数据存储在故障切换过程中RPO=0的基础上,使用TSO策略和分布式的MVCC能力保证了分布式事务的隔离性和一致性。

  • 分布式线性扩展,PolarDB-X基于一致性Hash的分区策略有效地进行负载均衡和热点抑制,且在扩展过程中保持计算下推和数据一致性的同时实现业务零感知。并行和流控能力为扩展期间业务连续性提供了有力保障。

  • 全局Binlog和全局一致性备份,分别解决分布式数据库各节点数据库向下游流转的难题,以及各节点备份时间差造成的恢复一致性问题。

集中式和分布式一体化

PolarDB-X全面构建集中式和分布式一体化的架构能力(简称“集分一体”),兼具分布式数据库的扩展性和集中式数据库的功能和单机性能,两种形态可以无缝切换。在集分一体化数据库中,数据节点被独立出来作为集中式形态,完全兼容单机数据库形态。当业务增长到需要分布式扩展的时候,架构会原地升级成分布式形态,分布式组件无缝对接到原有的数据节点上进行扩展,不需要数据迁移,也不需要应用侧做改造。

PolarDB-X提供两种产品形态:标准版(集中式架构)和企业版(分布式架构),支持从标准版原地升级为企业版。

HTAP一体化

随着云原生技术的不断普及,以Snowflake为代表的新一代云原生数仓、以及数据库HTAP架构不断创新,行列混存HTAP会成为数据库的标配能力。

PolarDB-X 提供列存索引的形态(Clustered Columnar Index,CCI),行存表默认有主键索引和二级索引,列存索引是一份额外基于列式结构的二级索引(覆盖行存所有列),一张表可以同时具备行存和列存的数据。同时,全面构建面向行列混合场景的代价优化器、以及向量化执行算子,通过一套SQL引擎支持行列混合查询。

开源与多云

为满足不同行业客户对部署形态的需求,PolarDB-X提供公共云、专有云、DBStack、开源软件版四种部署形态:

  • 公共云:高速迭代,稳定服务,完全托管。目前面向世界范围内13个地区提供高性能云原生分布式数据库服务。

  • 专有云(ApsaraStack):集成阿里云核心产品,满足对安全性、隔离型有合规要求的行业客户。注:由于部署资源差异,专有云和公共云的软件版本或有差异。

  • DBStack:轻量级数据库管理服务平台,集成阿里云核心数据库产品,满足构建高性能、高可用、低成本的全场景数据库解决方案用户需求。

  • 开源软件版(PolarDB-X Lite):在Lite版本中,用户可体验最新的产品特性并以最小资源构建一个分布式数据库集群。

安全与稳定

PolarDB-X通过多项国家级别的安全认证,在安全属性较高的行业,比如金融、运营商等行业的核心系统,有比较多的交付成功案例。

在数据库安全方面,PolarDB-X提供全方位的安全防护,比如:IP白名单/SSL、TDE落盘加密、备份加密、全密态、全量SQL审计和链路跟踪、三权分立和标签权限等。

PolarDB-X提供金融级的高可用容灾能力,可以满足在机房故障时数据不丢,确保RPO=0,提供两地三中心架构形态,可以满足金融行业的五级容灾要求。

典型业务场景

高负载低延时交易

场景描述:

交易场景广泛存在于互联网业务系统中,是信息系统中最为核心的组件之一。业务连续性、事务一致性和系统安全性是交易系统正常运行的基础,长时间高负载低延时的运行是互联网时代交易系统的发展方向。

产品能力:

金融级高可用、透明分布式。

数据集中存储

场景描述:

该场景也称"数据大集中"或"数据归集",属企业数据架构中的ODS层,具有承担各垂直业务数据源的数据汇总功能。高并发写入、大容量存储、多维度查询、低成本流出是该场景的主要诉求。

产品能力:

透明分布式、HTAP一体化、安全与稳定。

业务端分库分表

场景描述:

当前业务已采用开源组件实现分库分表架构,属于核心场景,数据规模大、并发量高、以及稳定性是该场景的主要诉求,同时受限于开源组件的限制,缺少有效的分布式运维能力,比如:分布式DDL、扩缩容等。

产品能力:

透明分布式。

分布式快速改造

场景描述:

当业务体量即将突破单机数据库承载极限和单表过大导致性能和维护问题时,分布式改造是解决上述问题的高性价比方案。数据库作为分布式改造的重点难点,"和使用单机数据库一样使用分布式数据库"一直是广大用户的核心诉求。

产品能力:

透明分布式、集中式和分布式一体化。

单元化容灾改造

场景描述:

金融、运营商等行业,当达到一定业务量之后,需要保证核心服务可以连续提供,避免业务连续性风险。目前,逐步尝试分布式服务化改造来实现单元化架构,每个单元都是活跃且同时承载各自业务流量,满足数据中心级别的故障隔离,实现异地多活的效果。

产品能力:

金融级高可用、透明分布式、安全与稳定。

混合负载访问

场景描述:

互联网业务的实时化、智能化趋势催生了事务数据与分析数据在相同数据源内进行混合访问(HTAP)的需求。数据一致性、访问便捷度和访问安全性是混合负载访问场景的主要诉求。

产品能力:

HTAP一体化。

业务降本增效

场景描述:

当前业务体量趋向于稳定,期望通过数据库优化来实现整体的降本诉求,比如:MySQL一键平迁、数据压缩、流量合并等。

产品能力:

集中式和分布式一体化、HTAP一体化、开源与多云。

多云容灾

场景描述:

业务有自建跨云容灾的诉求,比如:担心云厂商绑定、技术自有可控、故障逃逸能力等,期望一套数据库适配多样化的场景。

产品能力:

开源与多云。