使用CO_HASH分区策略实现多分区列的协同路由-云原生数据库 PolarDB-阿里云

版本要求

PolarDB-X版本必须为5.4.18-17047709及以上。

适用场景

在电商场景，业务订单表常常会出现以下现象：业务订单表的两个列或多个列之间的值存在一种协同关系，比如，常见的订单表的order_id与buyer_id的后N位数字总是相同的。由于业务订单表的数据量一般偏大，用户考虑在对订单表进行水平切分时，能让订单表同时按order_id或buyer_id的后N位数字进行水平切分。这样业务应用在一些下单场景的事务中，应用无论是从order_id=维度读写还是buyer_id=?维度进行读写，均能路由到同一个物理分区，从而避免出现大量的跨库事务。

那么，PolarDB-X的CO_HASH分区策略就是专用来帮助业务解决上述场景所碰到的分区问题：

分区表的多个分区列的取值之间存在特殊的协同关系（比如，后N位的数值相同、前N位的数据相同，等等）；
分区表支持同时按多个不同的分区列进行独立路由（即这些分区列之间没有前缀关系，查询单独带上各个分区列的等值查询条件均能进行分区裁剪）；

语法

要求PolarDB-X支持同时按多个不同的分区列的不同取值进行路由。

CREATE TABLE ... 
PARTITION BY CO_HASH(partition_expr_list) 
PARTITIONS number;

partition_expr_list:
  partition_expr, partition_expr [, partition_expr, ...]
  
partition_expr:
    partition_column	
  | partition_func(partition_column)


# 分区函数定义
partition_func：
    RIGHT
  | LEFT
  | SUBSTR
  | SUBSTRING

说明

CO_HASH分区策略与HASH/KEY分区策略的主要区别请参见与Hash/Key分区策略的主要区别。

限制

分区列使用分区函数时，不允许嵌套多层的分区函数，例如SUBSTR(SUBSTR(c1,-6),4)。
所有分区列的类型必须完全一致，包括：
- 分区列类型的charset与collation；
- 分区列类型的长度定义或精度定义等。
默认最大分区数目不允许超过8192。
默认最大分区列数目不允许超过5个。
分区函数的使用限制：
- RIGHT
- LEFT
- SUBSTR

示例

假如业务有一张订单表orders，它的每一行录的order_id与buyer_id的后6位的数字总是相同的。

那么，如果用户想对订单表orders同时按order_id与buyer_id两个列的后6位数字进行分区，并期望同一行order_id与buyer_id这两个列的等值查询条件均能路由到同一个分区的话，可以使用如下的语法定义：

CREATE TABLE t_orders(
 id bigint not null auto_increment, 
 seller_id bigint,
 order_id bigint, 
 buyer_id bigint,
 order_time datetime not null,
 primary key(id)
) 
PARTITION BY CO_HASH(
  	RIGHT(`order_id`,6) /*取c1列的后6位字符*/,
  	RIGHT(`buyer_id`,6) /*取c2列的后6位字符*/
)  
PARTITIONS 8;

CO_HASH与其它分区函数的用法，请参见分区函数。

CO_HASH分区

版本要求

适用场景

语法

限制

示例

相关限制

数据类型限制

分区列相关限制