本文将介绍HASH函数使用方式。

注意事项

HASH函数的算法是简单取模,要求拆分列的值的自身分布均衡才能保证哈希均衡。

使用限制

拆分键的数据类型必须是整数类型或字符串类型。

路由方式

  • 若分库和分表使用不同拆分键进行HASH时,则根据分库键的键值直接按分库数取余。如果键值是字符串,则字符串会先被换算成哈希值再进行路由计算。例如HASH(8)等价于8 % D(D是分库数目), 而HASH("ABC")等价于hashcode("ABC").abs() % D(D是分库数目)。
  • 若分库和分表都使用同一个拆分键进行HASH时,则根据拆分键的键值按总的分表数取余。例如有2个分库,每个分库4张分表,那么0库上保存分表0~3,1库上保存分表4~7。某个键值为15,那么根据该路由方式,则该键值15将被分到1库的表7上((15 % (2 * 4) =7))。

使用场景

HASH函数主要应用与如下场景:

  • 适合于需要按用户ID或订单ID进行分库的场景。
  • 适合于拆分键是字符串类型的场景。

示例

假设需要对ID列按HASH函数进行分库不分表,则您可以使用如下DDL语句进行建表:

create table test_hash_tb (
    id int,
    name varchar(30) DEFAULT NULL,  
    create_time datetime DEFAULT NULL,
    primary key(id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 dbpartition by HASH(ID);