数据分布

更新时间: 2025-08-04 18:07:14

分桶与分区

  • 数据分桶:按策略将数据分布到固定数量的桶中,提升读写均衡性与 Join 效率。

    • 哈希分桶 —— 按分桶键哈希分布,负载均衡,适用于点查与关联。

    • 粘性分桶 —— 动态调整数据分布,缓解热点。

    • 轮询分桶 —— 无分桶键时均匀写入,适合日志类场景。

  • 数据分区:按键值将数据组织为独立片段,加速查询与生命周期管理。

    • 手动分区 —— 用户显式创建或删除分区。

    • 自动分区 —— 按规则自动生成并清理过期分区。

    • 动态分区 —— 写入时按数据自动创建分区。

上一篇: 日志表 下一篇: 数据分桶
阿里云首页 实时计算 Flink版 相关技术圈