升级社区版低版本集群以提高系统的稳定性和性能

更新时间:2025-03-24 08:39:47

尊敬的阿里云用户,云数据库 ClickHouse 社区兼容版 的部分旧版本集群(即 21.8 之前的版本以及部分 21.8 版本)基于老旧的管控架构。这种架构下的集群性能较差,且存在较多缺陷。同时,这些老管控架构的集群监控能力不足,无法通过快照方式进行备份,并且备份和恢复速度较慢,这些问题导致了灾难恢复困难以及运维管理上的诸多挑战。为了提升系统的稳定性和性能,确保您获得更优质的服务体验,强烈建议您尽快将基于老管控架构的集群升级至23.8及以上版本。

旧版本集群存在的问题

由于ClickHouse 21.8及以下版本在开源社区已停止更新且维护超过三年,同时阿里云ClickHouse社区兼容版21.8也已在阿里云上宣布终止支持(EOL),因此阿里云ClickHouse社区兼容版21.8及以下版本与23.8版本相比,存在以下问题:

对比指标

21.8 及以下版本

23.8

对比指标

21.8 及以下版本

23.8

查询性能

查询性能较差。例如,分布式表查询会被拆成多个重复的子查询。

查询性能提升约 20%。

内核稳定性

存在内存泄漏、内存限制不准确等问题,可能导致集群崩溃。

修复了内存管理缺陷,优化资源限制策略,稳定性显著提升。

监控能力

  • 低版本集群不支持Keeper 监控和快照备份。

  • 缺少ClickHouse内部特性的监控,比如mutation、merge、part等监控。

  • 新增 Keeper 监控、快照备份功能。

  • 集成了Prometheus,支持全链路指标可视化与告警。

这些功能增强了集群数据保护与运维能力。

数据备份与恢复

使用内核备份工具,3TB数据备份或恢复需要5天时间。

支持磁盘快照技术,秒级完成备份与恢复。

灾难恢复

无法在可用区发生异常时进行灾难逃逸。

支持快照和异步恢复机制,能够在数分钟内完成业务恢复。

内核 BUG 修复

云数据库ClickHouse通常将在开源社区的基础上延长1年的维护时间,低版本 BUG 不再修复。

在其生命周期内,持续提供技术支持。

更多各版本的功能支持情况,请参见社区兼容版架构

升级指南

旧版集群均需将版本升级至23.8。如何升级,请参见升级内核大版本

  • 本页导读
  • 旧版本集群存在的问题
  • 升级指南