云数据库ClickHouse社区兼容版集群的运维事件(例如小版本升级、网络升级等)除了通过短信、语音、邮件或站内信通知之外,还会在控制台进行通知。您可以在计划内事件中,查看具体的集群ID、事件类型、地域、事件原因和业务影响等,也可以手动修改计划切换时间。
注意事项
云数据库的待处理事件(如版本升级、网络升级等)通常至少在执行前的3天通知您,通知方式为短信、语音、邮件、站内信或控制台等。紧急风险修复类事件由于需要尽快修复,通常会在执行前的3天或更短的时间内发送通知并修复。
为了确保您及时能收到相应的事件通知消息,请确认云数据库故障或运维通知的通知开关处于开启状态并设置了消息接收人(建议设置为数据库运维人员)。您可以登录消息中心查看通知开关和设置消息接收人。
操作步骤
在页面左上角,选择目标地域。
在左侧导航栏,单击事件管理。
说明强制要求预约时间的运维事件会弹窗提醒,请尽快完成预约。
在计划内事件页面,可以查看事件的详细信息。
例如目标实例ID、地域、事件类型、事件原因、业务影响、计划切换时间和运行状态等信息。关于事件的产生原因及对业务的影响,请参见事件的原因与影响。
可选:修改切换时间。
除了系统默认切换时间以外,您可以修改计划切换时间或配置周期切换时间。系统将按照计划切换时间 > 周期切换时间 > 系统默认切换时间的优先级执行切换。
切换时间方式及说明
操作步骤
计划切换时间
可以根据实际需要,提前或推迟目标事件的计划切换时间。
在计划内事件列表中,选择目标事件(一个或多个)。
单击计划内事件列表左下方的计划时间配置。
在计划时间配置面板,设置计划切换时间。
若您需要立即执行切换,请选中设置最早执行时间,确定后集群将立即开始执行切换准备,若此时已准备完成,将立即切换。
说明计划切换时间不能晚于最晚操作时间。
确认需要进行切换的任务是否正确。
是:单击确定保存。
否:在计划内事件列表中,选中正确的目标事件,然后重新设置计划切换时间。
周期切换时间
设置周期切换时间后,会在指定周期切换时间点时,对计划内所有未执行且未设置计划切换时间的事件执行切换。
例如设置周期切换时间为周二 00:00:00,计划内的多个集群将在相同时间执行切换,降低因切换带来的影响。
单击计划内事件列表左上方的周期时间配置。
在周期时间配置面板,您可以根据业务需要按周或月两个维度设置周期切换时间。
说明您可以在计划内事件列表右上方查看设置的周期切换时间。如果您设置的周期时间为无,则不展示。
单击确定保存。
可选:取消切换计划。
在计划内事件列表中,选择目标事件(一个或多个)。
单击页面左下方的取消计划配置。
在取消计划配置面板,仔细阅读操作取消风险。
单击确定。
事件的原因与影响
为了规避已知的内核问题,提升您使用集群的体验,建议您定期升级集群内核的小版本。小版本升级事件的具体原因,请参见版本发布记录。
事件原因 | 影响类型 | 影响说明 |
小版本升级(ZooKeeper) |
| 进入计划切换时间后,整个升级过程大约2~3分钟。建议您在业务低峰期进行升级,并保证业务有重试机制。具体影响如下: 升级过程中因ZooKeeper节点无法工作,在集群中针对分布式表、ReplicatedMergeTree引擎表的读写操作会无法正常进行(包括查询、插入以及已经创建的通过Kafka引擎同步分布式表等操作)。 |
小版本升级(社区兼容版ClickHouse) |
| 进入计划切换时间后,整个升级过程大约需要5到8分钟,具体时间和集群的库表数量以及数据量有较大关系,库表数量和数据量较大时,耗时会更久。建议您在业务低峰期进行升级,并保证业务有重试机制。具体影响如下:
|
小版本升级(企业版ClickHouse) | 集群闪断 | 进入计划切换时间后,整个升级过程大约需要10到15分钟,具体时间和集群的库表数量以及数据量有较大关系,库表数量和数据量较大时,耗时会更久。建议您在业务低峰期进行升级,并保证业务有重试机制。具体影响如下: 升级过程中会针对Keeper、ClickHouse计算节点进行分批重启升级,过程中会涉及到请求路由在不同节点中切换的现象,因此集群会有秒级闪断。 |
网络升级 | 集群闪断 | 进入计划切换时间后,整个升级过程大约1~2分钟(其中业务影响为秒级)。建议您在业务低峰期进行升级,并保证业务有重试机制。具体影响如下: 升级过程中集群会自动进行网络模式的切换,可能导致当前已建立的数据库连接断开,重新尝试即可恢复连接。 |