运维事件管理

您可以通过Hologres运维事件获取当前实例所面临的风险或运维事件,包含架构升级、系统维护和代理版本升级事件,然后根据业务情况,及时响应相关事件,从而避免实例的可用性受到影响,提升实例的稳定性。

查看运维事件

  1. 登录Hologres管理控制台

  2. 在顶部菜单栏左侧,选择相应的地域。

  3. 在左侧导航栏单击运维事件管理

  4. 运维事件管理页面,单击计划内事件历史事件,查看当前账户下所有实例产生的运维事件。关于统计的运维事件类型详情,请参见事件说明

    • 计划内事件:统计在计划进行或者正在进行事件信息。

    • 历史事件:统计已经运行完成的事件信息,包含运行失败和成功的事件。

设置运维事件通知

当Hologres发起事件时,系统将自动通过短信、邮件等方式推送信息至实例对应的阿里云账号(主账号)。同时,相应的事件也会被推送到云监控的系统事件中,您可以根据业务情况为对应的事件设置报警,以便及时了解事件变更的进展。具体操作,请参见使用系统事件报警

事件说明

对Hologres推送的事件类型、运维操作以及事件对业务的影响介绍如下。

事件类型

事件说明

运维操作

业务影响

系统维护

常见的原因如下:

  • 因严重问题和安全缺陷等需要实例升级。

  • 超过产品生命周期策略的自动升级。

  • 计算集群迁移。

  • 因硬件或网络等问题引起的后台运维重启。

  • 更改实例配置。

常见的运维操作如下:

  • 重启实例

  • 冷升级实例版本

  • 热升级实例版本

运维操作对应的影响如下:

  • 重启实例:实例业务将发生短暂中断,通常持续时间为分钟级别。

  • 冷升级实例版本:实例停服。根据实例规模停服时间不同,通常持续时间为分钟级别。

  • 热升级版本:实例停写不停读。根据实例规模停写时间不同,通常10分钟内,中间实例会出现一次短暂中断。

代理版本升级

常见的原因如下:

  • 代理客户在后台为实例执行版本升级。

常见的运维操作如下:

  • 冷升级实例版本

  • 热升级实例版本

运维操作对应的影响如下:

  • 冷升级实例版本:实例停服。根据实例规模停服时间不同,通常持续时间为分钟级别。

  • 热升级版本:实例停写不停读。根据实例规模停写时间不同,通常10分钟内,中间实例会出现一次短暂中断。

架构升级

常见的原因如下:

  • 底层技术架构升级。

常见的运维操作如下:

  • 迁移实例可用区

运维操作对应的影响如下:

  • 迁移实例可用区:相当于实例执行一次热升级,操作期间实例停写不停读。根据实例规模停写时间不同,通常10分钟内,中间实例会出现一次短暂中断。

说明

迁移可用区后的实例基本配置保持不变,但请及时关注网络连接情况。