计划内事件

RDS运维事件(如实例迁移、版本升级等)除了在短信、语音、邮件或站内信通知之外,还会在控制台进行通知。您可以查看具体的事件类型、地域、事件原因和业务影响,以及涉及的实例ID,同时也可以手动修改计划切换时间。

前提条件

有未处理的运维事件。

说明

您可以将鼠标移动到控制台右上角的通知图标上查看是否有未处理的运维事件。

注意事项

  • 事件按紧急程度不同分为两类:

    • 【S0紧急级别】风险修复:通常是非预期的需要尽快修复避免故障的场景,因此其通知可能会提前3天或更早且允许修改计划切换时间的窗口更小,典型场景为紧急问题版本替换升级、宿主机异常修复、SSL证书过期升级等。

    • 【S1计划级别】系统维护:通常是低风险问题修复或有计划的软硬件升级换代,通常提前3天以上发送通知且允许用户取消事件。

  • 为了确保您能接收运维事件的预约通知,您需要登录消息中心,确保云数据库故障或运维通知的通知方式复选框处于选中状态并设置消息接收人(推荐设置为数据库运维人员),否则您将无法收到事件通知信息。通知方式为短信、邮件、站内信,建议同时选中短信和邮件,提高触达成功率。

    image.png

    图1 消息中心通知设置入口

    image

    图2 云数据库通知设置

  • 如您需要第一时间获知运维事件的动态或者希望通过事件驱动的方式做自定义运维自动化,您可以通过云监控平台配置系统事件订阅。云数据库会对运维事件的生命周期(预约、开始、完成、取消等)推送云监控系统事件。具体操作,请参见管理事件订阅(推荐),可订阅的云监控事件参见附录1 云监控相关系统事件

    云监控事件格式示例:

    {
      "eventId": "c864b30b-7f69-5f04-b0e7-8dfb0eabcfd9", // 事件ID,同一个事件的ID相同
      "product": "RDS",                                  // 产品代码
      "reason": "Host software/hardware upgrade",        // 事件原因
      "extra": {
        "impactZh": "实例闪断",                           // 事件影响
        "impactEn": "Transient instance disconnection",  // 事件影响
        "eventCode": "rds_apsaradb_transfer",            // 运维事件类型代码
        "eventNameEn": "Instance migration",             // 运维事件名称
        "eventNameZh": "实例迁移",                        // 运维事件名称   
        "switchTime": "2024-09-15T01:30:00+08:00",       // 计划切换时间,如果有切换即为实例连接闪断的时间
        "startTime": "2024-09-14T21:30:00+08:00",          // 计划开始时间,进入调度队列等待执行
        "cancelCode": "OutOfGoodPerfBySoftHardwareUpgrade", // 取消风险码,参见附录2: 详细原因码和取消风险
        "detailCode": "HostSoftHardwareUpgrade",            // 详细原因码,参见附录2: 详细原因码和取消风险
        "instanceInfo": ""
      },
      "instanceId": "rm-2ze9d66o65q1g02g6",             // 实例ID
      "eventType": "Maintenance",
      "instanceComment": "rm-2ze9d66o65q1g02g6",        // 实例别名
      "instanceType": "Instance",
      "publishTime": "2024-09-10T16:01:47+08:00"
    }

操作步骤

  1. 登录RDS管理控制台

  2. 在左侧导航栏单击事件中心

    说明

    强制要求预约时间的运维事件会弹窗提醒,请尽快完成预约。

  3. 可选:计划内事件页面,可以进行周期时间窗口配置。

    说明

    周期时间窗口配置是数据库主动运维事件的全局配置项(不包含紧急风险修复类事件)。周期时间设置后,新生成的主动运维事件的计划切换时间会自动命中周期时间;如果不设置周期时间,新生成的主动运维事件的计划切换时间会自动命中实例的可维护时间段

    1. 单击周期时间窗口配置

    2. 在弹出的面板中,设置周期时间并单击确定保存

  4. 计划内事件页面,可以查看事件的详细信息,如需修改事件的切换时间,请选中目标实例,单击计划时间配置

    说明

    不同类型的事件显示的信息有所不同,请以实际页面为准。

  5. 计划时间配置对话框中,设置计划切换时间并单击确定

    说明
    • 您可以选中设置最早执行时间,系统将自动填充最近的计划切换日期和时间。单击确定保存后实例开始切换准备,进入待处理状态;取消选中后,可自定义修改计划切换日期和时间。

    • 计划切换时间不能晚于最晚操作时间

事件的原因与影响

事件原因

影响类型

影响说明

实例迁移

说明

因主机风险、硬件过保或操作系统升级而发起的计划内运维操作,系统会将实例迁移至新的服务器节点,包含非高可用实例和只读实例。

实例切换

进入计划切换时间(待处理事件通常会引起实例切换操作,该操作将在计划切换时间之后的实例可维护时间段执行)后,将产生下述影响:

  • 出现实例切换及30秒以内的只读状态(用于等待数据完全同步),请在业务低峰期执行,并确保应用程序具备重连机制。实例切换的影响,请参见实例切换的影响

  • 短暂影响该实例在DMSDTS中的使用,操作完成后自动恢复正常。

主备切换

说明

因主机风险、硬件过保或操作系统升级而发起的计划内运维操作,系统会将发起主备节点切换操作,仅包含高可用实例。

SSL证书更新

说明

为保障实例持续提供更出色的安全性和稳定性,当实例的SSL证书即将过期时会发起该操作。

备份模式升级

说明

为保障实例提供更快速的备份恢复能力,将实例的备份模式从逻辑备份切换到物理库表备份。

小版本升级

说明

为提升用户体验,云数据库会不定期地发布实例的小版本,用于丰富云产品功能或修复已知缺陷。

实例切换

进入计划切换时间(待处理事件通常会引起实例切换操作,该操作将在计划切换时间之后的实例可维护时间段执行)后,将产生下述影响:

  • 出现实例切换及30秒以内的只读状态(用于等待数据完全同步),请在业务低峰期执行,并确保应用程序具备重连机制。实例切换的影响,请参见实例切换的影响

  • 短暂影响该实例在DMSDTS中的使用,操作完成后自动恢复正常。

小版本号间的差异

不同的小版本号(内核版本号)更新的内容有所区别,您需要关注升级后的小版本和当前小版本的差异,具体请参见相关产品的小版本更新日志(部分产品暂未开放小版本更新日志):

代理小版本升级

说明

为提升用户体验,云数据库会不定期地发布代理节点(Proxy)的小版本,用于丰富代理服务的功能或修复已知缺陷。

实例切换

进入计划切换时间(待处理事件通常会引起实例切换操作,该操作将在计划切换时间之后的实例可维护时间段执行)后,将产生下述影响:

  • 出现实例切换及30秒以内的只读状态(用于等待数据完全同步),请在业务低峰期执行,并确保应用程序具备重连机制。实例切换的影响,请参见实例切换的影响

  • 短暂影响该实例在DMSDTS中的使用,操作完成后自动恢复正常。

小版本号间的差异

不同的小版本号更新的内容有所区别,您需要关注升级后的小版本和当前小版本的差异。

网络升级

说明

为提升实例的网络性能和稳定性而升级网络硬件。

实例切换

进入计划切换时间(待处理事件通常会引起实例切换操作,该操作将在计划切换时间之后的实例可维护时间段执行)后,将产生下述影响:

  • 出现实例切换及30秒以内的只读状态(用于等待数据完全同步),请在业务低峰期执行,并确保应用程序具备重连机制。实例切换的影响,请参见实例切换的影响

  • 短暂影响该实例在DMSDTS中的使用,操作完成后自动恢复正常。

VIP直连影响

部分网络升级过程中可能涉及跨可用区迁移,实例的虚拟IP(VIP)地址会发生改变,如果客户端使用VIP连接云数据库将会引起连接中断。

说明

为避免影响,您应当使用实例提供的域名形式的连接地址,同时关闭应用及其所属服务器的DNS缓存。

主机软件或硬件升级

说明

因主机风险、软件或硬件升级而发起的计划内运维操作,系统将重启实例。

实例重启

进入重启时间(待处理事件通常会引起实例重启操作,该操作将在计划重启时间之后的实例可维护时间段执行)后,将产生下述影响:

  • 出现实例重启及60秒左右的不可用状态(用于重启数据库进程),请在业务低峰期执行,并确保应用程序具备重连机制。

  • 短暂影响该实例在DMSDTS中的使用,操作完成后自动恢复正常。