云数据库Redis已接入云监控平台,通过对重要的监控指标设置报警规则,让您在第一时间得知指标数据或实例发生异常,帮您迅速定位处理故障。

背景信息

云监控(CloudMonitor)是针对阿里云资源和互联网应用提供监控的服务,为您提供开箱即用的企业级开放型一站式监控解决方案。您可以创建报警规则、设置监控项,在监控项的报警规则被触发时,云监控将通知报警联系组中的所有联系人。

说明 报警联系人和联系组是云监控发送报警通知的基础。您需要先创建报警联系人和报警联系组,并将报警联系人添加到报警联系组。具体操作,请参见创建报警联系人或报警联系组

操作步骤

  1. 登录Redis管理控制台
  2. 在顶部菜单栏的左上角,选择实例所属的地域。
  3. 实例列表页,单击目标实例ID。
  4. 在左侧导航栏,单击报警设置
  5. 报警设置页面,查看当前实例的监控项。您也可以单击页面右上方报警设置,进入云监控控制台,添加或管理报警规则。报警设置页面

    云监控平台目前支持的报警类型如下:

    报警监控类型 支持选择的关联产品 支持的监控指标 说明 配置方法
    阈值报警

    在创建阈值报警时,您需要选择目标实例的类型,当前支持下述类型:

    选择关联产品
    • Redis标准版
    • Redis集群版
    • Redis读写分离版
    • Tair容量存储型主从版
    • Tair持久内存型标准版
    • Tair持久内存型集群版
    不同产品支持的监控指标有所不同,其中,集群版和读写分离版支持分别监控数据节点和Proxy节点的指标。更多信息,请参见Redis标准版Redis集群版Redis读写分离版 当监控项超过设定阈值时(例如实例的CPU使用率大于90%),系统将自动发送报警通知,帮助您及时了解监控数据异常并处理。

    通常情况下,业务对Redis的CPU、内存和网络流量的波动比较敏感,建议为下述关键指标设置报警阈值:

    • CPU使用率:大于60%。
    • 内存使用率:大于80%。
    • 流入带宽使用率和流出带宽使用率:大于80%。
    • 磁盘使用率(仅Tair容量存储型主从版):大于80%。
    创建阈值报警规则
    事件报警 不涉及
    • InstanceMaintenance(主动运维事件)
    • 异常
    • 维护
    当云数据库Redis产生了主动运维事件(如实例迁移)、实例发生了故障或触发了高可用切换,系统将自动发送报警通知,帮助您及时接收报警通知并处理。 订阅事件通知