云数据库Redis已接入云监控平台,通过对重要的监控指标设置报警规则,让您在第一时间得知指标数据或实例发生异常,帮您迅速定位处理故障。
背景信息
云监控(CloudMonitor)是针对阿里云资源和互联网应用提供监控的服务,为您提供开箱即用的企业级开放型一站式监控解决方案。您可以创建报警规则、设置监控项,在监控项的报警规则被触发时,云监控将通知报警联系组中的所有联系人。
说明 报警联系人和联系组是云监控发送报警通知的基础。您需要先创建报警联系人和报警联系组,并将报警联系人添加到报警联系组。具体操作,请参见创建报警联系人或报警联系组。
操作步骤
- 访问Redis实例列表,在上方选择地域,然后单击目标实例ID。
- 在左侧导航栏,单击报警设置。
- 在报警设置页面,查看当前实例的监控项。您也可以单击页面右上方报警设置,进入云监控控制台,添加或管理报警规则。
云监控平台目前支持的报警类型如下:
报警监控类型 支持选择的关联产品 支持的监控指标 说明 配置方法 阈值报警 在创建阈值报警时,您需要选择目标实例的类型,当前支持下述类型:
- Redis标准版
- Redis集群版
- Redis读写分离版
- Tair容量存储型主从版
- Tair持久内存型标准版
- Tair持久内存型集群版
不同产品支持的监控指标有所不同,其中,集群版和读写分离版支持分别监控数据节点和Proxy节点的指标。更多信息,请参见Redis标准版、Redis集群版、Redis读写分离版。 当监控项超过设定阈值时(例如实例的CPU使用率大于90%),系统将自动发送报警通知,帮助您及时了解监控数据异常并处理。 通常情况下,业务对Redis的CPU、内存和网络流量的波动比较敏感,建议为下述关键指标设置报警阈值:
- CPU使用率:大于60%。
- 内存使用率:大于80%。
- 流入带宽使用率和流出带宽使用率:大于80%。
- 磁盘使用率(仅Tair容量存储型主从版):大于80%。
创建阈值报警规则 事件报警 不涉及 - InstanceMaintenance(主动运维事件)
- 异常
- 维护
当云数据库Redis产生了主动运维事件(如实例迁移)、实例发生了故障或触发了高可用切换,系统将自动发送报警通知,帮助您及时接收报警通知并处理。 订阅事件通知