告警描述
用户可以根据业务特征,为集群或者租户配置 TPS、QPS、时延等流量型告警。在业务流量因异常突增情况下及时通知。
由于每个集群的业务特征和请求类型不同,建议业务在进行压测后来进行监控指标配置。
规则信息
告警项 | 指标类型 | 监控指标名 | 告警指标 | 持续时间(连续触发告警周期数) | 检测周期 | 告警级别 |
---|---|---|---|---|---|---|
租户写请求数告警 | 单指标 | 租户 / 写请求量 | 一般为业务压测最大值的 80%。 | 3 | 1 分钟 | Warn |
租户读请求数告警 | 单指标 | 租户 / 读请求量 | 3 | 1 分钟 | Warn | |
租户写请求响应时间 | 单指标 | 租户 / 写请求响应时间 | 跟进业务可接受范围配置 | 3 | 1 分钟 | Warn |
租户读请求响应时间 | 单指标 | 租户 / 读请求响应时间 | 3 | 1 分钟 | Warn |
对系统的影响
业务的服务质量下降。
可能原因
业务上线等操作导致流量突增。
业务量发展过大。
处理方法
一般情况下通过租户或者集群资源扩容解决。
文档内容是否对您有帮助?