当您需要监控各云产品资源的使用情况时,针对CPU类、请求数类、流量类、耗时类和消费数的监控指标,推荐您创建智能阈值报警规则。如果资源的监控指标达到报警条件,云监控自动发送报警通知,帮助您及时得知异常监控数据并快速处理。
前提条件
使用限制
监控指标一个时间序列正常输出的智能阈值需要满足以下条件:
数据条件:最近168小时(7天)内,监控指标数据量不低于48小时应产生的数据总量。
说明智能阈值预览结果的计算也需要满足上述数据条件。
时间条件:在满足数据条件的基础上,智能阈值报警规则保存成功约20分钟后,才能产生智能阈值。
说明智能阈值产生之后,每隔20分钟会重新检查上述数据条件是否满足,以及是否有指标数据更新。只有符合上述数据条件且存在指标数据更新的情况下,才会产出新的智能阈值。
操作步骤
登录云监控控制台。
在左侧导航栏,选择 。
在报警规则页面,单击创建报警规则。
在创建报警规则面板,设置报警规则相关参数。
示例:为云服务器ECS某个实例的CPU使用率每分钟的最大值设置智能阈值报警规则,当该监控指标连续3个点高于上边界,给报警联系组Alarm_Group内的所有报警联系人发送警告级别的报警通知。
先选择产品为云服务器ECS,再单击资源范围中的实例页签,然后关联资源选择一个或多个ECS实例。
设置规则条件。
单击添加规则。
在添加规则描述面板,先输入规则名称,再单击指标类型中的智能阈值页签,然后监控指标选择
,统计数据选择最大值,统计数据的周期选择1分钟,报警条件选择高于上边界,报警敏感度选择高,触发条件选择连续3个周期(1周期=1分钟)。报警敏感度越高,报警越频繁。报警敏感度包括以下3个等级:
高敏感度:上下边界阈值和真实数值比较接近,小幅度波动即可触发报警条件,报警次数较多,适用于核心业务的核心监控指标。
中敏感度:上下边界阈值距离真实数值适中,报警次数适中,适用于重要业务的常用监控指标。
低敏感度:上下边界阈值和真实数值相比留有较大冗余,大幅度波动才可触发报警条件,报警次数较少,适用于一般业务的常用监控指标。
单击确定。
报警联系人组选择Alarm_Group,其他参数均保持默认或不设置。
说明关于报警规则相关参数的更多信息,请参见报警规则参数说明。
单击确认。
查看智能阈值报警详情。
在报警规则页面,先选择阈值类型为智能阈值,筛选出所有智能阈值,再单击目标报警规则对应操作列的详情。
在报警规则详情面板的详情页签,您可以在智能阈值曲线图区域查看目标实例的智能阈值图。