通过云监控服务监控云盒资源和IDC环境

云监控是一项针对阿里云资源和互联网应用进行监控的服务,您可以基于监控指标设置报警规则,当监控数据符合报警规则时,云监控会自动发送报警通知。通过云监控对云盒资源和IDC环境进行监控,可以方便您了解资源运行状态和IDC情况,及时处理异常。

背景信息

对于云盒,云监控支持以下监控指标:

  • 块存储:使用容量、总容量,容量使用率。

  • 网络:流入包速率、流入带宽、流入限速丢包速率、流出包速率、流出带宽、流出限速丢包速率。

  • IDC:温度、湿度。

您可以在云盒详情页面的基本信息监控页签下,按照时间段查看块存储、网络和IDC监控数据对应的图表。具体操作,请参见以下文档:

开启一键报警

一键报警功能可以一键开启云盒默认监控项的报警任务,快速建立报警体系。

  1. 登录云盒控制台

  2. 在顶部导航栏,选择云盒所在地域。

  3. 云盒列表页签,单击目标云盒ID。

  4. 在云盒详情页面,单击监控页签,然后单击右上角的一键报警

  5. 在弹出的对话框中,在一键报警设置页签下,打开一键报警开关。

    一键报警.png

    开启后,将按照默认设置的报警规则监控相关指标。您可以根据需要禁用、修改或者删除报警规则。

    操作

    说明

    禁用报警规则

    单击规则对应的禁用,即可禁用该条规则。您也可以前往云监控控制台进行禁用操作。

    修改或删除报警规则

    1. 单击前往云监控编辑

    2. 一键报警页面,找到云盒。

    3. 展开查看云盒报警规则,根据需要单击规则对应的修改删除

创建自定义报警规则

如果一键报警的规则无法满足您的需求,您可以创建自定义报警规则。支持以下两种方式:

  • 通过云盒控制台:为某个云盒设置报警规则,规则配置相对简单,适用于监控指标需求单一,快速操作的场景。

  • 通过云监控控制台:为一个或多个云盒设置报警规则,规则配置更为复杂,适用于监控指标需求复杂的场景。

通过云盒控制台

  1. 登录云盒控制台

  2. 在顶部导航栏,选择云盒所在地域。

  3. 云盒列表页签,单击目标云盒ID。

  4. 在云盒详情页面,单击监控页签,然后单击右上角的一键报警

  5. 在弹出的对话框中,单击创建自定义报警规则

  6. 完成报警规则配置。

    创建自定义报警规则.png

    向导页

    参数

    说明

    添加报警规则

    报警规则

    报警规则的主体。当监控数据满足报警条件时,触发报警规则。

    每条规则包括以下信息:

    • 规则名称:自定义输入。

    • 监控指标:选择某个云盒监控指标。

    • 规则内容:根据选择的监控指标设置规则,包括统计周期、持续周期、取值对象、运算符和阈值。

    通道沉默周期

    报警发生后未恢复正常,间隔多久重复发送一次报警通知。

    例如:当通道沉默周期选择3小时时,在3小时内监控指标持续超过报警阈值的情况下,只会发送一次报警通知;若在3小时后,监控指标仍没有恢复正常,云监控会再次发送报警通知。

    有效时段

    报警规则的生效时间段。仅在该时间段触发报警规则,云监控才会发送报警通知。

    设置通知方式

    报警通知对象

    报警联系人。关于如何创建报警联系人,请参见创建报警联系人或报警联系组

    报警通知方式

    按需选择通知方式,支持电话、短信、邮件、钉钉机器人等。

    报警回调地址

    公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。关于如何设置报警回调,请参见使用阈值报警回调

通过云监控控制台

  1. 登录云监控控制台

  2. 在左侧导航栏,单击云产品监控

  3. 云产品监控页面,选择云盒

  4. 单击创建报警规则

  5. 完成报警规则配置。

    需要注意的配置项如下,更多信息,请参见创建报警规则

    参数

    说明

    产品

    选择云盒

    资源范围

    选择为哪些云盒设置报警规则。

    规则描述

    报警规则的主体。当监控数据满足报警条件时,触发报警规则。

    每条规则包括以下信息:

    • 规则名称:自定义输入。

    • 监控指标:支持基于单指标或多指标。

    • 规则内容:根据选择的监控指标设置规则,包括报警级别、持续周期、取值对象、运算符和阈值。

    关于如何设置复杂的报警条件,请参见报警规则表达式说明

    通道沉默周期

    报警发生后未恢复正常,间隔多久重复发送一次报警通知。

    例如:当通道沉默周期选择3小时时,在3小时内监控指标持续超过报警阈值的情况下,只会发送一次报警通知;若在3小时后,监控指标仍没有恢复正常,云监控会再次发送报警通知。

    生效时间

    报警规则的生效时间段。仅在该时间段触发报警规则,云监控才会发送报警通知。

    报警联系人组

    报警联系人。关于如何创建报警联系人,请参见创建报警联系人或报警联系组