文档

使用监控报警

更新时间:

监控功能可以帮助您全盘了解云电脑资源的使用情况和会话的连接情况,报警功能则可以结合监控指标上报相应资源在使用过程中的问题,以便您及时发现并解决问题,保证业务顺畅运行。本文介绍如何使用监控报警功能。

配置报警联系人

报警联系人是报警通知的接收者。

新建报警联系人

  1. 登录无影云电脑企业版控制台

  2. 在左侧导航栏,选择监控与报警 > 报警服务

  3. 单击报警联系人页签,然后单击新建报警联系人

  4. 新建报警联系人面板上配置以下信息,并单击确定

    • 姓名:联系人名称。

    • 联系方式:包括手机号、邮箱和钉钉机器人,至少填写其中一种。

      说明

      输入钉钉机器人回调地址后,请单击测试完成校验,校验成功后方可生效。

    • 报警通知信息语言:可选择中文、英语或跟随系统自动切换。

后续操作

  • 激活联系方式:您填写的联系方式不会直接生效,系统会将激活通知发送到您填写的各个联系方式。联系人本人必须在收到激活通知之后的24小时内,使用各个联系方式收到的激活信息分别进行激活操作。只有激活成功的联系方式才能接收报警信息。如果激活信息过期,则需要您在报警联系人页签上找到相应的联系人,并单击再次发送激活码

  • 编辑或删除联系人:在报警联系人页签的相应操作列单击查看/编辑删除。您也可以选中多个联系人进行批量删除。

配置报警联系组

报警联系组是报警联系人的集合。配置报警规则时,必须绑定报警联系组,不能直接绑定报警联系人。

新建报警联系组

新建报警联系组之前,必须确保已经创建好报警联系人。

  1. 在左侧导航栏,选择监控与报警 > 报警服务

  2. 单击报警联系组页签,然后单击新建联系组

  3. 新建报警联系组面板上配置以下信息,并单击确定

    1. 组名:报警联系组的名称。

    2. 备注(可选):对报警联系组的描述或其他备注信息。

    3. 报警联系人:请选择至少1个报警联系人。

      说明

      请确保报警联系人的联系方式已经通过验证,否则他们将无法通过该联系方式接收报警信息。

后续操作

  • 添加或移除报警联系人:在报警联系组页签的相应操作列单击查看/编辑,并按需移除或添加报警联系人。

  • 删除报警联系组:在报警联系组页签的相应操作列单击删除。如果该联系组内有联系人,则这些联系人仅会被移出联系组,不会被删除。

配置报警规则

报警规则用于规定哪些数据指标满足何种条件后触发报警,以及报警的级别、生效时间等。

新建报警规则

每条报警规则必须绑定一个报警联系组,因此在新建报警规则前,必须确保已经创建好报警联系组。

  1. 在左侧导航栏,选择监控与报警 > 报警服务

  2. 单击报警规则页签,然后单击创建报警规则

  3. 创建报警规则面板上配置以下信息,并单击确定

    配置项

    说明

    示例值

    报警规则名称

    报警规则的名称。

    CPU占用报警

    报警来源

    报警信息来源,默认为云电脑。

    云电脑

    关联范围

    • 全部资源:对全部云电脑执行该规则。

    • 云电脑实例:对您选择的云电脑执行该规则。

    全部资源

    指标类型

    • 单指标:仅监控一个指标,但可以为该指标制定多个不同级别的报警规则。

    • 多指标:同时监控多个指标,只能为所有指标制定同一种级别的报警规则,但需要制定复合触发条件。

    单指标

    生效时间

    报警规则的生效时间段。

    08:00-09:59

    通道沉默周期

    用于避免在一定时间段内由于持续触发报警规则而产生连续报警。如果在该周期结束后,仍然触发报警规则,则重新发送报警信息。

    30分钟

    报警组

    接收报警信息的联系组。

    运维一组

    单指标规则相关配置项

    报警指标

    需要监控的指标。

    当前消耗的总CPU百分比

    报警级别监控指标阈值

    针对报警指标制定的各个级别的报警触发条件。至少要制定一个级别的报警触发条件。

    普通

    平均值连续3个周期>80%

    多指标规则相关配置项

    报警级别

    不同级别的报警对应的报警信息发送方式不同:

    • 紧急:电话+短信+邮件+钉钉

    • 警告:短信+邮件+钉钉

    • 普通:邮件+钉钉

    普通

    报警级别监控指标阈值

    针对各个报警指标的报警触发条件。最多可设置10个条件。

    • 磁盘使用率平均值>80%

    • 内存使用率平均值>60%

    指标关系

    • 当所有指标符合条件时则报警:针对各个指标的触发条件之间是“且”的关系,即需要全部满足才会触发报警。

    • 当任意指标符合条件时则报警:针对各个指标的触发条件之间是“或”的关系,即只要满足任一条件就会触发报警。

    当任意指标符合条件时则报警

    报警所要达到的阈值次数

    需要在多少个连续周期内达到上述复合触发条件才会触发报警。

    连续3个周期

后续操作

  • 编辑报警规则:在报警规则页签的相应操作列单击修改,然后在创建报警规则面板上按需修改规则配置。

  • 禁用和启用报警规则:在报警规则页签的相应操作列单击禁用启用,然后在确认对话框中单击确认。禁用的报警规则只监控报警指标,不会发送报警信息。

  • 删除报警规则:在报警规则页签的相应操作列单击删除,然后在确认对话框中单击确认

查看报警历史记录

  1. 在左侧导航栏,选择监控与报警 > 报警服务

  2. 执行以下操作之一:

    • 单击报警记录页签,然后输入报警规则的名称或ID来筛选出相关的报警记录。如果需要导出报警记录,可以在报警记录页签右上角单击导出图标。

    • 单击报警规则页签,在目标报警规则的操作列中单击报警详情。在报警记录详情页面,您可以选择预设的时间段或自定义一个时间段。

常见问题

配置了报警规则,但收不到报警怎么办?

云电脑的部分数据指标依赖云监控Agent进行数据采集。云监控Agent在云电脑内默认为关闭状态,如发现数据指标缺失,可以按以下步骤开启云监控Agent:

  1. 在云电脑中按快捷键Win+R,然后在运行窗口中输入services.msc并按回车以打开服务窗口。

  2. 服务窗口中,找到名为argusagent service的服务,右键单击该服务并选择属性

  3. 常规页签上,将启动类型设置为自动。若该服务当前未运行,则在服务状态区域单击启动,然后单击确定