监控报警概述

无影云电脑的监控报警功能可以全方面地监控云电脑的分布情况、云电脑资源使用情况、会话连接情况以及网络运行状况等,帮助您全盘了解资源健康状况,及时发现并解决问题,以保证业务顺畅运行。

功能介绍

监控大盘展示云电脑相关的整体数据指标,帮助您从全局视角了解云电脑的使用情况、分布情况和云电脑资源的健康状况。

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的损失。

报警服务基于监控指标的基础上,上报相应资源在使用过程中触发监控指标阈值后的告警信息,以便及时提醒您云电脑资源使用过程中面临的问题,有助于及时调整和整合资源,发现并解决问题,确保业务正常。

数据指标

说明

云电脑统计和状态

您阿里云账号下的所有云电脑(包括独占云电脑和共享云电脑)数量,以及处于运行中已关机状态的云电脑数量,整体了解云电脑的数量和状态。

资源概况

云电脑的CPU、GPU、内存和存储(系统盘和数据盘)等资源的整体使用情况。

会话连接信息

不同时间段用户会话连接的数量。关于云电脑会话的更多信息,请参见查看会话监控信息

登录时间

终端用户连接云电脑所需的平均时间和最长时间。

网络延迟

云电脑的网络延迟数据和分布。支持查看不同时段的网络延迟数据。

资源占用情况

CPU、GPU、内存和存储占用排名靠前的分别是哪几台云电脑。

关于每台云电脑的资源使用率、网络延迟、云电脑连接流入/出带宽等信息,请参见查看云电脑监控信息

分布情况

授权用户、终端分布和云电脑地域分布情况。

故障预警

云电脑的故障信息、故障原因及故障时间等信息。

使用场景

  • 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,及时解决故障。同时,报警功能可以帮助您了解核心资源的使用情况,及时发现并处理问题,有助于准确调整相关配置。

  • 在对业务进行运维检查及整体优化评估时,您可以根据监控大盘和实时监控提供的相关数据信息寻找优化方向;同时基于告警信息、终端用户登录数据、登录失败记录和网络数据趋势图,分析并发现出现异常的高峰时段,便于及时应对与防范。

运维监控权限

权限是指在某种条件下允许或拒绝对某些资源执行某些操作,您可以通过权限管控避免不必要的麻烦或损失。在实施运维监控管理前,需获取相应的查看或者操作权限。更多信息,请参见为RAM用户授权

查看监控大盘

  1. 登录无影云电脑企业版控制台

  2. 在左侧导航栏,选择监控与报警 > 监控大盘

  3. 监控页面,可以总览云电脑的各方面指标,包括云电脑数量、云电脑状态、登录耗时、云电脑网络延迟等。

    说明

    您可以在监控页面的右上角单击小喇叭..png图标或小警报..png图标查看告警信息。在报警对话框的右上角单击查看更多报警可以进入报警记录页面查看报警详情。

查看实时监控

  1. 在左侧导航栏,选择监控与报警 > 实时监控

  2. 实时监控页面,可以查看云电脑终端用户登录云电脑的数据、云电脑网络延迟和故障预警等信息。

常见问题

配置了报警规则,但收不到报警怎么办?

云电脑的部分数据指标依赖云监控Agent进行数据采集。云监控Agent在云电脑内默认为关闭状态,如发现数据指标缺失,可以按以下步骤开启云监控Agent:

  1. 在云电脑中按快捷键Win+R,然后在运行窗口中输入services.msc并按回车以打开服务窗口。

  2. 服务窗口中,找到名为argusagent service的服务,右键单击该服务并选择属性

  3. 常规页签上,将启动类型设置为自动。若该服务当前未运行,则在服务状态区域单击启动,然后单击确定