ECS洞察

云监控2.0提供了ECS洞察应用,提供对主机性能,进程,资源,事件等全方位数据的监控。

应用接入

  1. 登录云监控2.0控制台,单击目标工作空间后,在接入中心,针对ECS可观测有两类接入方式,可按需选择接入:

    • 阿里云服务器ECS:一次接入多维度可观测数据,包括ECS实例的指标、审计日志、系统事件。区域下批量接入(不再区分VPC)服务器ECS实例,指标部分包括云监控无代理指标、Exporter 代理指标(自动区分和接入LinuxWindows实例并自动安装 Exporter)。

    • 阿里云服务器ECS(GPU卡监控):针对阿里云服务器GPU实例自动安装 Gpu-exporter 收集指标,目前GPU 卡类型支持 A10 和 V100,操作系统支持 Alibaba Cloud Linux、CentOS、Ubuntu。

  2. 选择接入方式后,在接入配置页面可使用默认配置,直接单击确定等待接入完成。也可以按需根据页面提示进行自定义接入配置。

  3. 接入成功后,可在接入中心的接入管理中进行查看。接入后会为用户自动在SLS创建对应Project以存储相应指标与日志。image

应用概览

登录云监控2.0控制台,单击目标工作空间后,在应用中心,单击ECS洞察,会跳转到ECS洞察概览页,概览提供总览视角查看用户所有的阿里云服务器ECS实例数量、vCPU总量、内存总量、实例健康状态、可观测治理(接入可观测实例数)等。

  • 用户实例总量分析:

    • 用户维度统计所有的阿里云服务器ECS实例数量、vCPU申请总量、Memory申请总量。

    • 区域维度统计所有的阿里云服务器ECS实例数量、vCPU申请总量、Memory申请总量。

  • 用户实例状态分析:

    • 阿里云服务器ECS实例的健康状态,提供横向瞬时对比、横向时序分析、正常/异常实例数量统计。

    • 阿里云服务器ECS实例的异常状态(GuestOS),提供横向瞬时对比、横向时序分析、正常/异常实例数量统计。GuestOS 为用户操作系统内异常操作导致的ECS实例健康状态异常。

    • 阿里云服务器ECS实例的异常状态(Host),提供横向瞬时对比、横向时序分析、正常/异常实例数量统计。Host 为阿里云底层宿主机异常操作导致的ECS实例健康状态异常。

  • 可观测治理(无代理指标):

    • 无代理指标(采集云监控指标)实例的接入数、接入占比、云监控指标采集状态及接入实例列表。

  • 可观测治理(Exporter代理指标):

    • 无代理指标(采集云监控指标)实例的接入数、接入占比、Exporter 指标采集状态、接入实例列表。

  • 可观测资源分析(接入实例):

    • 接入可观测的阿里云服务器ECS实例的资源统计,包括vCPU核数、Memory 申请量/剩余量、Disk 申请量/剩余量、规格分布、进程和线程统计。

更多操作

  • 资源中心:ECS实例与实例中进程的展示。

  • 洞察:对主机资源,性能,进程,事件等全方位的监控。

  • 告警管理:设置告警规则与告警历史查看。

  • 数据探索:对指标,日志,事件等日志进行查询分析。