云监控2.0提供了ECS洞察应用,提供对主机性能,进程,资源,事件等全方位数据的监控。
应用接入
登录云监控2.0控制台,单击目标工作空间后,在接入中心,针对ECS可观测有两类接入方式,可按需选择接入:
阿里云服务器ECS:一次接入多维度可观测数据,包括ECS实例的指标、审计日志、系统事件。区域下批量接入(不再区分VPC)服务器ECS实例,指标部分包括云监控无代理指标、Exporter 代理指标(自动区分和接入Linux和Windows实例并自动安装 Exporter)。
阿里云服务器ECS(GPU卡监控):针对阿里云服务器GPU实例自动安装 Gpu-exporter 收集指标,目前GPU 卡类型支持 A10 和 V100,操作系统支持 Alibaba Cloud Linux、CentOS、Ubuntu。
选择接入方式后,在接入配置页面可使用默认配置,直接单击确定等待接入完成。也可以按需根据页面提示进行自定义接入配置。
接入成功后,可在接入中心的接入管理中进行查看。接入后会为用户自动在SLS创建对应Project以存储相应指标与日志。
应用概览
登录云监控2.0控制台,单击目标工作空间后,在应用中心,单击ECS洞察,会跳转到ECS洞察概览页,概览提供总览视角查看用户所有的阿里云服务器ECS实例数量、vCPU总量、内存总量、实例健康状态、可观测治理(接入可观测实例数)等。
用户实例总量分析:
用户维度统计所有的阿里云服务器ECS实例数量、vCPU申请总量、Memory申请总量。
区域维度统计所有的阿里云服务器ECS实例数量、vCPU申请总量、Memory申请总量。
用户实例状态分析:
阿里云服务器ECS实例的健康状态,提供横向瞬时对比、横向时序分析、正常/异常实例数量统计。
阿里云服务器ECS实例的异常状态(GuestOS),提供横向瞬时对比、横向时序分析、正常/异常实例数量统计。GuestOS 为用户操作系统内异常操作导致的ECS实例健康状态异常。
阿里云服务器ECS实例的异常状态(Host),提供横向瞬时对比、横向时序分析、正常/异常实例数量统计。Host 为阿里云底层宿主机异常操作导致的ECS实例健康状态异常。
可观测治理(无代理指标):
无代理指标(采集云监控指标)实例的接入数、接入占比、云监控指标采集状态及接入实例列表。
可观测治理(Exporter代理指标):
无代理指标(采集云监控指标)实例的接入数、接入占比、Exporter 指标采集状态、接入实例列表。
可观测资源分析(接入实例):
接入可观测的阿里云服务器ECS实例的资源统计,包括vCPU核数、Memory 申请量/剩余量、Disk 申请量/剩余量、规格分布、进程和线程统计。