云监控2.0接入中心,是构建统一监控体系的基石,通过集中化数据接入和管理,实现从基础设施到业务层的全栈可观测性。作为统一接入入口,支持多源数据接入,涵盖Java应用监控、链路追踪、中间件、人工智能、阿里云服务等观测接入能力,通过接入中心您可以在云监控2.0平台进行聚合、日志分析和告警配置,即可在一个界面管理全域监控数据。
前提条件
您已开通阿里云云监控2.0服务。
入门案例
本文以接入ECS实例(阿里云云服务器)为例,演示如何通过接入中心将ECS实例接入云监控2.0平台,并查看采集指标和告警配置。
云监控2.0是把接入的对象统称为实体(Entity),例如接入一个容器集群或者一台ECS实例,对应一个实体。
案例流程
操作步骤
登录云监控2.0控制台,选择目标工作空间,在左侧导航栏单击接入中心。
在接入中心页面,选择云服务器ECS。
在右侧滑出的云服务器 ECS对话框中开始接入,单选全部实体,单击确定。
全部实体:可以匹配和工作空间所属同一地域的所有实体。
按资源组:可以匹配选择的目标资源组下全部ECS实例资源。
按标签:按标签的条件匹配全部ECS实例资源。
手动选择:自定义选择资源。
在接入配置步骤中,勾选以下配置,单击确定。
阿里云 ECS 监控:采集云服务ECS指标,安装插件
Node-exporter
和Process-exporter
采集主机指标。阿里云 ECS 审计日志:安装插件
LoongCollector
采集主机系统审计日志。阿里云 ECS 事件:ECS系统事件接入。
在接入成功后,选择接入管理,可以检查接入状态是否正常。
查看可视化监控数据大盘方式。
在左侧导航栏选择
,选择目标实例ID,查看接入实体的可视化大盘。快捷方式:您可以使用快捷键
Ctrl+K
弹出搜索框,输入ECS实例名称或者实例ID,选择搜索结果目标实体,查看实体可视化大盘页面。
查看目标实体监控数据可视化大盘,包括如下图表。
Memory 分析
CPU 分析
Disk 分析
登录云监控2.0控制台,选择目标工作空间,在左侧导航栏选择 。
在告警规则页面列表中,您可以新建告警规则或者复制系统已生成告警规则,本文选择进程CPU使用率告警规则,单击操作列中的复制。
在编辑告警规则页面,可以根据您的需求修改告警规则信息,在自定义PromQL语句配置参数中,PromQL语句条件是进程CPU使用率超过
85%
将会触发告警,您可以根据您的需求修改语句条件,单击下一步。说明有关使用PromQL语句。更多信息请参见Prometheus官方文档。
在报警通知对象配置页面,根据您的需求选择接收告警通知对象,本文选择钉钉机器人方式,单击提交。
返回告警规则列表中,在告警被触发后,您的钉钉机器人将会接收到告警消息。