阿里云ECS端接入

云监控2.0接入中心,是构建统一监控体系的基石,通过集中化数据接入和管理,实现从基础设施到业务层的全栈可观测性。作为统一接入入口,支持多源数据接入,涵盖Java应用监控、链路追踪、中间件、人工智能、阿里云服务等观测接入能力,通过接入中心您可以在云监控2.0平台进行聚合、日志分析和告警配置,即可在一个界面管理全域监控数据。

前提条件

入门案例

本文以接入ECS实例(阿里云云服务器)为例,演示如何通过接入中心将ECS实例接入云监控2.0平台,并查看采集指标和告警配置。

说明

云监控2.0是把接入的对象统称为实体(Entity),例如接入一个容器集群或者一台ECS实例,对应一个实体。

案例流程

image

操作步骤

步骤

屏幕快照

  1. 登录云监控2.0控制台,选择目标工作空间,在左侧导航栏选择接入中心 > 接入中心

  2. 接入中心页面,选择阿里云服务器ECS

image

  1. 在右侧滑出的阿里云服务器 ECS对话框中开始接入,单选全部实体,单击确定

    • 全部实体:可以匹配和工作空间所属同一地域的所有实体。

    • 按资源组:可以匹配选择的目标资源组下全部ECS实例资源。

    • 按标签:按标签的条件匹配全部ECS实例资源。

image

  1. 接入配置步骤中,勾选以下配置,单击确定

    • 阿里云 ECS 监控:采集云服务ECS指标,安装插件Node-exporterProcess-exporter采集主机指标。

    • 阿里云 ECS 审计日志:安装插件LoongCollector采集主机系统审计日志。

    • 阿里云 ECS 事件:ECS系统事件接入。

  2. 在接入成功后,选择接入管理,可以检查接入状态是否正常。

image

  1. 查看可视化监控数据大盘方式。

    • 在左侧导航栏选择实体查询 > 所有实体,选择目标实例ID,查看接入实体的可视化大盘。

    • 快捷方式:您可以使用快捷键Ctrl+K弹出搜索框,输入ECS实例名称或者实例ID,选择搜索结果目标实体,查看实体可视化大盘页面。

image

  1. 查看目标实体监控数据可视化大盘,包括如下图表。

    • 系统基础监控。

    • 网络基础监控。

    • 磁盘基础监控。

    • GPU 基础监控。

image

  1. 登录云监控2.0控制台,在左侧导航栏选择告警中心 > 告警管理 > 告警规则

  2. 告警规则页面列表中,您可以新建告警规则或者复制系统已生成告警规则,本文选择进程CPU使用率告警规则,单击操作列中的复制

image

  1. 编辑告警规则页面,可以根据您的需求修改告警规则信息,在自定义PromQL语句配置参数中,PromQL语句条件是进程CPU使用率超过85%将会触发告警,您可以根据您的需求修改语句条件,单击下一步

    说明

    有关使用PromQL语句。更多信息请参见Prometheus官方文档

image

  1. 报警通知对象配置页面,根据您的需求选择接收告警通知对象,本文选择钉钉机器人方式,单击提交

image

  1. 返回告警规则列表中,在告警被触发后,您的钉钉机器人将会接收到告警消息。

image