文档

主机可观测

更新时间:

可观测监控 Prometheus 版支持通过node-exporter采集ECS Linux或Windows主机操作系统相关指标,也支持process-exporter采集进程相关监控数据,另外基于textfile的方式也支持采集用户写到文件中自定义监控指标。

前提条件

步骤一:接入主机监控数据

  1. 登录ARMS控制台

  2. 在左侧导航栏单击接入中心

  3. 接入中心页面,单击左侧基础设施页签,然后单击主机监控

    image

    说明
    • 由于Prometheus依赖阿里云资源中心获取云产品当前登录账户的VPC、ECS等数据进行服务发现,如果没有开通资源中心,接入流程会引导您先开通资源中心,具体操作请参见开通资源中心

    • 开通资源中心是异步操作,重新检测后如果仍然是未开通状态,可以等待10-20秒左右再单击重新检测

  4. 在弹出的页面中,选择目标ECS(VPC),然后按照下表说明填写配置信息

    image

    指标

    说明

    NodeExporter 安装方式

    • 自动安装(推荐):Prometheus会为用户选择的ECS默认安装node-exporter,您无需其他操作即可接入。

    • 自助安装:用户自行安装node-exporter。

    主机服务发现方式

    • 污点标签选择:黑名单机制,标签匹配到的实例将不会接入Prometheus,没有匹配到的ECS监控指标将会接入Prometheus,默认不会采集容器监控服务的节点。

    • 无条件:安装和采集当前VPC内所有ECS主机监控指标。

    • 标签选择:白名单机制,标签匹配到的实例将会接入Prometheus,没有匹配到的ECS实例将不会接入Prometheus。

    • IP域选择:该方式是提供一个网段,当ECS的IP地址匹配该网段时,即被选中。如果填写VPC对应的网段,即代表命中当前VPC全部ECS。

    • 实例ID:指定需要接入的实例ID,多个实例ID使用英文逗号分隔。

    ECS 污点标签

    每一个污点标签由key和value组成,可以设置多个污点标签。

    采集 TextFile

    采集指定文件中的Prometheus指标。

    采集进程状态指标

    默认会采集主机上的进程监控数据。

    Node-Exporter 服务端口

    默认端口9100。

    Metric 采集间隔(单位/秒)

    采集数据的时间间隔,默认为15秒。

    自动配置安全组

    默认打开。

  5. 单击确定,等待1~2分钟即可完成ECS主机监控指标接入。

说明

接入成功后,如果监控大盘没有数据,需要确认ECS的安全组在入方向需要允许100.64.0.0/10和192.168.0.0/18网段对9100和9256的访问权限,查看ECS的安全组详情,请参见查询安全组。9100是node-exporter的默认端口,9256是process-exporter的默认端口,具体端口需要根据您自身配置进行调整。

步骤二:查看监控大盘

  1. 登录ARMS控制台

  2. 在左侧导航栏单击接入管理

  3. 接入管理页面的已接入环境页签中,选择ECS环境

  4. ECS环境列表中,单击目标环境名称进入ECS环境详情页面。

  5. 组件管理页签,在组件类型区域单击大盘,即可查看内置的Grafana大盘。

步骤三:配置告警

  1. 登录ARMS控制台

  2. 在左侧导航栏单击接入管理

  3. 接入管理页面的已接入环境页签中,选择ECS环境

  4. ECS环境列表中,单击目标环境名称进入ECS环境详情页面。

  5. 组件管理页签,在组件类型区域单击告警规则,即可查看内置的告警规则。

说明

内置的告警规则会产生告警事件,但是不会进行告警通知,如果您希望将告警通知到邮件或其他平台,可以单击编辑配置通知方式。在告警配置页面您也可以自定义告警阈值、持续时间、告警内容等,告警详细配置可参考Prometheus告警规则

image

说明

在极简模式下,您可以设置告警的通知对象、通知时段和重复策略。

  • 本页导读 (1)
文档反馈