阿里云Logstash支持对实例进行监控,并支持自定义报警阈值以及通过短信接收报警。为避免出现集群状态不正常、节点磁盘使用率过高等问题而影响Logstash服务,强烈建议您进行监控报警配置,实时监控集群状态、节点磁盘使用率等信息,及时查收报警短信,提前做好防御措施。本文介绍如何为Logstash实例配置云监控报警。

背景信息

阿里云Logstash支持以下监控报警项。
监控项 说明
节点磁盘使用率(%) 必选。报警阈值控制在75%以下。
节点HeapMemory使用率(%) 必选。报警阈值控制在85%以下。
节点CPU使用率(%) 可选。报警阈值控制在95%以下。
节点load_1m 可选。以CPU核数的80%为参考值。
注意 目前Logstash只支持在云监控中配置以上4个监控指标。如果您在配置项中观察到其他指标,请忽略。

操作步骤

  1. 进入云监控报警控制台。
    1. 进入云监控控制台
    2. 在左侧导航栏,单击报警服务 > 报警规则
    3. 阈值报警页签中,单击创建报警规则
  2. 配置关联资源。
    配置关联资源
    参数 说明
    产品 选择阿里云LogstashService
    资源范围 选择实例
    地域 选择实例所在地域。
    实例 选择待监控的实例。
  3. 设置报警规则。
    设置报警规则
    通道沉默时间是指同一个指标在一定时间范围内,只会触发一次报警。
    说明 其他参数说明,请参见创建阈值报警规则
  4. 配置告警通知方式,选择云账号报警联系人
    如果您还没有报警联系组,请单击快速创建联系人组,进行创建。快速创建联系人组
    说明 您可以在报警回调中填写可通过公网访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。
  5. 单击确认
    配置完成后,Logstash实例的监控信息将在实例正常运行后开始采集。当指标值超过您设置的报警阈值时,系统会为您发送报警通知。您可以通过以下方式查看Logstash监控大屏:
    1. 在云监控首页的左侧导航栏,单击Dashboard > 云产品监控大盘
    2. 选择阿里云LogstashService产品,并选择地域。
    3. 选择实例和监控时间段,查看该段时间内的监控大屏。
      Logstash监控大屏