阿里云Logstash支持对实例进行监控,并支持设置自定义报警规则以及通知方式。为避免出现集群状态异常、节点磁盘使用率过高等问题而影响Logstash服务,建议您进行监控报警配置,实时监控集群状态、节点磁盘使用率等信息,及时查收报警短信,提前做好防御措施。本文介绍如何为Logstash实例配置自定义报警策略。

操作步骤

  1. 进入云监控控制台。
    1. 登录阿里云Elasticsearch控制台
    2. 在顶部菜单栏处,选择地域。
    3. 在左侧导航栏,单击Logstash实例,然后在Logstash实例中单击目标实例ID。
    4. 在左侧导航栏,单击集群监控
    5. 监控报警配置区域,单击前往云监控
      进入云监控入口
  2. 关闭创建报警规则面板,在左侧导航栏,选择报警服务 > 报警规则
  3. 单击创建报警规则,在创建报警规则面板,设置报警规则。
    本文的示例参数配置如下,未提及的参数保持默认,详细参数说明请参见创建报警规则
    参数说明
    产品选择阿里云LogstashService
    资源范围选择实例
    关联资源选择待监控的实例。
    规则描述单击添加规则,在添加规则描述面板,填写规则名称,并按照以下说明进行配置:
    • 指标类型:选择多指标
    • 报警级别:选择警告(Warn)
    • 指标类型:选择标准创建
    • 多指标报警描述
      • 选择Logstash实例节点CPU使用率的最大值>=85%
      • 选择Logstash实例节点磁盘使用率的最大值>=85%
      • 选择节点内存使用量的最大值>=85%
      • 选择节点1分钟负载的最大值>=5
    • 多指标关系:选择有一个满足就报警
    • 发出报警需要满足达到阈值的次数:选择连续3个周期
    报警联系人组选择您已创建的报警联系人组。关于如何创建报警联系人组,请参见创建报警联系人或报警联系组

    您还可以打开高级设置,在报警回调中填写可通过公网访问的URL,云监控会将报警信息通过POST请求推送到该地址。目前仅支持HTTP协议,详细信息请参见使用阈值报警回调

    在配置阿里云Logstash的报警规则时,您可以参考以下监控指标说明选择指标报警描述。
    说明 目前阿里云Logstash只支持在云监控中配置以下四种监控项。如果您在配置项中观察到其他项,请忽略。
    监控项说明
    Logstash实例节点磁盘使用率必选。报警阈值控制在75%以下。
    节点内存使用量必选。报警阈值控制在85%以下。
    Logstash实例节点CPU使用率可选。报警阈值控制在95%以下。
    节点1分钟负载可选。以CPU核数的80%为参考值。
  4. 单击确定
  5. 查看Logstash监控大屏。
    配置完成后,Logstash实例的监控信息将在实例正常运行后开始采集。当指标值超过您设置的报警阈值时,系统会为您发送报警通知。您可以通过以下方式查看Logstash监控大屏:
    1. 在云监控首页的左侧导航栏,单击Dashboard再单击云产品监控大盘页签。
    2. 选择阿里云LogstashService产品,并选择地域。
    3. 选择实例和监控时间段,即可查看该段时间内的监控大屏。
      Logstash监控大屏