日志服务已内置告警监控规则,您只需添加对应的告警实例即可实时监控目标Kubernetes集群,并可通过钉钉等渠道接收到告警通知。本文介绍设置告警的相关操作。

前提条件

已创建K8s事件中心并接入Kubernetes集群数据。具体操作,请参见创建并使用K8s事件中心

背景信息

K8s事件中心已内置告警监控规则、SLS ACK内置行动策略、SLS ACK内置用户组、SLS ACK Pod内置内容模板、SLS ACK内置内容模板、SLS ACK Node内置内容模板和SLS ACK Object内置内容模板。日志服务提供的内置资源可满足大部分告警场景,它们之间的关联如下:
  • 通过告警监控规则指定SLS ACK内置行动策略。
  • 通过SLS ACK内置行动策略指定SLS ACK内置用户组和内容模板(SLS ACK Pod内置内容模板、SLS ACK内置内容模板、SLS ACK Node内置内容模板和SLS ACK Object内置内容模板)。

    触发告警后,日志服务会根据行动策略给指定用户发送告警通知。

步骤一:创建用户

  1. 登录日志服务控制台
  2. 日志应用区域的智能运维页签中,单击K8s事件中心
  3. 在左侧导航栏中,单击目标事件中心前面的k8s事件中心-002图标,然后单击告警配置
  4. 告警中心页面中,选择告警管理 > 用户管理
  5. 创建用户。
    具体操作,请参见创建用户

步骤二:将用户添加到SLS ACK内置用户组

  1. 告警中心页面中,选择告警管理 > 用户组管理
  2. 在用户组列表中,单击sls.app.ack.builtin对应的修改
  3. 修改用户组对话框中,将已创建的用户从待添加成员区域添加到已添加成员区域,然后单击确认

步骤三:添加告警实例

日志服务已内置数十种K8s事件中心告警监控规则,您只需根据业务需求,添加对应的告警实例即可。此处以添加集群节点正常运行告警监控规则对应的告警实例为例。

  1. 告警中心页面的规则/事务页签中,单击SLS K8s事件中心
    K8s事件中心
  2. 在告警监控规则列表中,单击目标告警监控规则对应的设置
  3. 参数设置对话框中,完成如下设置,然后单击设置并开启
    参数说明
    ACK集群ID
    • 如果是阿里云ACK集群,请设置为Kubernetes集群ID或名称。
    • 如果是自建Kubernetes集群,可设置为任意值。

    该Kubernetes集群为您在部署eventer和node-problem-detector时所设置的Kubernetes集群。更多信息,请参见部署Eventer和NodeProblemDetector

    行动策略当前告警所绑定的行动策略,日志服务将通过该行动策略给指定用户发送告警通知。

    默认为sls.app.ack.builtin(SLS ACK内置行动策略)。您也可以自定义行动策略。具体操作,请参见创建行动策略

    静默期告警静默期,即重复通知的间隔。重复的告警在静默期内不会被重复通知。例如1d(1天)、2h(2小时)、3m(3分钟)。
    严重度定义告警消息的严重度。
    恢复通知告警恢复时,触发一条恢复告警。
    连续触发阈值当累计的触发次数达到该值时,产生一条告警。不满足触发条件时不计入统计。
  4. 单击开启

更多操作

为K8s事件中心设置告警后,您还可以进行如下操作。

操作说明
关闭告警实例关闭告警实例后,告警实例不会再触发告警,状态变更为未开启

该操作不会删除规则参数中已设置的信息。需要再次监控时,无需重新设置规则参数。

临时关闭告警实例临时关闭告警实例后,在指定时间内不再触发告警。
删除告警实例删除告警实例,状态变更为未创建

该操作会删除规则参数中已设置的信息。需要再次监控时,需要重新设置规则参数。

设置告警实例设置告警实例的配置参数。
查看查看告警概览信息和告警历史统计报表。
关注将目标告警实例添加到关注列表中。
自定义告警如果内置告警监控规则不满足您的业务需求,您可以单击创建告警,创建自定义监控规则。具体操作,请参见创建日志告警监控规则