全部产品
存储与CDN 数据库 安全 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 钉钉智能硬件
日志服务

使用云监控设置报警规则

更新时间:2017-08-07 16:12:54

日志服务支持通过云监控设置报警,当服务状态符合设置的报警规则时发送报警短信或邮件。您可以通过配置云监控中的日志监控,对日志收集状态、Shard资源使用状态等异常状态进行监控。本文以监控日志收集状态和Shard资源使用状态为例,介绍使用云日志设置的报警规则。更多信息请参考云监控中的日志监控

监控Logtail日志收集状态

Logtail客户端在运行过程中,可能会因设置不正确产生错误,例如某些日志格式不匹配、一个日志文件被重复收集等(Logtail场景问题)。为了及时发现这种情况,您可以对客户端解析失败行数、客户端错误次数等指标进行监控,以便及时发现这类问题。配置步骤如下。

  1. 打开LogHub云监控页面。详细步骤请参考LogHub监控章节

  2. 选择目标Logstore,右上角单击创建报警规则

    1. 关联资源

      根据您的实际情况填写关联资源

    2. 设置报警规则

      设置规则名称,并选择规则描述。您可以根据需要选择客户端解析失败行数客户端错误次数选项,并配置统计周期、统计方法等规则项。除此之外,还可以根据Logtail其他错误项进行报警,第一时间发现各类日志收集过程中发现的问题。

    3. 配置通知方式

      选择通知对象通知方式

监控Shard资源使用状态

Logstore下每个Shard提供5MB/s (1000次/s) 写入能力,这个数值对于大部分用户而言都是足够的,在超过时日志服务会尽可能去服务(非拒绝)您的请求,但在高峰期间不保证超出部分的可用性。您可以设置Logstore出入流量报警以检测该情况。如果您的日志量非常大,需要添加更多Shard,请及时在控制台中进行调整。设置Logstore流量报警步骤如下。

方案1:设置流量预警

  1. 打开LogHub云监控页面。详细步骤请参考LogHub监控章节
  2. 选择目标Logstore,单击创建报警规则

    1. 关联资源

      根据您的实际情况填写关联资源

    2. 设置报警规则

      设置规则名称,并配置规则描述原始数据大小。您可以在此处设置统计周期和统计方法,如需超过25GB/Min后进行报警,请设置5分钟总计>=134217728000,表示5分钟内总计流量超出134217728000 bytes 时进行报警。

    3. 配置通知方式

      选择通知对象通知方式

方案2:设置服务状态报警

  1. 打开LogHub云监控页面。详细步骤请参考LogHub监控章节
  2. 选择目标Logstore,单击创建报警规则

    1. 关联资源

      根据您的实际情况填写关联资源

    2. 设置报警规则

      设置规则名称,并配置规则描述服务状态status自定义设置为403。您可以在此处设置统计周期和统计方法,如您需要在5分钟内出现5个以上403服务状态时收到报警,请设置为五分钟采样计数值>=、和5

    3. 配置通知方式

      选择通知对象通知方式

本文导读目录