全部产品
弹性计算 会员服务 网络 安全 移动云 数加·大数据分析及展现 数加·大数据应用 管理与监控 云通信 阿里云办公 培训与认证 更多
存储与CDN 数据库 域名与网站(万网) 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 智能硬件
日志服务

消费组监控与报警

更新时间:2018-04-11 14:31:37

ConsumerGroup 是一个消费者组,包含多个Consumer,每个Consumer消费Logstore中的一部分Shard。

Shard的数据模型可以简单理解成一个队列,新写入的数据被加到队尾,队列中的每条数据都会对应一个数据写入时间,下图是Shard的数据模型。

queue

协同消费延迟报警中的基本概念:

  • 消费过程:消费者从队头开始顺序读取数据的过程。
  • 消费进度:消费者当前读取的数据对应的写入时间。
  • 消费落后时长:当前消费进度和队列中最新的数据写入时间的差值,单位为秒。

ConsumerGroup的消费落后时长取其包含的所有Shard的消费落后时长的最大值,当超过用户预设阈值时,就认为消费落后太多,需要报警。

配置方法

  1. 登录 日志服务管理控制台,单击需要监控的 Logstore 的监控图标。

  2. 找到消费落后时长图表,单击进入云监控控制台。

    step2

  3. 该图展示了 Logstore 下所有 ConsumerGroup 的消费落后时长,单位为秒。红框中图例是所有的 ConsumerGroup,单击右上角 创建报警规则 进入规则创建页面。

    step3

  4. 创建针对 ConsumerGroup spamdetector-report-c 的报警规则,5min 内只要有一次延迟大于等于 600 秒就会报警。设置生效时间和报警通知联系人,保存规则。

    step4

上面的操作完成后便成功创建了报警规则。有关报警规则配置的任何问题,请提工单到云监控。

本文导读目录