全部产品
存储与CDN 数据库 安全 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 阿里云办公 培训与认证 物联网
消息服务

云监控【主题模型】

更新时间:2016-11-23 16:04:19   分享:   

MNS主题模型已经接入云监控,用户可以通过云监控针对主题级别(在云监控中,一个主题为一个实例)对如下指标实现统计,以及监控,并且可以设置相应的报警。指标包括:

  • 指定时间内的消息推送次数
  • 指定时间内的消息推送成功次数
  • 指定时间内的消息推送成功率

使用场景

通过对这些指标的监控,可以在下述(不限于)场景使用:

  1. 如果用户业务稳定,比如每天都会有固定的消息推送量,那可以通过监控(设置报警)消息推送的总次数(也可以关注推送成功的次数)。如果低于某个值,可能就说明用户的业务出现异常,这种情况下可以有报警来提醒用户关注下自己的业务。

  2. 用户提供的 Endpoint(比如 HttpServer)可能会出现异常,比如 HttpServer 可能会 Crash,网络可能会出现异常等等。这种情况下会出现推送错误,此时可以通过监控(设置报警)推送成功率,当低于某个阈值时,就能够提醒用户关注接收消息的 Endpoint 是否出现了异常。

使用方法

1. 找一个需要监控的主题为例

1.1 如下图所示:进入MNS控制台,点击左侧“发布订阅”的标签,再选择一个需要监控的主题(比如图中的“华北2”区域的 topic-show-cloud-monitor ),可以点击订阅详情,查看其所有的订阅关系。

show-topic-cloudmonitor-1

1.2 如下图所示:该主题下有两个订阅,分别为 valid-sub-show-cloud-monitor (有效的订阅,订阅时设置的接收消息的 Endpoint 是存在的 Queue,会100% 推送成功的)和 invalid-sub-show-cloud-monitor (无效的订阅,订阅时设置的接收消息的 Endpoint 是不存在的 Queue,所以都会推送失败),这两个订阅这样设置,是为了更好的展示云监控的数据。

show-topic-cloudmonitor-2

2. 找到被监控主题对应的云监控实例

2.1 如下图所示,在控制台左侧的产品与服务中选择“云监控”,或者在最上方“产品与服务”中选择“云监控”,也可以直接点击云监控控制台进入。然后选择中间一栏的“消息服务”,进入消息服务MNS的标签页。再在右侧选择对应的区域(本示例为“华北2”),再选择“Topic列表”标签,最好在Topic列表中选择第一步中想要监控的主题。

show-topic-cloudmonitor-3

3. 查看监控数据

3.1 如下图所示,监控图表中有两张图:“推送次数”和“推送成功率”,分别对应消息服务的两个监控指标。可以选择时间范围,进行查看(图中选择了示例的16:00-16:40,该时段有消息推送)。小图中可以点击右上角的“警铃”设置报警规则,也可以点击最右方的图表查看大图。

  • 推送次数,即:在统计时间周期内,推送次数的总和,目前每分钟都有数据采集。
  • 推送成功率,即:在统计时间周期内,推送的成功率(推送成功次数/推送总次数)

show-topic-cloudmonitor-4

3.2 如下图所示,点击查看推送次数的大图,其中有两条线,分别对应不同的 Subscription,此处黑色的表示 valid-sub-show-cloud-monitor,从图中可以看到,在16:36分,一共推送了24285次。

show-topic-cloudmonitor-5

3.3 如下图所示,仍然是推送次数的大图,其中的蓝线表示 invalid-sub-show-cloud-monitor,从图中可以看到,在16:36分一共推送了190次。这190次应该都是在错误重试。重试会一定的时间间隔,所以次数比较少。

show-topic-cloudmonitor-6

3.4 如下图所示,点击查看推送成功率的大图,图中也是两条线,也是分别对应两个不同的 Subscription。此处黑色的线表示 valid-sub-show-cloud-monitor,从图中可以看出,在16:36分,推送的成功率为100%,即所有的推送都是成功的。

show-topic-cloudmonitor-7

3.5 如下图所示,仍然是推送成功率的大图,其中的蓝线表示 invalid-sub-show-cloud-monitor,从图中可以看到,在16:36分,推送的成功率为0%,即所有的推送都失败了。

show-topic-cloudmonitor-8

4. 设置报警

4.1 如下图所示,点击右方“新建报警规则”,或者点击监控图表中的“警铃”图标,都可以弹出设置报警规则的弹窗。可以批量进行创建报警规则。可以点击“添加报警规则”来创建多条报警规则。图中设置了三条报警规则:

  • 报警规则一表示:每5分钟读取一次1分钟内的推送次数,如果小于1000次的情况出现1次,就会触发报警。
  • 报警规则二表示:每5分钟读取一次1分钟内的推送成功次数,如果小于800次的情况连续出现3次,就会触发报警。
  • 报警规则三表示:没5分钟读取一次1分钟内的推送成功率,如果低于80%的情况连续出现2次,就会触发报警。

show-topic-cloudmonitor-9

4.2 报警设置完成后,点击下一步设置通知对象(云监控中的联系人),可以通过短信通知用户等等。操作方法跟云监控其他设置报警的方法一致。

本文导读目录
本文导读目录
以上内容是否对您有帮助?