全部产品
弹性计算 会员服务 网络 安全 移动云 数加·大数据分析及展现 数加·大数据应用 管理与监控 云通信 阿里云办公 培训与认证 更多
存储与CDN 数据库 域名与网站(万网) 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 智能硬件
云监控

日志服务监控

更新时间:2017-09-21 16:42:19

概览

云监控通过监控日志服务的出入流量、总体 QPS、日志统计方法等 11 个监控项,帮助用户获取日志服务的使用情况。用户创建日志服务后,云监控自动开始对其监控,您登录云监控的日志服务页面即可查看监控详情。您还可以对监控项设置报警规则,以便数据异常时收到报警息。

监控项说明

监控项 含义 维度 单位 最小监控粒度
Inflow logStore每分钟的流入流量和流出流量 userId、Project、Logstore 字节 1分钟
Outflow logStore每分钟的流出流量 userId、Project、Logstore 字节 1分钟
SumQPS logStore每分钟的写入总次数 userId、Project、Logstore 个数 1分钟
LogMethodQPS logStore中各method下每分钟的写入次数 userId、Project、Logstore、Method 个数 1分钟
LogCodeQPS logStore中各状态码每分钟的写入次数 userId、Project、Logstore、Status 个数 1分钟
SuccessdByte logStore中解析成功的字节数 userId、Project、Logstore 字节 10分钟
SuccessdLines logStore中解析日志成功行数 userId、Project、Logstore 个数 10分钟
FailedLines logStore中解析日志失败行数 userId、Project、Logstore 个数 10分钟
AlarmPV logStore中ECS发生配置错误数的总和 userId、Project、Logstore 个数 5分钟
AlarmUv logStore中发生配置错误数的ECS数量总和 userId、Project、Logstore 个数 5分钟
AlarmIPCount logStore中各IP发生的错误数量 userId、Project、Logstore、alarm_type、source_ip 个数 5分钟

查看监控数据

  1. 登录云监控控制台

  2. 进入云服务监控下的日志服务实例列表。

  3. 单击实例名称或操作中的监控图表,进入监控详情页面。

  4. 单击大小图切换按钮,切换大图显示(可选)。

报警服务

参数说明

  • 监控项:日志服务提供的监控指标。

  • 统计周期:报警系统会按照这个周期检查您对应的监控数据是否超过了报警阈值。例如设置内存使用率报警规则的统计周期为1分钟,则每间隔1分钟会检查一次内存使用率是否超过了阈值。

  • 统计方法:统计方法指对超出阈值范围的设置。统计方法中可以设置平均值、最大值、最小值、求和值。

    • 平均值:统计周期内监控数据的平均值。统计结果是15分钟内采集的所有监控数据的平均值,当这个平均值大于80%时,才算超过阈值。

    • 最大值:统计周期内监控数据的最大值。统计周期内采集的监控数据中,最大值超过80%,即为超过阈值。

    • 最小值:统计周期内监控数据的最小值。统计周期内采集的监控数据中,最小值超过80%,即为超过阈值。

    • 求和值:统计周期内监控数据的总和。对统计周期内采集的监控数据进行求和,求和后的结果超过80%即为超过阈值。流量类指标需要用到此类统计方法。

  • 连续几次超过阈值后报警:指连续几个统计周期监控项的值持续超过阈值后触发报警。

    例如:设置CPU使用率超过80%报警,统计周期为5分钟,连续3次超过阈值后报警,则第一次探测CPU使用率超过80%时,不会发出报警通知。5分钟后第二次探测CPU使用率超过80%,也不会发出报警。第三次探测仍然超过80%时,才会发出报警通知。即从实际数据第一次超过阈值到最终发出报警规则,最少需要消耗的时间为统计周期×(连续探测次数-1)=5×(3-1)=10分钟。

    注意事项

  • 设置报警规则时,日志方法QPS监控项可选择具体的method对应的值,各状态码下QPS可选择具体的status对应的值,如果不选择,会默认作用全部字段。
  • method字段包括:PostLogStoreLogs 、 GetLogtailConfig 、 PutData、 GetCursorOrData、 GetData 、GetLogStoreHistogram 、GetLogStoreLogs、 ListLogStores、 ListLogStoreTopics。

  • status字段包括:200 、400 、401 、403 、405 、500 、502。

设置报警规则

  1. 登录云监控控制台

  2. 进入云服务监控下的日志服务实例列表。

  3. 单击实例列表操作中的报警规则,进入实例的报警规则页面。

  4. 单击报警规则页面右上角的新建报警规则,根据参数创建一条报警规则。

本文导读目录