管理SLS日志的监控指标

您可以通过创建SLS日志的监控指标,将SLS日志接入云监控。SLS日志接入云监控后,您可以创建监控大盘,通过监控大盘查看指定监控指标的监控图表。

前提条件

  • 请确保您已在日志服务SLS中创建日志项目(Project)和日志库(Logstore)。

    具体操作,请参见快速入门

  • 请确保您已创建指标仓库。具体操作,请参见创建指标仓库

创建监控指标

  1. 登录云监控控制台
  2. 在左侧导航栏,选择企业云监控 > 业务监控

  3. 单击SLS日志监控页签。

  4. 指标页签,单击左上角的接入数据

  5. SLS日志监控页签,设置SLS日志的相关参数。

    参数

    说明

    监控项名称

    日志服务的监控项名称。

    描述信息

    监控项名称的描述信息。

    SLS日志

    日志服务的日志库(Logstore)信息。取值:

    • 选择Logstore组:选择已存在的Logstore组。

    • 选择Logstore:选择日志服务的地域(Region)、日志项目(Project)和日志库(Logstore)。

      先选择日志服务的Logstore,再在另存为Logstore组文本框中输入Logstore组的名称,将当前Logstore的信息另存为Logstore组。

    聚合周期

    监控项的统计周期。单位:秒。取值:15和60。

    说明

    监控项的统计时间基于SLS日志服务设置的默认时间戳,您无法指定。

    统计方法

    在统计周期内根据选定的统计方法对日志数据进行聚合处理。如果字段值是数值型,可以使用所有统计方法,否则只能使用计数countps两种聚合算法。取值:

    • 计数:计算统计周期内指定字段数值的个数。

    • 求和:计算1分钟内指定字段数值之和。

    • 平均值:计算统计周期内指定字段数值的平均值。

    • 最大值:计算统计周期内指定字段数值的最大值。

    • 最小值:计算统计周期内指定字段数值的最小值。

    • 监控值:监控项的取值。

    • sumps:计算统计周期内指定字段求sum后的每秒平均值。

    • countps:计算统计周期内指定字段求count后的每秒平均值。

    • distinct:去重后计算统计周期内指定字段出现的次数。

    • 分布:计算一个周期内指定范围的日志条数,例如:统计1分钟内HTTP请求为5xx的状态码个数,则定义为 (499,599]。统计方式为左开右闭。

    • percentile:计算1分钟内指定字段的百分比的数据,例如:监控项的统计结果为0.7,计算周期为30ms,表示70%的监控项请求小于30ms。

    扩展字段

    为统计方法中的结果提供四则运算功能,例如:在统计方法中配置了HTTP状态码请求总数TotalNumber和HTTP状态码大于499的请求数5xxNumber,则可以通过扩展字段计算出服务端的错误率(%):5xxNumber/TotalNumber*100。

    日志筛选

    对日志数据进行过滤,相当于SQL中的where条件,例如:Key为level,Value中需要监控的关键字为ERROR,该参数设置为level=Error。筛选的日志字段和值必须满足以下条件:

    • 日志字段不能包含中文。

    • 区分大小写。

    • 包含和不包含直接关键词匹配,不会进行分词(与日志服务SLS的全文索引不同)。

    Group-By

    对数据进行空间维度聚合,相当于SQL中的Group By。

    根据指定的维度,对监控数据进行分组。如果Group By不选择任何维度,则根据聚合方法对全部监控数据进行聚合。

    关于Group By,请参见Group By子句

    数据存入指标仓库

    指标仓库名称。

    标签

    监控项的标签。您可以设置标签键和标签值。

  6. 单击确定

修改监控指标

  1. 登录云监控控制台
  2. 在左侧导航栏,选择企业云监控 > 业务监控

  3. 单击SLS日志监控页签。

  4. 指标页签,单击目标监控指标对应操作列的修改

  5. SLS日志监控页签,设置SLS日志的相关参数。

    参数

    说明

    描述信息

    监控项名称的描述信息。

    聚合周期

    监控项的统计周期。单位:秒。取值:15和60。

    统计方法

    在统计周期内根据选定的统计方法对日志数据进行聚合处理。如果字段值是数值型,可以使用所有统计方法,否则只能使用计数countps两种聚合算法。取值:

    • 计数:计算统计周期内指定字段数值的个数。

    • 求和:计算1分钟内指定字段数值之和。

    • 平均值:计算统计周期内指定字段数值的平均值。

    • 最大值:计算统计周期内指定字段数值的最大值。

    • 最小值:计算统计周期内指定字段数值的最小值。

    • 监控值:监控项的取值。

    • sumps:计算统计周期内指定字段求sum后的每秒平均值。

    • countps:计算统计周期内指定字段求count后的每秒平均值。

    • distinct:去重后计算统计周期内指定字段出现的次数。

    • 分布:计算一个周期内指定范围的日志条数,例如:统计1分钟内HTTP请求为5xx的状态码个数,则定义为 (499,599]。统计方式为左开右闭。

    • percentile:计算1分钟内指定字段的百分比的数据,例如:监控项的统计结果为0.7,计算周期为30ms,表示70%的监控项请求小于30ms。

    扩展字段

    为统计方法中的结果提供四则运算功能,例如:在统计方法中配置了HTTP状态码请求总数TotalNumber和HTTP状态码大于499的请求数5xxNumber,则可以通过扩展字段计算出服务端的错误率(%):5xxNumber/TotalNumber*100。

    日志筛选

    对日志数据进行过滤,相当于SQL中的where条件,例如:Key为level,Value中需要监控的关键字为ERROR,该参数设置为level=Error。筛选的日志字段和值必须满足以下条件:

    • 日志字段不能包含中文。

    • 区分大小写。

    • 包含和不包含直接关键词匹配,不会进行分词(与日志服务SLS的全文索引不同)。

    Group-By

    对数据进行空间维度聚合,相当于SQL中的Group By。

    根据指定的维度,对监控数据进行分组。如果Group By不选择任何维度,则根据聚合方法对全部监控数据进行聚合。

    关于Group By,请参见Group By子句

    标签

    监控项的标签。您可以设置标签键和标签值。

  6. 单击确定

删除监控指标

  1. 登录云监控控制台
  2. 在左侧导航栏,选择企业云监控 > 业务监控

  3. 单击SLS日志监控页签。

  4. 指标页签,先单击目标监控指标对应操作列的image.png图标,再单击删除

  5. 确认删除对话框,单击确定

复制监控指标

  1. 登录云监控控制台
  2. 在左侧导航栏,选择企业云监控 > 业务监控

  3. 单击SLS日志监控页签。

  4. 指标页签,先单击目标监控指标对应操作列的复制

  5. SLS日志监控页签,设置SLS日志的相关参数。

    云监控默认复制目标监控指标的必填参数,您可以根据所需修改。

  6. 单击确定

    界面提示监控指标创建成功,需要等待几分钟后才能产生监控数据。