管理日志监控项

您可以在日志监控中创建监控项,并对该监控项执行修改和删除操作。

重要

云监控已于2022年09月13日停止日志监控、自定义监控和自定义事件监控服务。2022年09月13日前正在使用上述三个服务的用户仍然可以在2024年09月13日前正常使用。 其他用户如有相关产品需求,建议使用企业云监控下业务监控中的本地日志监控、SLS日志监控及自定义监控服务,功能更灵活,价格更低。 更多信息,请参见管理本地日志的数据接入任务管理SLS日志的监控指标上报自定义监控数据

前提条件

  • 请确保您已在日志服务SLS中创建Project和Logstore。

    具体操作,请参见快速入门

  • 请确保您已授权云监控访问日志服务SLS的权限。

    具体操作,请参见授权日志监控

  • 请确保您已购买日志监控的数据处理量。

    更多信息,请参见按量计费

创建日志监控项

  1. 登录云监控控制台

  2. 在左侧导航栏,选择云资源监控 > 应用分组

  3. 应用分组页签,单击目标应用分组名称链接。

  4. 在目标应用分组的左侧导航栏,单击日志监控

  5. 单击新建日志监控

  6. 关联资源页面,设置日志服务相关参数,单击下一步

    参数

    描述

    地域

    日志服务中日志项目(日志Project)所在地域。

    日志Project

    日志服务中日志项目的名称。

    日志Logstore

    日志服务中日志库的名称。

  7. 监控项定义页面,设置监控项相关参数,单击下一步

    参数

    描述

    监控项

    监控指标的名称。

    单位

    监控项的单位。

    计算周期

    监控项的计算周期。单位:分钟。取值:1、2、3、4、5、10、15、20、30、60。

    统计方法

    在计算周期内根据选定的统计方法对日志数据进行聚合处理。如果字段值是数值型,可以使用所有统计方法,否则只能使用计数countps两种聚合算法。取值:

    • 计数:计算统计周期内指定字段数值的个数。

    • 求和:计算1分钟内指定字段数值之和。

    • 最大值:计算统计周期内指定字段数值的最大值。

    • 最小值:计算统计周期内指定字段数值的最小值。

    • 平均值:计算统计周期内指定字段数值的平均值。

    • countps:计算统计周期内指定字段求count后的每秒平均值。

    • sumps:计算统计周期内指定字段求sum后的每秒平均值。

    • distinct:去重后计算统计周期内指定字段出现的次数。

    扩展字段

    为统计方法中的结果提供四则运算功能,例如:在统计方法中配置了HTTP状态码请求总数TotalNumber和HTTP状态码大于499的请求数5xxNumber,则可以通过扩展字段计算出服务端的错误率:5xxNumber/TotalNumber*100。

    日志筛选

    对日志数据进行过滤,相当于SQL中的where条件,例如:Key为level,Value中需要监控的关键字为ERROR,该参数设置为level>=ERROR

    选择过滤的日志字段名不能包含中文。

    Group-By

    对数据进行空间维度聚合,相当于SQL中的Group By。

    根据指定的维度,对监控数据进行分组。如果Group By不选择任何维度,则根据聚合方法对全部监控数据进行聚合。

    关于Group By,请参见Group By子句

    Select SQL

    将统计方法转化成SQL语句,方便您理解数据的处理方式。

    应用分组

    应用分组的名称。将该监控项添加到指定应用分组中。

  8. 报警设置页面,设置报警规则相关参数,单击下一步

    参数

    描述

    规则名称

    报警规则的名称。

    规则描述

    报警规则的主体。当监控数据满足指定报警条件时,触发报警规则。

    报警级别

    报警通知方式。取值:

    • 电话+短信+邮件+WebHook

    • 短信+邮件+WebHook

    • 邮件+WebHook

    连续几次超过阈值后报警

    连续几次超过阈值后,报警联系人组中的联系人会收到报警通知。取值:1、3、5、10、15、30、60、90、120、180。

    通道沉默周期

    报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时、24小时。

    监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

    生效时间

    报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。

    报警回调

    填写公网可访问的URL地址,云监控会将报警信息通过POST或GET请求推送到该URL地址,目前仅支持HTTP协议。关于报警回调的设置方法,请参见使用阈值报警回调

  9. 创建结果页面,单击关闭

修改日志监控项

  1. 登录云监控控制台

  2. 在左侧导航栏,选择云资源监控 > 应用分组

  3. 应用分组页签,单击目标应用分组名称链接。

  4. 在目标应用分组的左侧导航栏,单击日志监控

  5. 单击目标监控项对应操作列的编辑

  6. 关联资源页面,设置监控项相关参数,单击下一步

    参数

    描述

    地域

    日志服务中日志项目(日志Project)所在地域。

    日志Project

    日志服务中日志项目的名称。

    日志Logstore

    日志服务中日志库的名称。

  7. 监控项定义页面,设置监控项相关参数,单击下一步

    参数

    描述

    单位

    监控项的单位。

    计算周期

    监控项的计算周期。单位:分钟。取值:1、2、3、4、5、10、15、20、30、60。

    统计方法

    在计算周期内根据选定的统计方法对日志数据进行聚合处理。如果字段值是数值型,可以使用所有统计方法,否则只能使用计数countps两种聚合算法。取值:

    • 计数:计算统计周期内指定字段数值的个数。

    • 求和:计算1分钟内指定字段数值之和。

    • 最大值:计算统计周期内指定字段数值的最大值。

    • 最小值:计算统计周期内指定字段数值的最小值。

    • 平均值:计算统计周期内指定字段数值的平均值。

    • countps:计算统计周期内指定字段求count后的每秒平均值。

    • sumps:计算统计周期内指定字段求sum后的每秒平均值。

    • distinct:去重后计算统计周期内指定字段出现的次数。

    扩展字段

    为统计方法中的结果提供四则运算功能,例如:在统计方法中配置了HTTP状态码请求总数TotalNumber和HTTP状态码大于499的请求数5xxNumber,则可以通过扩展字段计算出服务端的错误率:5xxNumber/TotalNumber*100。

    日志筛选

    对日志数据进行过滤,相当于SQL中的where条件,例如:Key为level,Value中需要监控的关键字为ERROR,该参数设置为level>=ERROR

    选择过滤的日志字段名不能包含中文。

    Group-By

    对数据进行空间维度聚合,相当于SQL中的Group By。

    根据指定的维度,对监控数据进行分组。如果Group By不选择任何维度,则根据聚合方法对全部监控数据进行聚合。

    关于Group By,请参见Group By子句

    Select SQL

    将统计方法转化成SQL语句,方便您理解数据的处理方式。

    应用分组

    应用分组的名称。将该监控项添加到指定应用分组中。

  8. 报警设置页面,设置报警规则相关参数,单击下一步

    参数

    描述

    规则名称

    报警规则的名称。

    规则描述

    报警规则的主体。当监控数据满足指定报警条件时,触发报警规则。

    报警级别

    报警通知方式。取值:

    • 电话+短信+邮件+WebHook

    • 短信+邮件+WebHook

    • 邮件+WebHook

    连续几次超过阈值后报警

    连续几次超过阈值后,报警联系人组中的联系人会收到报警通知。取值:1、3、5、10、15、30、60、90、120、180。

    通道沉默周期

    报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时、24小时。

    监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

    生效时间

    报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。

    报警回调

    填写公网可访问的URL地址,云监控会将报警信息通过POST或GET请求推送到该URL地址,目前仅支持HTTP协议。关于报警回调的设置方法,请参见使用阈值报警回调

  9. 创建结果页面,单击关闭

删除日志监控项

  1. 登录云监控控制台

  2. 在左侧导航栏,选择云资源监控 > 应用分组

  3. 应用分组页签,单击目标应用分组名称链接。

  4. 在目标应用分组的左侧导航栏,单击日志监控

  5. 删除日志监控项。

    • 单个删除

      1. 先单击目标监控项对应操作列的image.png图标,然后单击删除

      2. 确认删除日志监控对话框,单击确定

    • 批量删除

      1. 先单击目标监控项前面的复选框,然后单击左下角的批量删除

      2. 确认删除日志监控对话框,单击确定