为Knative服务开启监控告警

您不仅可以通过日志服务SLS采集日志,还可以基于SLS的告警功能监控Knative服务的异常状态。您可以自定义告警监控规则,例如检查频率、触发条件等,并配置对应的告警通知策略,在服务异常时及时以钉钉、短信、邮件等形式通知运维、开发人员进行处理,保证服务的持续运行。

前提条件

步骤一:查询和分析日志

下文介绍在SLS控制台查询和分析日志的控制台入口。详细信息,请参见查询和分析日志

  1. 登录日志服务控制台

  2. 在Project列表区域,单击目标Project。

    image

  3. 在控制台左侧,单击日志存储,在日志库列表中单击目标Logstore。

    image

  4. 输入命令并单击查询/分析

    例如,如果您想根据ERROR出现的次数进行监控,可以使用以下的SQL语句来统计ERROR的数量:

    * | select 'ERROR' , count(1) as total group by 'ERROR'

    这条SQL语句会筛选出所有包含ERROR字段的记录,并统计其数量,然后按照ERROR进行分组。

    image.png

步骤二:配置监控告警

  1. 登录日志服务控制台

  2. 在Project列表区域,单击目标Project。

    image

  3. 在控制台左侧,单击日志存储,在日志库列表中单击目标Logstore。

    image

  4. 在查询和分析页面,单击告警图标图标。

    image

  5. 告警监控规则面板,配置告警规则。

    关于如何配置告警规则,请参见创建日志告警监控规则

  6. 设置告警通知策略。

    关于如何设置告警通知策略,请参见快速设置日志告警

  7. 执行如下命令,访问helloworld-go服务。

    此时会触发告警通知。

    curl -H "Host: helloworld-go.default.example.com" http://<网关IP> # 网关IP和域名请以您的实际数据为准。

    预期输出:

    Hello Knative!

    例如,如果您配置了邮件通知,告警信息可能如下:

    邮件通知

相关文档

您可以将Knative服务的监控数据接入Prometheus并实时查看Grafana大盘,请参见查看Knative服务监控大盘