事件中心

Serverless 应用引擎 SAE(Serverless App Engine)提供了事件中心的功能,专门用于高效且灵活地处理由应用和任务产生的各类事件。通过此功能,能帮助您简化运维流程。本文主要介绍如何查看应用和任务产生的事件并创建订阅事件规则。

背景信息

SAE中,事件的产生源只要来自三个方面:运行时事件、变更时事件,以及系统级操作产生的事件。这些事件无需用户手动配置,系统会根据预定义的规则自动生成并触发相应动作。

SAE也提供了事件通知的能力,通过钉钉、短信或邮件的方式定向给订阅规则的用户发送应用或任务运行时事件、变更事件或系统产生的事件,为用户及时响应和自动化运维奠定坚实基础。具体流程如下所示:

image

当应用或任务有事件产生后,SAE会根据您创建的订阅规则去筛选事件,然后通过您配置的事件通知渠道进行推送。

功能介绍

事件等级

产生的事件分三个等级。具体信息说明,请参见下表。

事件等级

说明

INFO

这个等级表示一般性的信息性消息,不表示有任何问题或错误发生。它用于记录应用或任务运行的正常过程、状态变化或者操作成功的细节。

WARNING

这个等级表示一种告警状态,指出在应用或任务执行过程中发生了偏离预期的行为。它记录的是非致命性问题或潜在问题,提示虽未立即中断操作,但存在可能影响系统正常运行或存在一些潜在的问题,需关注并适时处理以避免出现更严重的后果。

CRITICAL

这个等级表示最高级别的告警,表明发生了非常严重的错误,可能导致系统崩溃、数据丢失或其他灾难性后果,当遇到此类事件时,应当立即采取行动进行修复。

事件类型

事件来源不同,事件的类型也不同。具体介绍,如下表所示:

事件来源

资源类型

事件类型

运行时事件

微服务应用

有健康检查失败事件、实例重启事件、OOM事件、弹性伸缩事件、任务执行成功事件、任务执行失败事件、拉取镜像失败事件、可用IP不足事件、死锁事件、流量不均事件、JVM指标异常事件、新增异常事件、错误率突增事件、RT突增事件、QPS突增事件、TopN接口错误率突增事件、TopNRT突增事件、TopN异常率突增事件和微服务优雅下线事件。

Web应用

有镜像拉取失败、弹性扩容成功事件、弹性缩容成功事件和弹性扩容失败事件。

变更时事件

微服务应用

有健康检查失败事件、镜像拉取失败事件、手动分批发布未执行事件和发布单失败事件。

Web应用

有健康检查失败事件、镜像构建失败、版本切流成功事件和版本切流失败事件。

系统事件

微服务应用

有CLB配置冲突检查事件和网关路由配置冲突检查事件。

前提条件

查询事件

  1. 登录SAE控制台,在事件中心页面单击事件查询页签。

    zyrKLu8osu

  2. 事件查询页签,进行条件筛选,然后单击查询

    image

    • 打开高级设置选项,条件筛选时可以具体筛选到具体的应用实例。

      2tY53OaIrU

    • 如果您不进行资源类型的筛选,打开高级设置选项可以筛选到Job任务产生的事件。

      1ESnZ2Uqf8

  3. 条件筛选之后。在具体事件的操作列单击查看,可以查看事件详情,此事件的详细信息将以JSON的格式进行展示。

    cPV5ITnbvW

    您可以根据具体的事件等级和事件的详细描述,对事件中所涉及到的应用或任务采取相应的措施(修复、优化、暂停和加强监控等)。

创建订阅规则

订阅规则可以通过以下两个入口进行创建:

在订阅规则页签进行创建

  1. 事件中心页面,单击订阅规则,然后单击新建订阅规则

    LsOLTAwqki

  2. 在弹出的新建订阅规则面板,选择需要订阅的事件模式,然后单击下一步

    6hAL545dyO

  3. 配置通知对象,然后单击提交

    b7ItaTPOxU

    说明
    • 通知方式有三种,可以选择一种,也支持同时选择三种。

    • 联系人可以选择一个,也可以同时选择多个,如果您提前没有创建联系人,可以单击新建联系人进行创建。

  4. 测试是否能收到报警。

    说明
    • 报警通知会有一定的时间延迟,请您耐心等待。

    • 本文以钉钉报警为例进行测试。

    qf3NBRxDD6

在事件查询页签进行创建

说明

如果您通过此页签提供的入口创建订阅规则,会自动默认设置事件来源资源类型事件类型事件通知生效资源,这些默认的设置是依据所查询的目标事件进行配置的,但是,这些默认的配置您可以自行修改。

  1. 事件查询面板查询目标事件。具体查询步骤,请参见查询事件

  2. 单击目标事件操作列的订阅

    image

  3. 在弹出的新建订阅规则面板,自定义规则名称,然后单击下一步

    image

  4. 配置通知对象,然后单击提交

    image

    说明
    • 通知方式有三种,可以选择一种,也支持同时选择三种。

    • 联系人可以选择一个,也可以同时选择多个,如果您提前没有创建联系人,可以单击新建联系人进行创建。

  5. 测试是否能收到报警。

    说明
    • 报警通知会有一定的时间延迟,请您耐心等待。

    • 本文以钉钉报警为例进行测试。

    qf3NBRxDD6

相关操作

在订阅规则面板,找到目标规则,您可以选择进行以下操作:克隆规则、编辑规则、停用规则和删除规则。

image