事件中心

更新时间:2025-03-20 08:36:17

Serverless 应用引擎提供了事件中心的功能,专门用于高效且灵活地处理由应用和任务产生的各类事件。通过此功能,能帮助您简化运维流程。本文主要介绍如何查看应用和任务产生的事件并创建订阅事件规则。

背景信息

SAE中,事件的产生源只要来自三个方面:运行时事件、变更时事件,以及系统级操作产生的事件。这些事件无需用户手动配置,系统会根据预定义的规则自动生成并触发相应动作。

SAE也提供了事件通知的能力,通过钉钉、短信、邮件和企业微信的方式定向给订阅规则的用户发送应用或任务运行时事件、变更事件或系统产生的事件,为用户及时响应和自动化运维奠定坚实基础。具体流程如下所示:

image

当应用或任务有事件产生后,SAE会根据您创建的订阅规则去筛选事件,然后通过您配置的事件通知渠道进行推送。

功能介绍

事件等级

产生的事件分三个等级。具体信息说明,请参见下表。

事件等级

说明

事件等级

说明

INFO

这个等级表示一般性的信息性消息,不表示有任何问题或错误发生。它用于记录应用或任务运行的正常过程、状态变化或者操作成功的细节。

WARNING

这个等级表示一种告警状态,指出在应用或任务执行过程中发生了偏离预期的行为。它记录的是非致命性问题或潜在问题,提示虽未立即中断操作,但存在可能影响系统正常运行或存在一些潜在的问题,需关注并适时处理以避免出现更严重的后果。

CRITICAL

这个等级表示最高级别的告警,表明发生了非常严重的错误,可能导致系统崩溃、数据丢失或其他灾难性后果,当遇到此类事件时,应当立即采取行动进行修复。

事件类型

事件来源不同,事件的类型也不同。具体介绍,如下表所示:

事件来源

资源类型

事件类型

事件来源

资源类型

事件类型

运行时事件

微服务应用

有健康检查失败事件、实例重启事件、OOM事件、弹性伸缩事件、任务执行成功事件、任务执行失败事件、拉取镜像失败事件、可用IP不足事件、死锁事件、流量不均事件、JVM指标异常事件、新增异常事件、错误率突增事件、RT突增事件、QPS突增事件、TopN接口错误率突增事件、TopNRT突增事件、TopN异常率突增事件和微服务优雅下线事件。

Web应用

有镜像拉取失败、弹性扩容成功事件、弹性缩容成功事件和弹性扩容失败事件。

变更时事件

微服务应用

有健康检查失败事件、镜像拉取失败事件、手动分批发布未执行事件和发布单失败事件。

Web应用

有健康检查失败事件、镜像构建失败、版本切流成功事件和版本切流失败事件。

系统事件

微服务应用

CLB配置冲突检查事件和网关路由配置冲突检查事件。

前提条件

查询事件

  1. 登录SAE控制台,在左侧导航栏选择企业级特性 > 事件中心

  2. 事件查询页签,按以下条件进行筛选,然后单击查询

    EcXSL3P7xL

    (可选)按照以下筛选条件进行筛选查询。

    • 事件来源:支持按照运行时事件变更时事件系统事件来进行筛选。如果您不选择事件来源,则默认查询所有来源的事件。

    • 资源类型:支持筛选Web应用微服务应用产生的事件。如果您不进行资源类型的筛选,则默认查询所有资源类型产生的事件。

    • 事件类型:按需在下拉框中选择您需要筛选的事件类型。如果您不进行选择,则默认查询所有事件类型的事件。

    • 事件等级:可以通过INFOWARNINGCRITICAL三种等级进行筛选事件。如果您不进行筛选,将默认查询所有等级的事件。

    • 地域信息:在下拉列表中选择应用或任务所在的地域。如果您不选择地域,则默认查询所有地域下应用或任务产生的事件。

    打开显示高级选项的开关后,条件筛选时可以具体筛选到应用。

    • 命名空间:如果您在地域信息的下拉列表中选择了目标地域,可以在命名空间对应的下拉列表中筛选目标地域下的命名空间。如果您没有选择目标地域,只能手动输入目标命名空间名称进行查询。

    • 应用:如果您筛选了命名空间,可以在下拉列表中选择具体应用或任务进行查询。 如果您没有筛选命名空间,需要手动输入应用或任务的名称。

    说明

    默认查询最近一周的事件,可自定义查询事件的时间段。

  3. 在条件筛选之后。单击具体事件操作列的查看,可以查看事件详情,此事件的详细信息将以JSON的格式进行展示。

    zkUPN0dvdg

    您可以根据具体的事件等级和事件的详细描述,对事件中所涉及到的应用或任务采取相应的措施(修复、优化、暂停或加强监控等)。

创建订阅规则

订阅规则可以通过以下两个入口进行创建:

在订阅规则页签进行创建
在事件查询页签进行创建
  1. 事件中心页面,单击订阅规则页签,然后单击新建订阅规则

    wpkAYOaBOC

  2. 在弹出的新建订阅规则面板,配置事件订阅规则,然后单击下一步

    D3RsYj9i9p

    说明
    • 事件通知生效资源配置项说明:

      • 如果您不选择目标命名空间,则无法筛选应用或任务。

      • 选择目标命名空间后,可以选择全部应用和任务全部应用全部任务或具体的应用或任务。

    • 检查周期触发通知阈值配置项说明:

      这两个配置项需配合设置,表示在多少秒或分钟之内出现了多少次同一事件,才会触发通知。例如:配置检查周期为1分钟,触发通知阈值设置为3次。表示当某应用或任务在1分钟内出现了3次及以上的同一事件,则会触发事件通知。

  3. 配置通知对象,然后单击提交

    257Ybekjsm

    如果您在创建订阅规则时没有启用该规则,在订阅规则创建成功后,需在订阅规则页签启用该规则。

    说明
  4. 本文以配置健康检查失败事件为例进行测试。验证当应用健康检查失败后是否能收到告警通知。

    说明
    • 报警通知会有一定的时间延迟,请您耐心等待。

    • 本文以钉钉企业微信告警为例进行测试。

    钉钉机器人告警

    企业微信机器人告警

    MuXd9M5Cf3

    5pS34MC1r4

说明

如果您通过此页签提供的入口创建订阅规则,会自动默认设置事件来源资源类型事件类型事件通知生效资源,这些默认的设置是依据所查询的目标事件进行配置的,但是,这些默认的配置您可以自行修改。

  1. 事件查询面板查询目标事件

  2. 单击目标事件操作列的订阅

    1YyatWXosg

  3. 在弹出的新建订阅规则面板,配置事件订阅规则,然后单击下一步

    D3RsYj9i9p

    说明
    • 事件通知生效资源配置项说明:

      • 如果您不选择目标命名空间,则无法筛选应用或任务。

      • 选择目标命名空间后,可以选择全部应用和任务全部应用全部任务或具体的应用或任务。

    • 检查周期触发通知阈值配置项说明:

      这两个配置项需配合设置,表示在多少秒或分钟之内出现了多少次同一事件,才会触发通知。例如:配置检查周期为1分钟,触发通知阈值设置为3次。表示当某应用或任务在1分钟内出现了3次及以上的同一事件,则会触发事件通知。

  4. 配置通知对象,然后单击提交

    257Ybekjsm

    如果您在创建订阅规则时没有启用该规则,在订阅规则创建成功后,需在订阅规则页签启用该规则。

    说明
  5. 本文以配置健康检查失败事件为例进行测试。验证当应用健康检查失败后是否能收到告警通知。

    说明
    • 报警通知会有一定的时间延迟,请您耐心等待。

    • 本文以钉钉企业微信告警为例进行测试。

    钉钉机器人告警

    企业微信机器人告警

    MuXd9M5Cf3

    5pS34MC1r4

相关操作

订阅规则面板,找到目标规则,您可以选择进行以下操作:克隆规则、编辑规则、启用规则、停用规则和删除规则。

aPzuj0bKAK

  • 本页导读 (1)
  • 背景信息
  • 功能介绍
  • 事件等级
  • 事件类型
  • 前提条件
  • 查询事件
  • 创建订阅规则
  • 相关操作