事件集成

更新时间:
复制为 MD 格式

云监控2.0事件中心可以通过事件集成功能接入第三方监控平台或自定义系统的告警事件,实现统一的事件管理和告警通知。

功能简介

事件集成支持将来自不同监控系统的告警事件统一接入云监控2.0平台,通过字段映射将外部事件格式转换为标准事件格式,从而实现:

  • 统一管理多个监控平台的告警事件。

  • 配置灵活的事件处理规则。

  • 通过事件订阅实现告警通知。

创建事件集成

  1. 登录云监控2.0控制台,选择目标工作空间,在左侧导航栏选择所有功能 > 事件中心

  2. 事件中心的导航栏,选择事件管理 > 事件集成

  3. 单击新建事件集成创建事件集成,配置参数:

    • 名称:事件集成策略的名称,用于标识该集成。

    • 描述:事件集成的描述信息。

编辑事件集成

  1. 创建事件集成后,您可以编辑集成配置,包括修改描述和配置事件字段映射。

    只有用户自定义事件类型的集成支持编辑操作。

    参数

    说明

    URL

    事件上报接口地址,格式为https://{regionId}.log.aliyuncs.com/v1/events/{token}

    Token

    事件集成的唯一标识Token,用于验证事件来源

  2. 事件字段映射用于将第三方系统上报的事件数据转换为云监控2.0的标准事件格式。

    • 数据来源

      数据来源

      说明

      源路径

      从上报事件数据中指定路径获取值,使用data.前缀访问原始数据,例如data.subjectdata.detail.AlarmName

      设置值

      直接设置固定的常量值

      合并

      用于标签合并操作,将源路径的map数据合并到目标字段

    • 目标字段

      目标字段

      说明

      ID

      事件的唯一标识

      SOURCE

      事件来源标识

      TIME

      事件时间戳,选择时间字符串时会自动转化为毫秒数时间戳,如果转化失败则使用当前时间

      SUBJECT

      事件描述/标题

      SEVERITY

      严重级别,可选值:CRITICAL(严重)、WARNING(警告)、INFO(信息)

      STATUS

      告警状态,可选值:OCCURRED(发生)、PERSISTENT(持续)、RECOVERED(恢复)

      LABELS

      事件标签,key-value格式

      RESOURCE_TAGS

      资源标签,key-value格式

      RESOURCE_ENTITY

      资源实体信息,包含domain、entity_type、entity_id、prop等属性

      ANNOTATIONS

      事件注释信息

      说明:对于LABELS、RESOURCE_TAGS、RESOURCE_ENTITY、ANNOTATIONSkey-value类型的目标字段,需要额外指定labelKey参数来设置具体的key名称。

      参数

      位置

      是否必填

      说明

      token

      Path

      事件集成的Token

      timestamp

      Query

      事件时间戳(毫秒),用于签名验证

      sign

      Query

      HMAC-SHA256签名,若配置了secret则必填

      debug

      Query

      调试模式,设为true时返回转换后的完整事件对象

发送测试事件

您可以通过控制台发送测试事件来验证事件集成配置是否正确。

  1. 在事件集成列表中,找到目标事件集成,单击发送测试事件

  2. 在测试面板中输入测试事件数据。

  3. 单击发送,查看事件上报结果。

更换密钥

如果您需要更新事件集成的Token(例如出于安全考虑),可以更换密钥。

说明:只有用户自定义事件类型的集成支持更换密钥操作。
  1. 在事件集成列表中,找到目标事件集成,单击更换密钥

  2. 在确认对话框中,单击确定

  3. 更新密钥后,请根据集成手册,在第三方系统中重新配置新的密钥。

说明

更换密钥后,原有的Token将失效,需要在第三方系统中更新为新的Token。

管理事件集成

您可以在事件集成列表中,执行以下操作:

  • 搜索:可以填写事件名称关键字,搜索相关事件信息。在筛选框中可以选择事件的启停状态。

  • 启停状态:通过启停状态按钮可以选择停用或者启用事件。

  • 删除:单击右侧操作列的删除,在弹出的对话框中单击确认

    警告

    删除事件集成后,相关的事件处理配置也会被删除,且无法恢复。

限流说明

  • 自建集成上报告警事件时需要关注事件上报的频率和数量。

  • 当前系统默认为每个阿里云账号提供每分钟1千条、每小时1万条、每天2万条事件上报限流阈值。

  • 当告警事件上报的频率超出阈值时将会触发限流,被限流后该账号下所有的自建集成上报事件时会发生错误。

  • 该限流阈值针对的是去重后的事件,如果一个事件重复上报N次,只做一次计算。

  • 请合理配置集成的去重字段,避免触发限流。如果默认的限流阈值不能满足需求,请提工单进行扩容。

  • 当限流触发时,系统会自动发送站内信通知。

字段映射配置示例

以下是一个将AWS CloudWatch告警事件映射到云监控2.0标准格式的示例配置:

[
  {
    "type": "SET_FIELD",
    "source": "data.subject",
    "target": "SUBJECT"
  },
  {
    "type": "SET_FIELD",
    "value": "WARNING",
    "target": "SEVERITY"
  },
  {
    "type": "SET_FIELD",
    "source": "data.time",
    "target": "TIME"
  },
  {
    "type": "SET_FIELD",
    "source": "data.detail.AlarmName",
    "target": "LABELS",
    "labelKey": "alertName"
  },
  {
    "type": "SET_FIELD",
    "source": "data.detail.Region",
    "target": "LABELS",
    "labelKey": "region"
  },
  {
    "type": "SET_FIELD",
    "source": "data.dims.InstanceId",
    "target": "RESOURCE_ENTITY",
    "labelKey": "prop.instanceId"
  },
  {
    "type": "SET_FIELD",
    "value": "acs.ecs.instance",
    "target": "RESOURCE_ENTITY",
    "labelKey": "entity_type"
  }
]