系统事件

系统事件由阿里云定义,用于记录和通知云资源的信息。本文为您介绍云消息队列 Kafka 版系统事件名称,类型等信息系。

背景信息

云监控支持云消息队列 Kafka 版系统事件,当资源的系统事件达到报警条件时,云监控自动发送原始报警通知给您,让您及时得知云消息队列 Kafka 版实例的运行状态。

前提条件

配置云消息队列 Kafka 版事件通知,详情请参见管理事件订阅(推荐)

系统事件

云消息队列 Kafka 版支持的系统事件如下所示:

事件名称

事件描述

事件级别

事件类型

状态

Instance:Mutation

实例变配

INFO

Notification

Normal

Instance:Risk

实例风险告警

WARN

Exception

Exception

Instance:State:Change

实例状态改变通知

INFO

StatusNotification

Normal

Instance:Upgrade:Config

服务配置升级

INFO

Notification

Normal

Instance:Upgrade:Version

版本升级

INFO

Notification

Normal

Instance:Upgrade:Version:Notify

实例版本升级通知

WARN

Notification

Normal

通知格式

设置了事件通知后,事件会被推送到您设置的通知方式。以云消息队列 Kafka 版实例版本升级通知事件为例,非定制化JSON格式的通知如下所示。

说明

如果您设置的通知方式有格式转换功能,请以实际效果为准。

{
    "ver": "1.0",
    "id": "8582C4CB-1869-41AA-8091-73********C3",
    "requestId": "41F12ADB-370B-4D7E-B74D-**********1D",
    "eventTime": "1742975149000",
    "product": "kafka",
    "resourceId": "alikafka_post-cn-xxxx",
    "level": " WARN",
    "instanceName": "alikafka_post-cn-xxxx",
    "regionId": "cn-hangzhou",
    "name": "Instance:Upgrade:Version:Notify",
    "userId": "169070********30",
    "status": "Normal",
    "content": {
        "version": "v2"
    }
}

事件通知的顶层字段包含以下固定字段。

字段

说明

示例值

ver

版本ID。

1.0

id

事件ID。

8582C4CB-1869-41AA-8091-73********C3

requestId

请求ID。

41F12ADB-370B-4D7E-B74D-**********1D

eventTime

事件发生时间。

1742975149000

product

产品名称。取值为kafka。

kafka

resourceId

资源ID。

alikafka_post-cn-xxxx

level

事件级别。取值如下:

  • INFO:消息

  • WARN:警告

  • CRITICAL:严重

WARN

instanceName

实例名称。

alikafka_post-cn-xxxx

regionId

阿里云地域ID。

cn-hangzhou

name

事件名称。

Instance:Upgrade:Version:Notify

userId

云账号ID。

169070********30

status

事件状态。

Normal

content

事件详情信息。详情请参见事件列表

事件列表

Instance:Mutation

  • 事件描述:实例变配

  • 事件级别:INFO

  • 事件类型:Notification

事件通知信息详情如下:

{
    "ver": "1.0",
    "status": "Normal",
    "instanceName": "alikafka_post-cn-xxxx",
    "resourceId": "acs:alikafka:eu-west-1:175923598xxxxxxx:instance/alikafka_post-cn-xxxx",
    "content": {
        "data": {
            "newPropertyValues": {
                "ioMaxSpec": "alikafka.hw.3xlarge"
            },
            "oldPropertyValues": {
                "ioMaxSpec": "alikafka.hw.2xlarge"
            }
        },
        "eventType": "Notification",
        "instanceId": "alikafka_post-cn-xxxx",
        "instanceName": "alikafka_post-cn-xxxx",
        "uploadTime": 1758039249760
    },
    "product": "kafka",
    "time": 1758039249000,
    "level": "INFO",
    "regionId": "eu-west-1",
    "id": "e6245875-c9f0-44bf-b752-**********2",
    "groupId": "0",
    "name": "Instance:Mutation"
}

字段

说明

示例值

data

实例变配数据。

newPropertyValues

新属性值。

ioMaxSpec

流量规格。

alikafka.hw.3xlarge

oldPropertyValues

旧属性值。

ioMaxSpec

流量规格。

alikafka.hw.2xlarge

eventType

事件类型。

Notification

instanceId

实例ID。

alikafka_post-cn-xxxx

instanceName

实例名称。

alikafka_post-cn-xxxx

uploadTime

上传时间戳。

1758039249760

Instance:Risk

  • 事件描述:实例风险告警

  • 事件级别:WARN

  • 事件类型:Exception

事件通知信息详情如下:

{
    "ver": "1.0",
    "status": "Exception",
    "instanceName": "alikafka_post-cn-xxxxx",
    "resourceId": "acs:alikafka:cn-hangzhou:10536xxxxxxxxx:instance/alikafka_post-cn-xxxx",
    "content": {
        "eventType": "Exception",
        "instanceId": "alikafka_post-cn-xxxxx",
        "instanceName": "alikafka_post-cn-xxxxx",
        "riskData": [
            {
                "accessLevel": 7,
                "gradeType": "F",
                "health": false,
                "levelType": 0,
                "name": "publicTcpConnection",
                "originLevelType": 1,
                "relationList": [],
                "reportTips": "公网连接数过多,会影响集群稳定性, 建议优化连接方式",
                "reportType": "mdsKey",
                "reportValue": "",
                "value": "298.0"
            }
        ],
        "uploadTime": 1757913918071
    },
    "product": "kafka",
    "time": 1757913918000,
    "level": "WARN",
    "regionId": "cn-hangzhou",
    "id": "68f03e98-e436-457b-adda-**********6",
    "groupId": "0",
    "name": "Instance:Risk"
}

字段

说明

示例值

riskData

风险告警数据。

accessLevel

访问级别。

7

gradeType

指标评级。

  • A:健康。

  • B:亚健康。

  • F:差。

F

health

实例是否健康。

  • true:健康。

  • false:不健康。

false

levelType

风险级别。

  • 0:紧急。

  • 1:重要。

  • 2:一般。

0

name

风险类型名称。

  • topic:表示 xx Topic存在风险问题。

  • group:表示 xx Group存在风险问题。

  • offsetCommitTimes:消费客户端过于频繁提交消费位点。

  • multiAssignGroup:同一个分区被分配给多个消费线程消费。

  • partitionLeft:分区数量不足。

  • topicLeft:Topic 数量不足。

  • diskUsage:磁盘使用情况。

  • outputIo:读取流量超流。

  • inputIo:写入流量超流。

  • diskLean:集群磁盘存在倾斜情况。

  • topicLean:Topic的分区存在分区倾斜风险。

  • singlePartitionTopic:存在云存储单分区的Topic。

  • chipProduce:消息过于碎片化。

  • syncProduce:Topic使用同步发送。

  • conversionProduce:Topic格式转换。

  • publicTcpConnection:公网连接数过多。

  • tcpConnection:连接数过多。

  • version:小版本过低。

  • groupLeft:Group配额不足。

  • sendTimeGroup:Group存在消费耗时较大的问题。

  • leaveGroup:Group存在消费客户端主动离开队列并触发了 Rebalance。

  • rebalanceGroup:相关问题里的Group存在Rebalance现象。

  • saramaClient:使用sarama客户端。

  • groupTopicMap:Group订阅过多的Topic。

publicTcpConnection

originLevelType

源级别类型。

1

relationList

关系列表。内部会根据外层字段判断是否再嵌套一层报告数据。

reportTips

修复建议。

公网连接数过多,会影响集群稳定性, 建议优化连接方式

reportType

风险项的报告类型。

  • topic:具体到某个 Topic 需要进行优化。

  • group:具体到某个 Group 需要进行优化。

  • doc:表示需要按照文档进行优化。

  • commonBuy: 表示返回的风险项,需要进行升配等操作。

  • mdsKey:只需按照 ReportTips 中的建议进行修复即可。

mdsKey

reportValue

风险报告值。

说明
  • ReportTypedoc时,ReportValue返回的是文档地址。用户可根据返回的值进行组装进行链接跳转,将返回的 ReportValue的值替换即可访问文档地址: https://help.aliyun.com/document_detail/${reportValue}.html

  • ReportTypecommonBuy时。表示需要进行升配等操作。

  • ReportTypetopic时,关注reportValue中的值,reportValue值就是出现问题需要修复的Topic。

  • ReportTypegroup时,关注reportValue中的值,reportValue值就是出现问题需要修复的Group。

  • ReportTypemdsKey时,只需按照ReportTips中的建议进行修复即可。

value

系统计算出的值。当风险类型名称为publicTcpConnection时,指的是单节点公网 TCP 连接数。

说明

ReportTypedoc时。需要同时看relationList字段和value字段,value字段会给返回一个数量,表示relationList字段中,有多少个TopicGroup需要优化。

  • ReportTypecommonBuy时。需要关注对比Value的值,Value会给返回一个百分比的数值。

  • ReportTypetopic时,关注Value中的值,value值就是出现问题需要修复的Topic。

  • ReportTypegroup时,关注Value中的值,value值就是出现问题需要修复的Group。

298.0

eventType

事件类型。

Exception

instanceId

实例ID。

alikafka_post-cn-xxxx

instanceName

实例名称。

alikafka_post-cn-xxxx

uploadTime

上传时间戳。

1757913918071

Instance:State:Change

  • 事件描述:实例状态改变通知

  • 事件级别:INFO

  • 事件类型:StatusNotification

事件通知信息详情如下:

{
    "ver": "1.0",
    "status": "Normal",
    "instanceName": "test",
    "resourceId": "acs:alikafka:cn-hangzhou:105369xxxxxxxx:instance/alikafka_post-cn-xxxx",
    "content": {
        "data": "已停机",
        "eventType": "StatusNotification",
        "instanceId": "alikafka_post-cn-xxxx",
        "instanceName": "test",
        "uploadTime": 1757913992395
    },
    "product": "kafka",
    "time": 1757913992000,
    "level": "INFO",
    "regionId": "cn-hangzhou",
    "id": "f96d1ab8-ee84-435b-b866-**********8",
    "groupId": "0",
    "name": "Instance:State:Change"
}

字段

说明

示例值

data

实例状态改变通知数据。

已停机

eventType

事件类型。

Notification

instanceId

实例ID。

alikafka_post-cn-xxxx

instanceName

实例名称。

alikafka_post-cn-xxxx

uploadTime

上传时间戳。

1757913992395

Instance:Upgrade:Config

  • 事件描述:服务配置升级

  • 事件级别:INFO

  • 事件类型:Notification

事件通知信息详情如下:

{
    "ver": "1.0",
    "status": "Normal",
    "instanceName": "test",
    "resourceId": "acs:alikafka:cn-zhangjiakou:1759235xxxxxxx:instance/alikafka_serverless-cn-xxxxxx",
    "content": {
        "data": {
            "newPropertyValues": {
                "offsets.retention.minutes": "10078"
            },
            "oldPropertyValues": {
                "offsets.retention.minutes": "10079"
            }
        },
        "eventType": "Notification",
        "instanceId": "alikafka_serverless-cn-xxxxxx",
        "instanceName": "test",
        "uploadTime": 1758100169280
    },
    "product": "kafka",
    "time": 1758100169000,
    "level": "INFO",
    "regionId": "cn-zhangjiakou",
    "id": "3a1d3148-0919-463d-9841-**********3",
    "groupId": "0",
    "name": "Instance:Upgrade:Config"
}

字段

说明

示例值

data

实例变配数据。

newPropertyValues

新属性值。

offsets.retention.minutes

消费位点保留时长。

10078

oldPropertyValues

旧属性值。

offsets.retention.minutes

消费位点保留时长。

10079

eventType

事件类型。

Notification

instanceId

实例ID。

alikafka_post-cn-xxxx

instanceName

实例名称。

alikafka_post-cn-xxxx

uploadTime

上传时间戳。

1758100169280

Instance:Upgrade:Version

  • 事件描述:版本升级

  • 事件级别:INFO

  • 事件类型:Notification

事件通知信息详情如下:

{
    "ver": "1.0",
    "status": "Normal",
    "instanceName": "alikafka_post-cn-xxxx",
    "resourceId": "acs:alikafka:cn-huhehaote:175923598xxxx:instance/alikafka_post-cn-xxxx",
    "content": {
        "data": {
            "newPropertyValues": {
                "serviceMiniVersion": "5.1.1.1",
                "openSourceVersion": "2.2.0"
            },
            "oldPropertyValues": {
                "serviceMiniVersion": "5.0.3",
                "openSourceVersion": "2.2.0"
            }
        },
        "eventType": "Notification",
        "instanceId": "alikafka_post-cn-xxxx",
        "instanceName": "alikafka_post-cn-xxxx",
        "uploadTime": 1758161213151
    },
    "product": "kafka",
    "time": 1758161213000,
    "level": "INFO",
    "regionId": "cn-huhehaote",
    "id": "38ae38e6-c152-4371-9b4b-**********3",
    "groupId": "0",
    "name": "Instance:Upgrade:Version"
}

字段

说明

示例值

data

实例变配数据。

newPropertyValues

新属性值。

serviceMiniVersion

实例小版本。

5.1.1.1

openSourceVersion

开源版本。与实例大版本相对应。

2.2.0

oldPropertyValues

旧属性值。

serviceMiniVersion

实例小版本。

5.0.3

openSourceVersion

开源版本。与实例大版本相对应。

2.2.0

eventType

事件类型。

Notification

instanceId

实例ID。

alikafka_post-cn-xxxx

instanceName

实例名称。

alikafka_post-cn-xxxx

uploadTime

上传时间戳。

1758161213151

Instance:Upgrade:Version:Notify

  • 事件描述:实例版本升级通知

  • 事件级别:WARN

  • 事件类型:Notification

事件通知信息详情如下:

{
    "ver": "1.0",
    "id": "8582C4CB-1869-41AA-8091-73BEE551D2C3",
    "requestId": "41F12ADB-370B-4D7E-B74D-464E8D5D8B1D",
    "eventTime": "1742975149000",
    "product": "kafka",
    "resourceId": "alikafka_post-cn-xxxx",
    "level": " WARN",
    "instanceName": "alikafka_post-cn-xxxx",
    "regionId": "cn-hangzhou",
    "name": "Instance:Upgrade:Version:Notify",
    "userId": "278549724441440438",
    "status": "Normal",
    "content": {
        "version": "v2"
    }
}

字段

说明

示例值

version

实例版本。

v2