性能风险事件通知

当实例的CPU、存储以及网络性能达到实例规格上限或者实例的连通性存在异常时,阿里云会发送实例性能风险事件通知。

事件列表

说明

部分事件还未完全开放,敬请关注后续动态。如您觉得性能风险事件告警过于频繁,可通过创建订阅策略将对应的风险事件设为黑名单,减少不必要的打扰。

事件Code

事件名称

事件等级

云监控事件名称

事件说明

处理建议

Instance:CPUPerformanceReachLimit

实例的CPU性能达到规格上限

警告

  • Instance:CPUPerformanceReachLimit:Executed : 实例的CPU性能达到规格上限

阿里云检测到实例的CPU利用率达到100%或达到实例规格上限。

判断标准:过去三分钟内,2次达到实例规格定义的CPU上限即发送事件。(默认静默10分钟)

类型说明:

  • CPULimit:实例CPU利用率达到100%。

  • CreditLimit:突发性能实例达到规格上限

CPU利用率长期达到规格上限可能会对业务产生不利影响,建议您根据实际业务情况进行调整。更多信息,请参见Linux实例CPU使用率或负载较高问题的排查与处理Windows实例CPU使用率较高问题的排查与处理

Instance:StoragePerformanceReachLimit

实例的存储性能达到规格上限

警告

  • Instance:StoragePerformanceReachLimit:Executed : 实例的存储性能达到规格上限

阿里云检测到实例的磁盘带宽、IOPS达到实例规格上限。

判断标准:过去三分钟内,2次达到实例规格定义的存储性能上限即发送事件。(默认静默10分钟)

说明

StoragePerformanceReachLimit事件不支持实例规格6代以下的ECS实例。

类型说明:

  • EcsBaseBPS:实例云盘带宽达到规格上限

  • EcsBurstBPS:实例云盘带宽达到规格突发上限

  • EcsBaseIOPS:实例云盘IOPS达到规格上限

  • EcsBurstIOPS:实例云盘IOPS达到规格突发上限

存储性能长期达到规格上限可能会对业务产生不利影响,建议您根据实际业务情况进行调整。更多信息,请参见Linux系统磁盘I/O负载较高问题的排查与处理Windows系统磁盘I/O负载较高问题的排查与处理

Instance:NetworkPerformanceReachLimit

实例的网络性能达到规格上限

警告

  • Instance:NetworkPerformanceReachLimit:Executed : 实例的网络性能达到规格上限

阿里云检测到实例的网络性能达到实例规格上限。

判断标准:过去三分钟内,2次达到实例规格定义的网络性能上限即发送事件。(默认静默10分钟)

类型说明:

  • PublicBandwidthRx:实例公网入带宽达到上限

  • PublicBandwidthTx:实例公网出带宽达到上限

  • InstanceBandwidthRx: 实例入网带宽达到上限

  • InstanceBandwidthTx:实例出网带宽达到上限

  • InstanceBurstBandwidthRx:实例入网带宽达到突发上限

  • InstanceBurstBandwidthTx:实例出网带宽达到突发上限

  • EcsSessionQuota:实例连接数达到规格上限

  • InboundPacketLoss:实例入方向受限丢包

  • OutboundPacketLoss:实例出方向受限丢包

网络性能长期达到规格上限可能会对业务产生不利影响,建议您根据实际业务情况进行调整。更多信息,请参见Linux实例网络带宽使用率较高问题的排查与处理Windows实例网络带宽使用率较高问题的排查与处理

Instance:StatusCheckFailed

实例状态检查失败

警告

  • Instance:StatusCheckFailed:Executing : 实例状态检查失败执行中

  • Instance:NetworkPerformanceReachLimit:Executed : 实例状态检查失败已结束

阿里云检测到实例的连通性存在异常。

判断标准:实时检测实例连通性是否存在异常。

类型说明:

  • SysFailed:实例所在宿主机状态检查失败

  • InstanceFailed:实例操作系统状态检查失败

阿里云检测到实例的连通性存在异常,需要及时排查。更多信息,请参见诊断实例的健康状态

事件内容

实例的CPU性能达到规格上限事件为例,事件通知的JSON格式如下所示:

{
    "id": "2256A988-0B26-4E2B-820A-******",
    "product": "ECS",
    "resourceId": "acs:ecs:cn-hangzhou:169070********30:instance/i-bp1ecr********5go2go",
    "level": "WARN",
    "instanceName": "instanceName",
    "regionId": "cn-hangzhou",
    "name": "Instance:CPUPerformanceReachLimit:Executed",
    "content": {
        "eventId":"e-2ze31nb2*******",
        "instanceId":"i-2zebej68iov*******",
        "eventType":"CPUPerformanceReachLimit",
        "eventStatus":"Executed",
        "reasonCode":"CPULimit",
        "publishTime":"2025-06-03T07:08:44Z",
        "notBefore":"2025-06-03T07:08:44Z",
        "executeStartTime":"2025-06-03T07:08:44Z",
        "executeFinishTime":"2025-06-03T07:08:44Z",
        "reason":"CPULimit",
        "privateIpAddress":["10.xxx.xxx.xxx"],
        "publicIpAddress":["192.xxx.xxx.xxx"]
    }
}

content字段的含义如下表所示。

字段

说明

示例值

eventId

事件ID。

e-2ze31nb2*******

instanceId

实例ID。

i-bp1ecr********5go2go

eventType

事件类型。

CPUPerformanceReachLimit

eventStatus

事件状态。

Executed

reasonCode

事件发生原因分类代码。

CPULimit

publishTime

事件的发布时间。

2025-06-03T07:08:44Z

notBefore

计划执行时间。

2025-06-03T07:08:44Z

executeStartTime

执行开始时间,采用UTC +0时区。

2025-06-03T07:08:44Z

executeFinishTime

执行结束时间,采用UTC +0时区。

2025-06-03T07:08:44Z

reason

事件发生原因。

CPULimit

privateIpAddress

私网地址。

["10.xxx.xxx.xxx"]

publicIpAddress

公网地址。

["192.xxx.xxx.xxx"]