文档

监控与报警概述

更新时间:

通过查看表格存储资源的监控信息,您可以了解资源的使用情况。通过为资源的重要监控指标设置报警规则,您还可以及时得知指标异常并快速处理异常。本文介绍了支持的监控项以及支持为监控指标设置的报警规则信息。

背景信息

云监控(CloudMonitor)是一项针对阿里云资源和互联网应用进行监控的服务。云监控可用于监控各云服务资源的监控指标,并针对指定监控指标设置报警。使您全面了解阿里云上资源的使用情况和业务运行状况,并及时对故障资源进行处理,保证业务正常运行。更多信息,请参见什么是云监控

监控项说明

通过云监控控制台支持对表格存储的实例进行数据监控,通过云监控API支持对表格存储的实例或者表进行数据监控,通过表格存储控制台支持对表格存储实例、表、多元索引进行数据监控。

通过云监控控制台操作

资源类型

监控项

说明

实例

VCU

VCU模式(原预留模式)下每分钟VCU的使用情况。支持按照平均值、最大值、最小值和求和值查看实例VCU个数。

说明

VCU是VCU模式(原预留模式)下计算能力的单位,1 VCU相当于4核16 GB的处理能力。更多信息,请参见计算资源评估

监控指标包括已使用的VCU、正在使用VCU和实例预留VCU个数。

InstanceCU

按量模式下每分钟平均消耗的CU个数。

说明

CU是按量模式下读吞吐量和写吞吐量的单位。更多信息,请参见读写吞吐量

监控指标包括内部读CU、内部写CU、实例按量读CU、实例按量写CU、操作读CU和操作写CU。

RequestCount

每分钟的平均请求次数。

监控指标包括总请求、2xx请求、429请求、4xx请求和5xx请求。

InstanceNet

每分钟平均使用的流量。

监控指标包括外网流入流量、外网流出流量、免费外网流出流量、内网流入流量和内网流出流量。

RowCount

每分钟平均操作的行数统计。

监控指标包括总行数和失败行数。

通过云监控SDK操作

资源类型

监控项

说明

实例

InstanceCount2xxNumber

2xx请求次数。单位为countSecond。

InstanceCount429Number

429请求次数。单位为countSecond。

InstanceCount4xxNumber

4xx请求次数。单位为countSecond。

InstanceCount5xxNumber

5xx请求次数。单位为countSecond。

InstanceElasticVCU

VCU模式(原预留模式)下实例弹性VCU。单位为countSecond。

InstanceExtranetIn

外网流入流量。单位为Bytes/s。

InstanceExtranetOut

外网流出流量。单位为Bytes/s。

InstanceFailRowCount

操作失败行数。单位为Row/s。

InstanceFreeExtranetOut

免费外网流出流量。单位为Bytes/s。

InstanceFreeReadCU

内部读CU。单位为CU/s。

InstanceFreeWriteCU

内部写CU。单位为CU/s。

InstanceIntranetIn

内网流入流量。单位为Bytes/s。

InstanceIntranetOut

内网流出流量。单位为Bytes/s。

InstanceOverReadCU

实例超量读CU。单位为CU/s。

InstanceOverWriteCU

实例超量写CU。单位为CU/s。

InstanceReadCU

实例操作读CU。单位为CU/s。

InstanceRequestNumber

总请求次数。单位为countSecond。

InstanceReservedVCU

VCU模式(原预留模式)下实例的预留VCU个数。单位为countSecond。

InstanceRowCount

操作总行数统计。单位为Row/s。

InstanceVCU

实例VCU。单位为countSecond。

表(包括数据表和二级索引表)

AverageLatency

操作平均延时。单位为微秒(us)。

Count2xxNumber

2xx请求次数。单位为countSecond。

Count429Number

429请求次数。单位为countSecond。

Count4xxNumber

4xx请求次数。单位为countSecond。

Count5xxNumber

5xx请求次数。单位为countSecond。

ExtranetIn

外网流入流量。单位为Bytes/s。

ExtranetOut

外网流出流量。单位为Bytes/s。

FailRowCount

操作失败行数。单位为Row/s。

FreeExtranetOut

免费外网流出流量。单位为Bytes/s。

FreeReadCU

内部读CU。单位为CU/s。

FreeWriteCU

内部写CU。单位为CU/s。

IntranetIn

内网流入流量。单位为Bytes/s。

IntranetOut

内网流出流量。单位为Bytes/s。

OverReadCU

表超量读CU。单位为CU/s。

OverWriteCU

表超量写CU。单位为CU/s。

ReadCU

操作读CU个数。单位为CU/s。

RequestNumber

总请求。单位为countSecond。

RowCount

操作总行数。单位为Row/s。

WriteCU

操作写CU。单位为CU/s。

通过表格存储控制台操作

资源类型

监控项

说明

实例、表(包括数据表和二级索引表)、多元索引

每秒请求次数

每分钟平均的请求次数。

监控指标包括总QPS、2xx QPS、4xx QPS、5xx QPS和429 QPS。

行数统计

每分钟平均操作的行数。

监控指标包括总行数和失败行数。

流量统计

每分钟平均使用的流量。

监控指标包括外网流入、外网流出、内网流入、内网流出和免费外网流出。

CapacityUnit

每分钟平均消耗的CU个数。

监控指标包括读CU、写CU、内部读CU和内部写CU。

请求状态统计

2xx、4xx、429、5xx等请求类型的统计值以及百分比信息。

表、多元索引

平均访问延迟

每分钟的平均访问延迟。

监控指标包括请求延时。

表大小

每分钟的数据量大小。

多元索引

存储

多元索引存储的数据量大小。单位为字节。

行数

多元索引同步数据表的行数。

预留读CU

多元索引的预留CU个数。

报警规则说明

通过云监控控制台,您可以为不同监控指标设置报警规则。当资源的监控指标达到报警条件时,云监控会自动发送报警通知。下表列出了报警规则的报警级别、通知机制以及报警条件信息。

报警等级

通知机制

报警条件

紧急Critical

电话+短信+邮件+钉钉机器人

连续N个周期监控指标的平均值与指定阈值满足所设置的判断条件。

其中N值请根据报警等级进行区分设置。

说明

当所选的指标类型不同时,报警条件会存在差异,请以实际界面为准。

警告Warn

短信+邮件+钉钉机器人

普通Info

邮件+钉钉机器人

  • 本页导读 (1)