文档

查看监控信息

更新时间:

数仓版(3.0)弹性模式集群版(新版)湖仓版(3.0)集群监控提供了丰富的监控指标,包括查询和写入、资源组信息、表统计信息和集群的运行状况等指标。您可以调用API接口或通过控制台查看集群过去一个月内指定时间段的各项监控指标,掌握集群的性能和运行状况,排查并解决问题。

注意事项

  • 支持查看过去一个月内的监控信息,查看的指定时间段最长为2天。

  • 仅3.1.6及以上版本的集群支持查看健康状态信息。

    说明
  • 当集群为数仓版(3.0)时,您需要注意:

    仅同时满足如下条件的AnalyticDB MySQL版集群才支持查看资源组监控信息:

    • 集群系列需为弹性模式集群版(新版)

    • 集群规格需为32核或以上。

    • 集群内核版本需为3.1.3.2或以上。

数仓版(3.0)查看监控信息

操作步骤

  1. 登录云原生数据仓库AnalyticDB MySQL控制台,在左上角选择集群所在地域。在左侧导航栏,单击集群列表,在数仓版(3.0)页签,单击目标集群ID。

  1. 在左侧导航栏中,单击监控信息

  1. 监控信息页,您可以单击实例资源监控资源组监控表信息统计来查看对应监控信息。

监控项说明

  • 健康状态监控项说明

    重要

    当任一健康状态为风险或不可用时,请联系技术支持。

    监控项

    说明

    实例接入节点状态

    AnalyticDB MySQL接入层由多个实例接入节点组成,主要负责协议层接入、SQL解析和优化、实时写入Sharding、数据调度和查询调度。

    实例接入节点状态包含:

    • 健康:实例接入节点均可用。

    • 风险:存在大于等于50%的接入节点不可用。

    • 不可用:接入节点均不可用。

    计算节点组健康状态

    计算节点组即AnalyticDB MySQL的计算引擎,具备分布式MPP和DAG融合执行能力,结合智能优化器,可支持高并发和复杂SQL混合负载。同时借助云原生基础设施,计算节点实现了弹性调度,可根据业务需求做到分钟级甚至秒级扩展,实现了资源的有效利用。

    计算节点组健康状态包含:

    • 健康:计算节点均可用。

    • 风险:存在大于等于50%的计算节点不可用。

    • 不可用:计算节点均不可用。

    存储节点组健康状态

    存储节点组即AnalyticDB MySQL的存储引擎,基于Raft协议实现的分布式实时强一致高可用存储引擎,通过数据分片和Multi-Raft实现并行存储,利用分层存储实现冷热分离降低成本,通过行列存储和智能索引达到极高性能。

    存储节点组健康状态包含:

    • 健康:存储节点均可用。

    • 风险:存在大于等于50%的存储节点不可用。

    • 不可用:存储节点均不可用。

  • 实例资源监控监控项说明

    监控项

    单位

    说明

    CPU平均使用率

    %

    监控如下信息:

    • 读写节点CPU最大使用率

    • 读写节点CPU使用率

    • 计算节点CPU最大使用率

    • 计算节点CPU使用率

    说明

    预留模式C32规格变配为弹性模式后,CPU平均使用率会增大,详情请参见常见问题

    磁盘IO吞吐

    MB

    监控如下信息:

    • 读写节点磁盘读吞吐量

    • 读写节点磁盘写吞吐量

    • 计算节点磁盘读吞吐量

    • 计算节点磁盘写吞吐量

    磁盘IOPS

    数值

    监控如下信息:

    • 读写节点磁盘平均读次数

    • 读写节点磁盘平均写次数

    • 计算节点磁盘平均读次数

    • 计算节点磁盘平均写次数

    磁盘IO使用率

    %

    监控读写节点磁盘IO使用率。

    磁盘IO等待时间

    毫秒(ms)

    监控读写节点磁盘IO等待时间。

    集群连接数

    数值

    成功建立连接的数量。

    磁盘使用量

    MB

    监控集群的最大磁盘使用量。

    热数据使用量

    MB

    监控集群的热数据使用量。

    冷数据使用量

    MB

    监控集群的冷数据使用量。

    查询

    查询QPS

    数值

    监控查询QPS。

    查询响应时间

    毫秒(ms)

    监控如下信息:

    • 平均查询响应时间

    • 最大查询响应时间

    查询等待时间

    毫秒(ms)

    监控如下信息:

    • 查询平均等待时长

    • 查询最大等待时长

    写入

    写入响应时间

    毫秒(ms)

    监控如下信息:

    • 平均写入响应时间

    • 最大写入响应时间

    删除响应时间

    毫秒(ms)

    监控如下信息:

    • 平均删除响应时间

    • 最大删除响应时间

    更新响应时间

    毫秒(ms)

    监控如下信息:

    • 平均更新响应时间

    • 最大更新响应时间

    写入吞吐量

    MB

    监控集群的平均写入吞吐量。

    TPS

    数值

    监控如下信息:

    • TPS(即所有写入TPS、删除TPS和更新TPS三者的总和)。

    • 写入TPS。

    • 删除TPS。

    • 更新TPS。

  • 资源组监控监控项说明

    监控项

    单位

    说明

    CPU平均使用率

    %

    监控每个资源组的CPU平均使用率。

    查询响应时间

    毫秒(ms)

    监控每个资源组下查询的平均响应时间。

    查询QPS

    数值

    监控每个资源组的查询QPS。

    查询等待时间

    毫秒(ms)

    监控每个资源组下查询的平均等待总耗时。

    资源组分时弹性实际弹出节点数

    数值

    监控每个资源组分时弹性计划中实际生效的节点数(即执行扩容计划时实际增加的节点数)。

    资源组分时弹性计划弹出节点数

    数值

    监控每个资源组分时弹性计划中需要增加的节点数。

    如何新增资源组弹性计划,请参见创建资源弹性计划

    资源组总节点数

    数值

    监控资源组拥有的总节点数,总节点数=基础节点数+实际生效的分时弹性节点数。

    资源组基础节点数

    数值

    监控资源组中的基础节点数。

  • 表信息统计监控项说明

    监控项

    单位

    说明

    数据库

    表所属的数据库名称。

    表名

    表名。

    表行数

    表的总行数。

    表数据量(KB)

    KB

    监控每个表在磁盘上的数据量(不包含索引、主键索引数据)。

    索引数据量(KB)

    KB

    监控每个表的索引数据量(不包含主键索引数据)。

    主键索引数据量(KB)

    KB

    监控每个表的主键索引数据量。

    分区数

    监控每个数据表的分区数。

    说明

    AnalyticDB MySQL在创建非分区表时会生成一个默认的分区,因此非分区表分区数会显示为1

湖仓版(3.0)查看监控信息

操作步骤

  1. 登录云原生数据仓库AnalyticDB MySQL控制台,在左上角选择集群所在地域。在左侧导航栏,单击集群列表,在湖仓版(3.0)页签,单击目标集群ID。

  1. 在左侧导航栏中,单击集群管理 > 监控信息

  1. 数据库监控页面,您可以选择查询时间后单击右上角查询

监控项说明

湖仓版(3.0)集群的监控分为实例监控和集群监控。

  • 实例监控项说明

    重要

    当任一健康状态为风险或不可用时,请联系技术支持。

    监控项

    单位

    说明

    实例运行状态

    实例运行状态包含:

    • 准备中

    • 创建中

    • 运行中

    • 备份恢复中

    • 变配中

    • 创建网络中

    • 删除网络中

    实例健康状态

    实例健康状态包含:

    • 健康实例接入节点状态计算节点组健康状态存储节点组健康状态均为健康状态,且实例探活成功,则实例健康状态为健康。

    • 不可用实例接入节点状态计算节点组健康状态存储节点组健康状态有一项是不可用状态,则实例健康状态为不可用。

    • 风险实例接入节点状态计算节点组健康状态存储节点组健康状态有一项是风险状态,则实例健康状态为风险。

    实例接入节点状态

    AnalyticDB MySQL接入层由多个实例接入节点组成,主要负责协议层接入、SQL解析和优化、实时写入Sharding、数据调度和查询调度。

    实例接入节点状态包含:

    • 健康:实例接入节点均可用。

    • 风险:存在大于等于50%的接入节点不可用。

    • 不可用:接入节点均不可用。

    计算节点组健康状态

    计算节点组即AnalyticDB MySQL的计算引擎,具备分布式MPP和DAG融合执行能力,结合智能优化器,可支持高并发和复杂SQL混合负载。同时借助云原生基础设施,计算节点实现了弹性调度,可根据业务需求做到分钟级甚至秒级扩展,实现了资源的有效利用。

    计算节点组健康状态包含:

    • 健康:计算节点均可用。

    • 风险:存在大于等于50%的计算节点不可用。

    • 不可用:计算节点均不可用。

    存储节点组健康状态

    存储节点组即AnalyticDB MySQL的存储引擎,基于Raft协议实现的分布式实时强一致高可用存储引擎,通过数据分片和Multi-Raft实现并行存储,利用分层存储实现冷热分离降低成本,通过行列存储和智能索引达到极高性能。

    存储节点组健康状态包含:

    • 健康:存储节点均可用。

    • 风险:存在大于等于50%的存储节点不可用。

    • 不可用:存储节点均不可用。

    CPU平均使用率

    %

    监控如下信息:

    • 存储CPU最大使用率

    • 接入层CPU最大使用率

    • 计算CPU最大使用率

    • 存储CPU平均使用率

    • 接入层CPU平均使用率

    • 计算CPU平均使用率

    集群连接数

    数值

    成功建立连接的数量。

    写入响应时间

    毫秒(ms)

    监控如下信息:

    • 最大写入响应时间

    • 平均写入响应时间

    查询响应时间

    毫秒(ms)

    监控如下信息:

    • 最大查询响应时间

    • 平均查询响应时间

    磁盘IO吞吐量

    MB

    监控如下信息:

    • 计算写吞吐

    • 存储写吞吐

    • 存储读吞吐

    • 计算读吞吐

    磁盘IOPS

    数值

    监控如下信息:

    • 计算写磁盘IOPS

    • 存储写磁盘IOPS

    • 存储读磁盘IOPS

    • 计算读磁盘IOPS

    读写节点磁盘IO使用率

    %

    监控磁盘的平均IO使用率。

    读写节点磁盘IO等待时间

    毫秒(ms)

    监控磁盘的平均IO等待时间。

    磁盘使用总量

    MB

    监控如下信息:

    • 计算磁盘使用总量

    • 存储磁盘使用总量

    冷数据使用量

    MB

    监控集群的冷数据使用量。

    热数据使用量

    MB

    监控集群的热数据使用量。

  • 集群监控项说明

    监控项

    单位

    说明

    实例接入节点状态

    AnalyticDB MySQL接入层由多个实例接入节点组成,主要负责协议层接入、SQL解析和优化、实时写入Sharding、数据调度和查询调度。

    实例接入节点状态包含:

    • 健康:实例接入节点均可用。

    • 风险:存在大于等于50%的接入节点不可用。

    • 不可用:接入节点均不可用。

    计算节点组健康状态

    计算节点组即AnalyticDB MySQL的计算引擎,具备分布式MPP和DAG融合执行能力,结合智能优化器,可支持高并发和复杂SQL混合负载。同时借助云原生基础设施,计算节点实现了弹性调度,可根据业务需求做到分钟级甚至秒级扩展,实现了资源的有效利用。

    计算节点组健康状态包含:

    • 健康:计算节点均可用。

    • 风险:存在大于等于50%的计算节点不可用。

    • 不可用:计算节点均不可用。

    存储节点组健康状态

    存储节点组即AnalyticDB MySQL的存储引擎,基于Raft协议实现的分布式实时强一致高可用存储引擎,通过数据分片和Multi-Raft实现并行存储,利用分层存储实现冷热分离降低成本,通过行列存储和智能索引达到极高性能。

    存储节点组健康状态包含:

    • 健康:存储节点均可用。

    • 风险:存在大于等于50%的存储节点不可用。

    • 不可用:存储节点均不可用。

    接入指标

    CPU使用率

    %

    监控如下信息:

    • 接入层CPU最大使用率

    • 接入层CPU平均使用率

    计算资源组指标

    CPU使用率

    %

    监控如下信息:

    • 计算CPU最大使用率

    • 计算CPU平均使用率

    存储指标

    CPU使用率

    %

    监控如下信息:

    • 存储CPU最大使用率

    • 存储CPU平均使用率

    磁盘使用总量

    MB

    监控存储磁盘总使用量。

    磁盘使用率

    %

    监控存储磁盘使用率。

常见问题

  • Q:为什么预留模式跨规格变配为弹性模式后,CPU平均使用率会增大?

    A:预留模式C32规格变配为弹性模式,单个节点会降低到8核,Build任务默认占用3核,此时会导致CPU平均使用率增大。CPU平均使用率增大但未影响业务时,您无需关注;若已影响业务的正常运行,请进行升配操作或提交工单联系技术支持。关于Build任务的详细信息,请参见BUILD

  • Q:为什么索引数据量(KB)主键索引数据量(KB)监控指标偏大?

    A:原因如下:

    • 创建索引、主键索引的列数量偏多。

    • 索引列中某些值长度较长,单个列的长度较长(例如:长字符串等)。

    • 某些索引列的值个数(The Number of Distinct Values)偏多,且值都不相同,导致索引压缩率低。例如:某索引列为A,值为A1、A2、A3、A4,所有值都不相同,数据很难被压缩,导致索引压缩率低。

    • 主键中某些值长度较长或多个列构成了复合主键。

  • Q:为什么在监控页面发现有较长时间的RT(响应时间)产生,但在诊断与优化页面查询不到对应的耗时SQL?

    A:查询的返回结果数据量大,导致结果集缓存耗时长,而诊断与优化页面的总耗时=排队耗时+执行计划耗时+执行耗时,不包括结果集缓存耗时。建议您在SQL审计页面查看对应的耗时SQL。

数仓版相关API

API

说明

DescribeDBClusterPerformance

查看目标AnalyticDB MySQL版集群的查询和写入监控信息。

DescribeDBClusterResourcePoolPerformance

查看目标AnalyticDB MySQL版集群的资源组监控信息。

DescribeDBClusterHealthStatus

查看目标AnalyticDB MySQL版集群的健康状态。

DescribeInclinedTables

查看目标AnalyticDB MySQL版集群的表统计信息。

  • 本页导读 (1)
文档反馈