查看监控信息

更新时间: 2023-10-31 10:53:17

您可以在控制台上查看数仓版(3.0)弹性模式集群版(新版)湖仓版(3.0)集群的监控信息,包括查询和写入、资源组和表信息统计的监控信息,方便您更直观地了解资源量与查询写入性能的关系、掌握资源组的使用情况,从而根据业务需求选择更合适的资源量。本文介绍如何查看各项监控信息。

注意事项

  • 仅支持查看最近2天的监控信息。

  • 仅3.1.6及以上版本的集群支持查看健康状态信息。

    说明
  • 当集群为数仓版(3.0)时,您需要注意:

    仅同时满足如下条件的AnalyticDB MySQL版集群才支持查看资源组监控信息:

    • 集群系列需为弹性模式集群版(新版)

    • 集群规格需为32核或以上。

    • 集群内核版本需为3.1.3.2或以上。

数仓版(3.0)查看监控信息

操作步骤

  1. 登录云原生数据仓库AnalyticDB MySQL控制台
  2. 在页面左上角,选择集群所在地域。
  3. 在左侧导航栏,单击集群列表
  4. 数仓版(3.0)页签中,单击目标集群ID
  5. 在左侧导航栏中,单击监控信息

  6. 监控信息页,您可以单击实例资源监控资源组监控表信息统计来查看对应监控信息。

监控项说明

  • 健康状态监控项说明

    重要

    当任一健康状态为风险或不可用时,请联系技术支持。

    监控项

    说明

    实例接入节点状态

    AnalyticDB MySQL接入层由多个实例接入节点组成,主要负责协议层接入、SQL解析和优化、实时写入Sharding、数据调度和查询调度。

    实例接入节点状态包含:

    • 健康:实例接入节点均可用。

    • 风险:存在大于等于50%的接入节点不可用。

    • 不可用:接入节点均不可用。

    计算节点组健康状态

    计算节点组即AnalyticDB MySQL的计算引擎,具备分布式MPP和DAG融合执行能力,结合智能优化器,可支持高并发和复杂SQL混合负载。同时借助云原生基础设施,计算节点实现了弹性调度,可根据业务需求做到分钟级甚至秒级扩展,实现了资源的有效利用。

    计算节点组健康状态包含:

    • 健康:计算节点均可用。

    • 风险:存在大于等于50%的计算节点不可用。

    • 不可用:计算节点均不可用。

    存储节点组健康状态

    存储节点组即AnalyticDB MySQL的存储引擎,基于Raft协议实现的分布式实时强一致高可用存储引擎,通过数据分片和Multi-Raft实现并行存储,利用分层存储实现冷热分离降低成本,通过行列存储和智能索引达到极高性能。

    存储节点组健康状态包含:

    • 健康:存储节点均可用。

    • 风险:存在大于等于50%的存储节点不可用。

    • 不可用:存储节点均不可用。

  • 实例资源监控监控项说明

    监控项

    单位

    说明

    CPU平均使用率

    %

    监控如下信息:

    • 读写节点CPU最大使用率

    • 读写节点CPU使用率

    • 计算节点CPU最大使用率

    • 计算节点CPU使用率

    说明

    预留模式C32规格变配为弹性模式后,CPU平均使用率会增大,详情请参见常见问题

    磁盘IO吞吐

    MB

    监控如下信息:

    • 读写节点磁盘读吞吐量

    • 读写节点磁盘写吞吐量

    • 计算节点磁盘读吞吐量

    • 计算节点磁盘写吞吐量

    磁盘IOPS

    数值

    监控如下信息:

    • 读写节点磁盘平均读次数

    • 读写节点磁盘平均写次数

    • 计算节点磁盘平均读次数

    • 计算节点磁盘平均写次数

    磁盘IO使用率

    %

    监控读写节点磁盘IO使用率。

    磁盘IO等待时间

    毫秒(ms)

    监控读写节点磁盘IO等待时间。

    集群连接数

    数值

    成功建立连接的数量。

    磁盘使用量

    MB

    监控集群的最大磁盘使用量。

    热数据使用量

    MB

    监控集群的热数据使用量。

    冷数据使用量

    MB

    监控集群的冷数据使用量。

    查询

    查询QPS

    数值

    监控查询QPS。

    查询响应时间

    毫秒(ms)

    监控如下信息:

    • 平均查询响应时间

    • 最大查询响应时间

    查询等待时间

    毫秒(ms)

    监控如下信息:

    • 查询平均等待时长

    • 查询最大等待时长

    写入

    写入响应时间

    毫秒(ms)

    监控如下信息:

    • 平均写入响应时间

    • 最大写入响应时间

    删除响应时间

    毫秒(ms)

    监控如下信息:

    • 平均删除响应时间

    • 最大删除响应时间

    更新响应时间

    毫秒(ms)

    监控如下信息:

    • 平均更新响应时间

    • 最大更新响应时间

    写入吞吐量

    MB

    监控集群的平均写入吞吐量。

    TPS

    数值

    监控如下信息:

    • TPS(即所有写入TPS、删除TPS和更新TPS三者的总和)。

    • 写入TPS。

    • 删除TPS。

    • 更新TPS。

  • 资源组监控监控项说明

    监控项

    单位

    说明

    CPU平均使用率

    %

    监控每个资源组的CPU平均使用率。

    查询响应时间

    毫秒(ms)

    监控每个资源组下查询的平均响应时间。

    查询QPS

    数值

    监控每个资源组的查询QPS。

    查询等待时间

    毫秒(ms)

    监控每个资源组下查询的平均等待总耗时。

    资源组分时弹性实际弹出节点数

    数值

    监控每个资源组分时弹性计划中实际生效的节点数(即执行扩容计划时实际增加的节点数)。

    资源组分时弹性计划弹出节点数

    数值

    监控每个资源组分时弹性计划中需要增加的节点数。

    如何新增资源组弹性计划,请参见创建资源弹性计划

    资源组总节点数

    数值

    监控资源组拥有的总节点数,总节点数=基础节点数+实际生效的分时弹性节点数。

    资源组基础节点数

    数值

    监控资源组中的基础节点数。

  • 表信息统计监控项说明

    您可以查看该集群中所有表的信息,包含数据库表名表行数表数据量索引数据量主键索引数据量分区数

湖仓版(3.0)查看监控信息

操作步骤

  1. 登录云原生数据仓库AnalyticDB MySQL控制台
  2. 在页面左上角,选择集群所在地域。
  3. 在左侧导航栏,单击集群列表
  4. 湖仓版(3.0)页签中,单击目标集群ID。
  5. 在左侧导航栏中,单击集群管理 > 监控信息

  6. 数据库监控页面,您可以选择查询时间后单击右上角查询

    说明
    • 默认展示最近1小时的监控信息。

    • 仅支持查看最近2天的监控信息。

监控项说明

湖仓版(3.0)集群的监控分为实例监控和集群监控。

  • 实例监控项说明

    重要

    当任一健康状态为风险或不可用时,请联系技术支持。

    监控项

    单位

    说明

    实例运行状态

    实例运行状态包含:

    • 准备中

    • 创建中

    • 运行中

    • 备份恢复中

    • 变配中

    • 创建网络中

    • 删除网络中

    实例健康状态

    实例健康状态包含:

    • 健康实例接入节点状态计算节点组健康状态存储节点组健康状态均为健康状态,且实例探活成功,则实例健康状态为健康。

    • 不可用实例接入节点状态计算节点组健康状态存储节点组健康状态有一项是不可用状态,则实例健康状态为不可用。

    • 风险实例接入节点状态计算节点组健康状态存储节点组健康状态有一项是风险状态,则实例健康状态为风险。

    实例接入节点状态

    AnalyticDB MySQL接入层由多个实例接入节点组成,主要负责协议层接入、SQL解析和优化、实时写入Sharding、数据调度和查询调度。

    实例接入节点状态包含:

    • 健康:实例接入节点均可用。

    • 风险:存在大于等于50%的接入节点不可用。

    • 不可用:接入节点均不可用。

    计算节点组健康状态

    计算节点组即AnalyticDB MySQL的计算引擎,具备分布式MPP和DAG融合执行能力,结合智能优化器,可支持高并发和复杂SQL混合负载。同时借助云原生基础设施,计算节点实现了弹性调度,可根据业务需求做到分钟级甚至秒级扩展,实现了资源的有效利用。

    计算节点组健康状态包含:

    • 健康:计算节点均可用。

    • 风险:存在大于等于50%的计算节点不可用。

    • 不可用:计算节点均不可用。

    存储节点组健康状态

    存储节点组即AnalyticDB MySQL的存储引擎,基于Raft协议实现的分布式实时强一致高可用存储引擎,通过数据分片和Multi-Raft实现并行存储,利用分层存储实现冷热分离降低成本,通过行列存储和智能索引达到极高性能。

    存储节点组健康状态包含:

    • 健康:存储节点均可用。

    • 风险:存在大于等于50%的存储节点不可用。

    • 不可用:存储节点均不可用。

    CPU平均使用率

    %

    监控如下信息:

    • 存储CPU最大使用率

    • 接入层CPU最大使用率

    • 计算CPU最大使用率

    • 存储CPU平均使用率

    • 接入层CPU平均使用率

    • 计算CPU平均使用率

    集群连接数

    数值

    成功建立连接的数量。

    写入响应时间

    毫秒(ms)

    监控如下信息:

    • 最大写入响应时间

    • 平均写入响应时间

    查询响应时间

    毫秒(ms)

    监控如下信息:

    • 最大查询响应时间

    • 平均查询响应时间

    磁盘IO吞吐量

    MB

    监控如下信息:

    • 计算写吞吐

    • 存储写吞吐

    • 存储读吞吐

    • 计算读吞吐

    磁盘IOPS

    数值

    监控如下信息:

    • 计算写磁盘IOPS

    • 存储写磁盘IOPS

    • 存储读磁盘IOPS

    • 计算读磁盘IOPS

    读写节点磁盘IO使用率

    %

    监控磁盘的平均IO使用率。

    读写节点磁盘IO等待时间

    毫秒(ms)

    监控磁盘的平均IO等待时间。

    磁盘使用总量

    MB

    监控如下信息:

    • 计算磁盘使用总量

    • 存储磁盘使用总量

    冷数据使用量

    MB

    监控集群的冷数据使用量。

    热数据使用量

    MB

    监控集群的热数据使用量。

  • 集群监控项说明

    监控项

    单位

    说明

    实例接入节点状态

    AnalyticDB MySQL接入层由多个实例接入节点组成,主要负责协议层接入、SQL解析和优化、实时写入Sharding、数据调度和查询调度。

    实例接入节点状态包含:

    • 健康:实例接入节点均可用。

    • 风险:存在大于等于50%的接入节点不可用。

    • 不可用:接入节点均不可用。

    计算节点组健康状态

    计算节点组即AnalyticDB MySQL的计算引擎,具备分布式MPP和DAG融合执行能力,结合智能优化器,可支持高并发和复杂SQL混合负载。同时借助云原生基础设施,计算节点实现了弹性调度,可根据业务需求做到分钟级甚至秒级扩展,实现了资源的有效利用。

    计算节点组健康状态包含:

    • 健康:计算节点均可用。

    • 风险:存在大于等于50%的计算节点不可用。

    • 不可用:计算节点均不可用。

    存储节点组健康状态

    存储节点组即AnalyticDB MySQL的存储引擎,基于Raft协议实现的分布式实时强一致高可用存储引擎,通过数据分片和Multi-Raft实现并行存储,利用分层存储实现冷热分离降低成本,通过行列存储和智能索引达到极高性能。

    存储节点组健康状态包含:

    • 健康:存储节点均可用。

    • 风险:存在大于等于50%的存储节点不可用。

    • 不可用:存储节点均不可用。

    接入指标

    CPU使用率

    %

    监控如下信息:

    • 接入层CPU最大使用率

    • 接入层CPU平均使用率

    计算资源组指标

    CPU使用率

    %

    监控如下信息:

    • 计算CPU最大使用率

    • 计算CPU平均使用率

    存储指标

    CPU使用率

    %

    监控如下信息:

    • 存储CPU最大使用率

    • 存储CPU平均使用率

    磁盘使用总量

    MB

    监控存储磁盘总使用量。

    磁盘使用率

    %

    监控存储磁盘使用率。

常见问题

Q:为什么预留模式跨规格变配为弹性模式后,CPU平均使用率会增大?

A:预留模式C32规格变配为弹性模式,单个节点会降低到8核,Build任务默认占用3核,此时会导致CPU平均使用率增大。CPU平均使用率增大但未影响业务时,您无需关注;若已影响业务的正常运行,请进行升配操作或提交工单联系技术支持。关于Build任务的详细信息,请参见BUILD

数仓版相关API

API

说明

DescribeDBClusterPerformance

查看目标AnalyticDB MySQL版集群的查询和写入监控信息。

DescribeDBClusterResourcePoolPerformance

查看目标AnalyticDB MySQL版集群的资源组监控信息。

DescribeDBClusterHealthStatus

看目标AnalyticDB MySQL版集群的健康状态。

阿里云首页 云原生数据仓库AnalyticDB MySQL版 相关技术圈