文档

自治中心

更新时间:

本文介绍了如何访问集群的自治中心,以及性能监控、诊断报告、异常事件的基本介绍。

查看自治中心

  1. 登录 OceanBase 管理控制台

  2. 在左侧导航栏中,单击 自治服务

  3. 实例详情 区域,单击需要查看的集群实例名称。

  4. 进入自治中心页面后,查看以下信息。

    1. 一键诊断:在一键诊断页签中,默认展示近 1 小时所有租户的性能监控信息和诊断报告,诊断报告包括异常事件、实时诊断、优化中心、容量中心、安全中心的诊断结果。

    2. 异常事件:在异常事件页签中,默认展示近 1 小时所有租户的性能监控信息,以及近 3 天异常事件,包括 CPU 异常。

性能监控

性能监控提供了 QPS查询响应时间CPU 使用率 的监控数据。

image.png

  • 默认展示近 1 小时的数据。单击 近 1 小时 下拉框,也可以选择 近 5 分钟近半小时近 6 小时自定义时间 进行查看。

  • 将鼠标置于问号图标 image.png,可查看图表的监控指标及说明。

    image.png

  • 通过单击图表中的租户名称,可筛选查看不同租户的监控数据。例如下表中,隐藏了 forMySQLTenant 租户的监控数据。

    image.png

  • 通过单击图表中的下钻图标 image.png,可进一步查看细分的监控指标数据。

    image.png

  • 将鼠标置于图表指定时间处,可查看该一分钟内的监控数据。

    image.png

  • 在图表中按住左键进行拖动,选择时间范围,单击弹框中的 诊断,可以对该时间段进行诊断。

    说明

    此功能仅在一键诊断页签下可用。

    image.png

    在下方诊断报告区域中查看诊断结果。

一键诊断

一键诊断页签中,性能监控的相关说明,请参见 性能监控

在诊断报告中,默认展示了近 1 小时 异常事件实时诊断优化中心容量中心安全中心 的诊断结果。

image.png

  • 单击诊断报告右侧的 发起诊断 按钮,在发起诊断弹窗中,选择需要查询的时间,单击 确认。可查看指定时间段的诊断结果。

    image.png

  • 异常事件:展示诊断时间段内发生的异常事件,包括 CPU 异常。

    image.png

    • 可查看异常事件的 对象异常名称异常表现当前状态发生时间恢复时间持续时间操作

    • 单击单个事件的 根因分析,可展开查看该事件的根因分析和优化建议。示例如下:

      当发现异常时间段存在 CPU 占比超过 15% 的 SQL 时,根因分析给出 部分SQL占比过高 的提示,当发现异常时间段内超过 20% 时间在合并时,根因分析会提示 异常期间内,集群发生过合并

      image.png

  • 实时诊断:展示诊断时间段内发生的 可疑 SQL 数SlowSQL 数实时会话数实时活跃会话数实时行锁数量

    说明
    1. 实时行锁数量查询是实时功能,仅展示查询时,等锁时间超过 50 ms 的行锁和相关会话信息。

    2. 该功能仅支持 OceanBase V4.2.0 及之后的版本。

    image.png

    • 单击 查看更多,可跳转到实时诊断中的 SQL 诊断页,详情请参见 SQL 诊断概述

    • 异常 SQL 数趋势图中可查看指定时间段内异常 SQL 的数量。单击图表中的 slowSqlanomalSql 可进行筛选查看。

    • SlowSQL 页签下,可查看指定时间段内发生 SlowSQL 的具体信息,包含 SQL 文本数据库租户名SQL ID总执行次数总数据库耗时数据库耗时 等。

      单击 SQL 文本,可跳转到 SQL 诊断详情页进行查看,详细说明请参见 查看 SQL 详情。单击 查看样本,可直接查看该 SQL 语句。

    • 可疑 SQL 页签下,可查看指定时段内发生可疑 SQL 的具体信息,包含 SQL 文本数据库租户名SQL ID总执行次数总数据库耗时数据库耗时CPU 时间计划生成时间

      单击 SQL 文本,可跳转到 SQL 诊断详情页进行查看,详细说明请参见 查看 SQL 详情

  • 优化中心:展示 SQL 类优化和结构类优化的诊断结果。

    image.png

    • 单击 查看更多,将跳转到优化中心页面,详细说明请参见 优化建议

    • SQL 类和结构类的页签中,可查看可优化内容的详细信息,包含 优化类型租户数据库优化对象诊断理由优化建议

  • 容量中心:展示指定时段内 CPU、磁盘的使用情况和风险提醒。

    image.png

    • 单击 查看更多,将跳转到容量中心页面,详细说明请参见 容量中心

    • 可查看风险提醒的详细信息,包含 对象(租户)、风险名称风险等级风险内容

      image.png

  • 安全中心:展示集群和租户的安全检查结果。

    image.png

    • 单击 查看更多,将跳转到容量中心页面,详细说明请参见 安全中心

    • 可查看集群检测项的检查结果和租户检测项的检查结果。

异常事件

异常事件页签中,性能监控的相关说明,请参见 性能监控

在异常事件中默认展示近3天异常事件清单,统计了全部异常事件数、异常事件数、已恢复异常事件数。

image.png

单击事件的 根因分析,可展开查看该事件的根因分析和优化建议。

目前只支持 CPU 异常的根因分析:

  • 对于持续时长超过 1 小时的异常事件,根因分析会自动选取异常时间段开始的 1 小时作为分析时间区间。

  • 对于主机 CPU 异常根因分析,CPU 占比超过 15% 的 SQL 会展示在结果中,同时还会进一步分析 SQL 是否存在执行计划变动且性能下降、性能下降、热点行锁、走索引且性价较差等问题。

image.png

  • 本页导读 (0)
文档反馈