文档

自治中心

更新时间:

本文介绍了如何访问集群的自治中心,以及性能监控、诊断报告、异常事件的基本介绍。

查看自治中心

  1. 登录 OceanBase 管理控制台

  2. 在左侧导航栏中,单击 自治服务

  3. 实例详情 区域,单击需要查看的集群实例名称。

  4. 进入自治中心页面后,查看以下信息。

    1. 一键诊断:在 一键诊断 页签中,默认展示近 1 小时所有租户的性能监控信息和诊断报告,诊断报告包括异常事件、实时诊断、优化中心、容量中心、安全中心的诊断结果。

    2. 异常事件:在 异常事件 页签中,默认展示近 3 天所有租户的性能监控信息,以及近 3 天异常事件,包括节点 CPU 异常、租户 CPU 异常、租户 SQL 队列等待时间异常。

性能监控

性能监控提供了 QPS查询响应时间CPU 使用率 的监控数据。

image.png

  • 默认展示近 1 小时的数据。单击 近 1 小时 下拉框,也可以选择 近 5 分钟近半小时近 6 小时自定义时间 进行查看。

  • 将鼠标置于问号图标 image.png,可查看图表的监控指标及说明。

    image.png

  • 通过单击图表中的租户名称,可筛选查看不同租户的监控数据。例如下表中,隐藏了 forMySQLTenant 租户的监控数据。

    image.png

  • 通过单击图表中的下钻图标 image.png,可进一步查看细分的监控指标数据。

    image.png

  • 将鼠标置于图表指定时间处,可查看该一分钟内的监控数据。

    image.png

  • 在图表中按住左键进行拖动,选择时间范围,单击弹框中的 诊断,可以对该时间段进行诊断。

    说明

    此功能仅在 一键诊断 页签下可用。

    image.png

    在下方诊断报告区域中查看诊断结果。

一键诊断

一键诊断 页签中,性能监控的相关说明,请参见 性能监控

在诊断报告中,默认展示了近 1 小时 异常事件实时诊断优化中心容量中心安全中心 的诊断结果。

image

  • 单击诊断报告右侧的 发起诊断 按钮,在发起诊断弹窗中,选择需要查询的时间,单击 确定。可查看指定时间段的诊断结果。

    image

  • 异常事件:展示诊断时间段内发生的异常事件,包括节点 CPU 异常、租户 CPU 异常、租户 SQL 队列等待时间异常。

    image

    • 可查看异常事件的 对象异常类型异常表现当前状态发生时间恢复时间持续时间操作

    • 单击单个事件的 根因分析,可展开查看该事件的根因分析和优化建议。

      • 如果异常事件的原因在分析图谱中,该原因会被高亮显示,并提供优化建议。示例如下:

        当发现异常时间段租户队列等待变长时,系统提供 CPU 占比过高 的提示。在可疑原因 区域,您可以单击红色高亮方框查看对应的根因分析。

        image

        可能的根因 SQL 区域,您可以查看可能引起该问题的 SQL,并单击操作列的 查看优化建议

        image

      • 如果异常事件的原因不在分析图谱中,系统会在解决方案部分给出提示。示例如下:

        当发现租户CPU异常时,系统仍会显示分析图谱,并在解决方案部分给出提示。

        image

  • 实时诊断:展示诊断时间段内发生的 可疑 SQL 数SlowSQL 数实时会话数实时活跃会话数

    image

    • 单击 查看更多,可跳转到实时诊断中的 SQL 诊断页,详情请参见 SQL 诊断概述

    • 异常 SQL 数趋势图中可查看指定时间段内异常 SQL 的数量。单击图表中的 slowSqlanomalSql 可进行筛选查看。

    • SlowSQL 页签下,可查看指定时间段内发生 SlowSQL 的具体信息,包含 SQL 文本数据库租户名SQL ID总执行次数总数据库耗时数据库耗时 等。

      单击 SQL 文本,可跳转到 SQL 诊断详情页进行查看,详细说明请参见 查看 SQL 详情。单击 查看样本,可直接查看该 SQL 语句。

    • 可疑 SQL 页签下,可查看指定时段内发生可疑 SQL 的具体信息,包含 SQL 文本数据库租户名SQL ID总执行次数总数据库耗时数据库耗时CPU 时间计划生成时间

      单击 SQL 文本,可跳转到 SQL 诊断详情页进行查看,详细说明请参见 查看 SQL 详情

  • 优化中心:展示 SQL 类优化和结构类优化的诊断结果。

    image.png

    • 单击 查看更多,将跳转到优化中心页面,详细说明请参见 查看优化建议

    • SQL 类和结构类的页签中,可查看可优化内容的详细信息,包含 优化类型租户数据库优化对象诊断理由优化建议

  • 容量中心:展示指定时段内 CPU、磁盘的使用情况和风险提醒。

    image.png

    • 单击 查看更多,将跳转到容量中心页面,详细说明请参见 容量中心

    • 可查看风险提醒的详细信息,包含 对象(租户)、风险名称风险等级风险内容

      image.png

  • 安全中心:展示集群和租户的安全检查结果。

    image.png

    • 单击 查看更多,将跳转到容量中心页面,详细说明请参见 安全中心

    • 可查看集群检测项的检查结果和租户检测项的检查结果。

异常事件

说明

异常事件 页签中关于性能监控的相关说明,请参见 性能监控

异常事件 页签默认展示近 3 天的全部异常事件,包括:异常中的事件和已恢复的事件。

image

  • 可查看异常事件的 对象异常类型异常表现当前状态发生时间恢复时间持续时间操作

  • 单击单个事件的 根因分析,可展开查看该事件的根因分析和优化建议。

    • 如果异常事件的原因在分析图谱中,该原因会被高亮显示,并提供优化建议。示例如下:

      当发现异常时间段租户队列等待变长时,系统提供 CPU 占比过高 的提示。在可疑原因 区域,您可以单击红色高亮方框查看对应的根因分析。

      image

      可能的根因 SQL 区域,您可以查看可能引起该问题的 SQL,并单击操作列的 查看优化建议

      image

    • 如果异常事件的原因不在分析图谱中,系统会在解决方案部分给出提示。示例如下:

      当发现租户CPU异常时,系统仍会显示分析图谱,并在解决方案部分给出提示。

      image