本文介绍了如何访问集群的自治中心,以及性能监控、诊断报告、异常事件的基本介绍。
查看自治中心
登录 OceanBase 管理控制台。
在左侧导航栏中,单击 自治服务。
在 实例详情 区域,单击需要查看的集群实例名称。
进入自治中心页面后,查看以下信息。
性能监控
性能监控提供了 QPS、查询响应时间、CPU 使用率 的监控数据。
默认展示近 1 小时的数据。单击 近 1 小时 下拉框,也可以选择 近 5 分钟、近半小时、近 6 小时 和 自定义时间 进行查看。
将鼠标置于问号图标 ,可查看图表的监控指标及说明。
通过单击图表中的租户名称,可筛选查看不同租户的监控数据。例如下表中,隐藏了 forMySQLTenant 租户的监控数据。
通过单击图表中的下钻图标 ,可进一步查看细分的监控指标数据。
将鼠标置于图表指定时间处,可查看该一分钟内的监控数据。
在图表中按住左键进行拖动,选择时间范围,单击弹框中的 诊断,可以对该时间段进行诊断。
说明此功能仅在一键诊断页签下可用。
在下方诊断报告区域中查看诊断结果。
一键诊断
一键诊断页签中,性能监控的相关说明,请参见 性能监控。
在诊断报告中,默认展示了近 1 小时 异常事件、实时诊断、优化中心、容量中心、安全中心 的诊断结果。
单击诊断报告右侧的 发起诊断 按钮,在发起诊断弹窗中,选择需要查询的时间,单击 确定。可查看指定时间段的诊断结果。
异常事件:展示诊断时间段内发生的异常事件,包括 CPU 异常。
可查看异常事件的 对象、异常名称、异常表现、当前状态、发生时间、恢复时间、持续时间、操作。
单击单个事件的 根因分析,可展开查看该事件的根因分析和优化建议。示例如下:
当发现异常时间段存在 CPU 占比超过 15% 的 SQL 时,根因分析给出 部分 SQL CPU 占比过高 的提示。
实时诊断:展示诊断时间段内发生的 可疑 SQL 数、SlowSQL 数、实时会话数、实时活跃会话数 和 实时行锁数量。
说明实时行锁数量查询是实时功能,仅展示查询时,等锁时间超过 50 ms 的行锁和相关会话信息。
该功能仅支持 OceanBase V4.2.0 及之后的版本。
单击 查看更多,可跳转到实时诊断中的 SQL 诊断页,详情请参见 SQL 诊断概述。
异常 SQL 数趋势图中可查看指定时间段内异常 SQL 的数量。单击图表中的 slowSql、anomalSql 可进行筛选查看。
SlowSQL 页签下,可查看指定时间段内发生 SlowSQL 的具体信息,包含 SQL 文本、数据库、租户名、SQL ID、总执行次数、总数据库耗时、数据库耗时 等。
单击 SQL 文本,可跳转到 SQL 诊断详情页进行查看,详细说明请参见 查看 SQL 详情。单击 查看样本,可直接查看该 SQL 语句。
可疑 SQL 页签下,可查看指定时段内发生可疑 SQL 的具体信息,包含 SQL 文本、数据库、租户名、SQL ID、总执行次数、总数据库耗时、数据库耗时、CPU 时间 和 计划生成时间。
单击 SQL 文本,可跳转到 SQL 诊断详情页进行查看,详细说明请参见 查看 SQL 详情。
优化中心:展示 SQL 类优化和结构类优化的诊断结果。
单击 查看更多,将跳转到优化中心页面,详细说明请参见 查看优化建议。
SQL 类和结构类的页签中,可查看可优化内容的详细信息,包含 优化类型、租户、数据库、优化对象、诊断理由、优化建议。
容量中心:展示指定时段内 CPU、磁盘的使用情况和风险提醒。
单击 查看更多,将跳转到容量中心页面,详细说明请参见 容量中心。
可查看风险提醒的详细信息,包含 对象(租户)、风险名称、风险等级、风险内容。
安全中心:展示集群和租户的安全检查结果。
单击 查看更多,将跳转到容量中心页面,详细说明请参见 安全中心。
可查看集群检测项的检查结果和租户检测项的检查结果。
异常事件
异常事件 页签中关于性能监控的相关说明,请参见 性能监控。
异常事件 页签默认展示近 3 天的全部异常事件,包括:异常中的事件和已恢复的事件。
单击事件 操作 列下的 根因分析,可展开查看该事件的根因分析和优化建议。如果是正在发生中的异常事件,根因分析会分析会话情况;如果活跃会话超过 50 个,会展示会话情况,您可以基于会话来进行根因分析。
目前只支持 CPU 异常的根因分析:
对于持续时长超过 1 小时的异常事件,根因分析会自动选取异常时间段开始的 1 小时作为分析时间区间。
对于主机 CPU 异常根因分析,CPU 占比超过 15% 的 SQL 会展示在结果中,同时还会进一步分析 SQL 是否存在性能下降、疑似锁冲突等问题。
- 本页导读 (0)