阿里云数据库提供物理层、网络层、应用层等多方位的监控服务,保证业务可用性。

Service

Service模块负责服务级别的状态跟踪,监控RDS依赖的其他云产品(如负载均衡、OSS、归档存储和日志服务等)是否正常,包括功能和响应时间等。同时,Service模块也会通过日志来判断RDS内部模块是否正常运作。

Network

Network模块负责网络层面的状态跟踪,包括ECS与RDS之间的连通性监控,RDS物理机之间的连通性监控,路由器和交换机的丢包率监控。

OS

OS模块负责硬件和OS内核层面的状态跟踪,包括:

  • 硬件检修:不断检测CPU、内存、主板、存储等设备的工作状态,预判是否会发生故障,并提前进行自动报修。

  • OS内核监控:跟踪数据库的所有调用,并从内核态分析调用缓慢或者出错的原因。

Instance

Instance模块负责RDS实例级别的信息采集,包括:

  • 实例的可用信息

  • 实例的容量和性能指标

  • 实例的SQL执行记录