云数据库RDS提供物理层、网络层、应用层等多方位的监控服务,保证业务可用性。
Service
Service模块负责服务级别的状态跟踪,监控RDS依赖的其他云产品(如负载均衡、OSS、归档存储和日志服务等)是否正常,包括功能和响应时间等。同时,Service模块也会通过日志来判断RDS内部模块是否正常运作。
Network
Network模块负责网络层面的状态跟踪,包括ECS与RDS之间的连通性监控,RDS物理机之间的连通性监控,路由器和交换机的丢包率监控。
OS
OS模块负责硬件和OS内核层面的状态跟踪,包括:
-
硬件检修:不断检测CPU、内存、主板、存储等设备的工作状态,预判是否会发生故障,并提前进行自动报修。
-
OS内核监控:跟踪数据库的所有调用,并从内核态分析调用缓慢或者出错的原因。
Instance
Instance模块负责RDS实例级别的信息采集,包括:
-
实例的可用信息
-
实例的容量和性能指标
-
实例的SQL执行记录