MSFE是多活流量统一入口,采用多台ECS集群化部署。您可以使用云监控对每台ECS开启主机监控和报警,以便出现主机性能瓶颈或者系统故障问题时能够快速发现和处理,进而规避风险。本文介绍如何使用云监控对MSFE进行监控和报警。
背景信息
云监控针对主机监控和报警,以及应用分组、可用性监控、Dashboard等基础功能均不收费。想要了解更多云监控信息,请参见什么是云监控。
开启主机监控
配置报警规则
ECS类型的指标是从物理机层面采集的,数据准确性低于Agent从VM内部采集的数据,因此推荐您查看Agent采集的指标配置报警规则。推荐配置报警规则的监控项名称如下,具体详情请参见操作系统监控项。
监控内容 | 推荐配置报警规则的监控项名称 | 说明 |
---|---|---|
CPU使用率 | (Agent)cpu.total | 一台ECS只运行一个Tengine进程服务,Tengine对资源的消耗主要体现在CPU使用率上,通常情况下,若CPU使用率达到60%,就需要考虑扩容。 |
Load | (Agent)load.5m.percore | CPU平均每核过去5分钟的系统平均负载。 |
内存使用率 | (Agent)memory.used.utilization | - |
磁盘使用率 | (Agent)disk.usage.utilization_device | Tengine进程会打印tengine-access_log和tengine-error_log日志。 日志采用滚动覆盖的方式,滚动覆盖保留的文件数为7,全部日志文件最大会占用21 G磁盘空间。建议添加磁盘使用率报警规则,避免出现磁盘满的问题。 |