MSFE是多活流量统一入口,采用多台ECS集群化部署。您可以使用云监控对每台ECS开启主机监控和报警,以便出现主机性能瓶颈或者系统故障问题时能够快速发现和处理,进而规避风险。本文介绍如何使用云监控对MSFE进行监控和报警。

背景信息

云监控针对主机监控和报警,以及应用分组、可用性监控、Dashboard等基础功能均不收费。想要了解更多云监控信息,请参见什么是云监控

开启主机监控

  1. 登录云监控控制台
  2. 在左侧导航栏,单击主机监控
  3. 主机监控页面,通过在搜索框中输入主机名称或者实例ID等搜索需要开启监控的ECS,然后选中目标ECS实例前面的复选框,并单击左上角的安装/更新Agent,在弹出的面板根据界面提示完成配置,来安装云监控插件,实现对每台ECS开启主机监控和报警。
  4. 单击操作列的监控图表,可查看ECS实例的CPU、内存、负载、网络、连接、磁盘、IO、进程等监控指标详情。具体监控项详情请参见监控项说明

配置报警规则

ECS类型的指标是从物理机层面采集的,数据准确性低于Agent从VM内部采集的数据,因此推荐您查看Agent采集的指标配置报警规则。推荐配置报警规则的监控项名称如下,具体详情请参见操作系统监控项

监控内容推荐配置报警规则的监控项名称说明
CPU使用率(Agent)cpu.total一台ECS只运行一个Tengine进程服务,Tengine对资源的消耗主要体现在CPU使用率上,通常情况下,若CPU使用率达到60%,就需要考虑扩容。
Load(Agent)load.5m.percoreCPU平均每核过去5分钟的系统平均负载。
内存使用率(Agent)memory.used.utilization-
磁盘使用率(Agent)disk.usage.utilization_device

Tengine进程会打印tengine-access_log和tengine-error_log日志。

日志采用滚动覆盖的方式,滚动覆盖保留的文件数为7,全部日志文件最大会占用21 G磁盘空间。建议添加磁盘使用率报警规则,避免出现磁盘满的问题。