MSFE是多活流量统一入口,采用多台ECS集群化部署。您可以使用云监控对每台ECS开启主机监控和报警,以便出现主机性能瓶颈或者系统故障问题时能够快速发现和处理,进而规避风险。本文介绍如何使用云监控对MSFE进行监控和报警。

背景信息

云监控针对主机监控和报警,以及应用分组、可用性监控、Dashboard等基础功能均不收费。想要了解更多云监控信息,请参见什么是云监控

开启主机监控

  1. 登录云监控控制台
  2. 在左侧导航栏,单击主机监控
  3. 实例列表页面,通过在搜索框中输入主机名称或者实例ID等搜索需要开启监控的ECS,然后在插件状态(全部)列单击点击安装来安装云监控插件,对每台ECS开启主机监控和报警。
    er
  4. 单击操作列的监控图表,可查看ECS实例的CPU、内存、负载、网络、连接、磁盘、IO、进程等监控指标详情。具体监控项详情请参见监控项说明
    er

配置报警规则

ECS类型的指标是从物理机层面采集的,数据准确性低于Agent从VM内部采集的数据,因此推荐您查看Agent采集的指标配置报警规则。推荐配置报警规则的监控项名称如下,具体详情请参见操作系统监控项

监控内容 推荐配置报警规则的监控项名称 说明
CPU使用率 (Agent)cpu.total 一台ECS只运行一个Tengine进程服务,Tengine对资源的消耗主要体现在CPU使用率上,通常情况下,若CPU使用率达到60%,就需要考虑扩容。
Load (Agent)load.5m.percore CPU平均每核过去5分钟的系统平均负载。
内存使用率 (Agent)memory.used.utilization -
磁盘使用率 (Agent)disk.usage.utilization_device

Tengine进程会打印tengine-access_log和tengine-error_log日志。

日志采用滚动覆盖的方式,滚动覆盖保留的文件数为7,全部日志文件最大会占用21 G磁盘空间。建议添加磁盘使用率报警规则,避免出现磁盘满的问题。