云监控集成

本文介绍如何在云监控控制台上查看文件网关及块网关的监控信息。

前提条件

已创建云存储网关,请参见在云控制台上使用文件网关

背景信息

说明

1.3.0版本开始云上的云存储网关支持云监控控制台的集成监控功能。

  • 文件网关监控信息包括:网关CPU用户态空间使用率、每个共享的缓存使用率、网关内存使用率、每个共享的元数据使用率、每个共享的前端读写速度、每个共享的上传队列长度(仅在1.9.2及以上版本启用)、每个共享的throttling状态、每个共享的数据上云速度、NFS客户端使用连接数百分比。

    重要

    每个共享的元数据使用率每个共享的上传队列长度每个共享的throttling状态这三种指标需要您重点关注。建议您创建报警规则来监控这三种指标,具体操作请参见创建报警规则

    • 每个共享的元数据使用率:建议根据缓存盘大小来配置报警规则。

      • 当缓存盘小于等于100 GB时,建议报警规则配置为文件网关的每个共享的元数据使用率>80%。

      • 当缓存盘大于等于500 GB时,建议报警规则配置为文件网关的每个共享的元数据使用率>90%。

      其他相关信息,请参见元数据空间不足

    • 每个共享的上传队列长度:建议报警规则配置为上传队列>10000。其他相关信息,请参见上传队列堆积

    • 每个共享的throttling状态:建议报警规则配置为文件网关的每个共享的throtting状态=1。其他相关信息,请参见限流

  • 块网关监控信息包括:网关CPU用户态空间使用率、网关内存使用率、每个卷的缓存使用率。

查看监控信息

  1. 登录云监控控制台

  2. 选择选择可视化(Dashboard) > 云产品大盘

  3. 云产品大盘页面,选择云存储网关及对应的地域和网关ID,查看监控图表。

image

创建报警规则

  1. 云产品监控大盘页面单击创建报警规则

  2. 创建报警规则页面完成如下配置后单击确定

    参数

    说明

    产品

    选择云存储网关

    资源范围

    • 全部资源:选择监控全部资源。

    • 应用分组:选择需要监控的应用分组。

    • 实例:选择需要监控的云存储网关实例资源范围。

    关联资源

    选择需要监控的云存储网关实例。

    规则描述

    报警规则的描述信息。

    添加规则

    单击添加规则可以创建新的规则,具体操作,请参见添加规则

    通道沉默周期

    选择合适的通道沉默周期。

    生效时间

    请输入规则生效的时间段。

    报警联系人组

    请选择报警联系人组。

    标签

    请输入标签名称和标签值。

    报警回调

    请输入报警回调域名。

    说明

    http://开头,不能使用IP。

    表 1. 添加规则

    参数

    说明

    规则名称

    请输入报警规则名称。

    指标类型

    请选择指标类型,取值为:

    • 单指标:先选择监控指标,再为其设置阈值和报警级别。

    • 多指标:先选择报警级别,再为两个或两个以上的监控指标设置报警条件。

    • 智能阈值:关于智能阈值的更多信息,请参见概览创建智能阈值报警规则

    监控指标

    请选择需要监控的指标名称,取值为:

    • 网关CPU用户态空间使用率。

    • 网关内存使用率。

    • 文件网关的每个共享的缓存使用率。

    • 文件网关的每个共享的元数据使用率

    • 文件网关NFS客户端使用连接数百分比。

    • 文件网关的每个共享的前端读写速度。

    • 文件网关的每个共享的throtting状态

    • 上传队列

    • 文件网关的每个共享的数据上云速度。

    • 块网关的每个卷的缓存使用率。

    请选择维度

    请选择需要监控的共享维度,如不选择,则监控所有共享。

    比较

    监控值和阈值比较,在特定条件下触发报警,取值为:

    • >=:大于等于阈值时触发报警。

    • >:大于阈值时触发报警。

    • <=:小于等于阈值时触发报警。

    • <:小于阈值时触发报警。

    • =:等于阈值时触发报警。

    • !=:不等于阈值时触发报警。

    • 同比昨天同时间上涨时触发报警。

    • 同比昨天同时间下降时触发报警。

    • 同比上周同时间上涨时触发报警。

    • 同比上周同时间下降时触发报警。

    • 环比上周期上涨时触发报警。

    • 环比上周期下降时触发报警。

    阈值及报警级别

    请配置阈值及报警级别。

创建示例

下面以创建一个元数据空间使用率大于等于90%的报警为例,介绍如何创建报警规则。

  1. 云产品监控大盘页面单击创建报警规则

  2. 产品选择云存储网关

  3. 资源范围选择实例

  4. 关联资源选择需要监控的网关实例。

  5. 单击添加规则进入添加规则描述页面。

  6. 添加规则描述页面输入规则名称,指标类型选择单指标,监控指标选择文件网关的每个共享的元数据使用率,监控维度里选择需要监控的共享,报警级别选择紧急Critical,阈值输入90后单击确定返回创建报警规则页面。添加规则描述

  7. 创建报警规则页面选择报警联系人组后单击确认

创建报警规则

相关操作

应用场景不同,您可以选择不同的时间粒度,也可以进行自定义时间粒度。

配置项

说明

监控时间粒度

可选项:1小时、3小时、6小时、12小时、1天、3天、7天、14天。

自定义时间粒度

30天内的查询提供分钟粒度的数据,最多连续查询7天数据。