本文介绍如何在阿里云云存储网关控制台查看文件网关的告警以及告警的处理方式。

查看告警

查看网关告警有两种方式,一种是查看当前地域下所有网关的告警,另外一种是查看单个网关的告警。

操作步骤

  1. 方式一:所有网关的告警。

    1. 进入云存储网关控制台告警页面。

    2. 在告警页面根据告警时间、网关ID、共享名称和告警状态查询指定的告警。

  2. 方式二:单个网关的告警。

    1. 进入云存储网关控制台网关列表页面,找到并单击目标文件网关,单击告警

    2. 在告警页面根据告警时间、共享名称和告警状态查询指定的告警。

参数

说明

告警类型

目前文件网关仅支持三种告警类型:

  • 元数据空间不足。

  • 限流。

  • 上传队列堆积。

告警级别

当前告警的级别。

网关ID

当前告警的网关ID。

说明

您可以单击网关ID查看对应网关的事件告警信息。

共享名称

当前告警的共享名称。

解决方案

您可以单击解决方案的链接查看对应告警的处理方式等。

告警时间

首次告警发生的时间。

恢复时间

恢复告警的时间,未恢复的告警显示为未恢复

告警的处理方式

元数据空间不足

告警原因

元数据空间指的是SMB或NFS共享所对应的缓存盘中用于存储元数据的空间,主要包括目录结构等信息,文件数目越多,使用的元数据空间也就越大。共享使用的缓存盘由数据空间和元数据空间组成,默认20%的缓存盘空间会用来存储元数据。当可用元数据空间不足3 GB或者不足所有元数据空间的20%时会触发此告警。

处理方式

建议扩展共享对应的缓存盘来扩大元数据空间,避免因元数据空间不足而导致无法写入,更多信息请参见扩展缓存

限流

告警原因

当同时写入缓存盘的数据总量大于缓存盘数据空间高水位时(80%)会触发此告警,最终可能导致写入失败。

处理方式

  1. 排查数据上传是否存在问题导致缓存空间无法释放,下面几种情况都可能导致数据无法及时上传。

  • OSS Bucket不存在。

  • OSS Bucket策略导致网关访问OSS Bucket受限。

  • OSS Bucket类型是归档存储类型或者冷归档存储类型。

  • 同时写入的文件大小超过可用缓存盘容量,无法及时关闭文件并上传。

  1. 您可以根据实际情况调整业务,下调同时写入缓存盘的数据总量。

  2. 您也可以扩展共享对应的缓存盘来扩大数据空间。更多信息,请参见扩展缓存

上传队列堆积

告警原因

触发此告警可能的原因有:

  • OSS Bucket不存在。

  • OSS Bucket策略导致网关访问OSS Bucket受限。

  • OSS Bucket类型是归档存储类型或者冷归档存储类型。

处理方式

请您根据以下步骤进行排查:

  1. 请检查当前使用的OSS Bucket是否存在。如果不存在,请使用已存在的OSS Bucket。

  2. 请检查当前使用的OSS Bucket是否配置了相关策略,导致网关无法访问该OSS Bucket。

  3. 请检查当前使用的OSS Bucket是否为归档存储类型或者冷归档存储类型。如果没有特殊需求,建议您使用标准存储类型的OSS Bucket。

如果您排查后仍然无法恢复告警,请提交工单进行处理。