文件存储CPFS监控概述

更新时间:

通过查看文件存储CPFS文件系统的容量监控和性能信息,您可以了解文件系统的存储容量使用情况和读写吞吐、读写IOPS等情况。通过为文件系统的重要监控指标设置报警规则,您可以及时获知指标异常并快速处理异常。本文介绍文件存储CPFS支持的监控项以及其报警规则配置。

背景信息

云监控(CloudMonitor)是一项针对阿里云资源和互联网应用进行监控的服务。云监控可用于监控各云服务资源的监控指标,并针对指定监控指标设置报警。使您全面了解阿里云上资源的使用情况和业务运行状况,并及时对故障资源进行处理,保证业务正常运行。更多信息,请参见什么是云监控

监控数据保留策略

监控数据保留90天,过期自动清除。起始时间为数据产生的时间。

监控项

文件存储CPFS通过云监控支持对文件系统实例容量进行数据监控,支持对文件系统的实例及CPFS文件系统NFS协议服务的性能进行监控。

容量监控

CPFS文件系统

说明
  • 仅CPFS 2.3.1及以上版本支持容量监控。您可以在NAS控制台的文件系统列表页面,单击目标CPFS文件系统名称,进入基本信息页面,查看文件系统的版本。

  • root Fileset是文件系统的根Fileset,文件系统中独立创建的Fileset以外的文件都属于根Fileset。

类型

指标

指标名称

单位

说明

文件系统

CPFS Capacity

总存储空间

字节

该文件系统在周期内的总存储空间。

CPFS Capacity Used

数据量

字节

该文件系统在周期内实际使用的数据量。

CPFS Inode Limit

最大文件数

该文件系统在周期内的可使用的最大文件数量。

CPFS Inode Alloc

已分配文件数

该文件系统在周期内已分配的文件数量。

CPFS Inode Used

已使用文件数

该文件系统在周期内已使用的文件数量。

Fileset

Fset Inode Used

Fileset已使用文件数

该Fileset在周期内的已使用的文件数量。

Fset Inode Alloc

Fileset已分配文件数

该Fileset在周期内已分配的文件数量。

CPFS智算版文件系统

类型

指标

指标名称

单位

说明

文件系统

CPFS Capacity

总存储空间

字节

该文件系统在周期内的总存储空间。

CPFS Capacity Used

数据量

字节

该文件系统在周期内实际使用的数据量。

CPFS Inode Limit

最大文件数

该文件系统在周期内的可使用的最大文件数量。

CPFS Inode Alloc

已分配文件数

该文件系统在周期内已分配的文件数量。

CPFS Inode Used

已使用文件数

该文件系统在周期内已使用的文件数量。

性能监控

CPFS文件系统

类型

指标

指标名称

单位

说明

文件系统

ThruputRead

读吞吐

字节/秒

该文件系统在周期内每秒平均读吞吐字节。

ThruputWrite

写吞吐

字节/秒

该文件系统在周期内每秒平均写吞吐字节。

IopsRead

读IOPS

次/秒

该文件系统在周期内每秒平均读IOPS次数。

IopsWrite

写IOPS

次/秒

该文件系统在周期内每秒平均写IOPS次数S。

LatencyRead

读延迟

ms

该文件系统在周期内每毫秒平均读延迟。

LatencyWrite

写延迟

ms

该文件系统在周期内每毫秒平均写延迟。

QpsMeta

元数据QPS

次/秒

该文件系统在周期内每秒平均请求元数据次数。例如:open、close、stat、create、chmod等。

NFS协议服务

NFS Read Throughput

NFS读吞吐

字节/秒

该NFS协议服务在周期内每秒平均读吞吐字节。

NFS Write Throughput

NFS写吞吐

字节/秒

该NFS协议服务在周期内每秒平均写吞吐字节。

NFS Read IOPS

NFS读IOPS

次/秒

该NFS协议服务在周期内每秒平均读IOPS次数。

NFS Write IOPS

NFS写IOPS

次/秒

该NFS协议服务在周期内每秒平均写IOPS次数。

CPFS智算版文件系统

类型

指标

指标名称

单位

说明

文件系统

ThruputRead

读吞吐

字节/秒

该文件系统在周期内每秒平均读吞吐字节。

ThruputWrite

写吞吐

字节/秒

该文件系统在周期内每秒平均写吞吐字节。

IopsRead

读IOPS

次/秒

该文件系统在周期内每秒平均读IOPS次数。

IopsWrite

写IOPS

次/秒

该文件系统在周期内每秒平均写IOPS次数。

数据流动

ThroughputImport

导入吞吐

字节/秒

数据流动导入任务在周期内每秒平均吞吐字节。

ThroughputExport

导出吞吐

字节/秒

数据流动导出任务在周期内每秒平均吞吐字节。

QPSImportMeta

导入元数据QPS

次/秒

数据流动导入任务在周期内每秒平均请求元数据次数。

QPSExportMeta

导出元数据QPS

次/秒

数据流动导出任务在周期内每秒平均请求元数据次数。

IOPSImport

导入IOPS

次/秒

数据流动导入任务在周期内IOPS每秒平均次数。

IOPSEXport

导出IOPS

次/秒

数据流动导出任务在周期内IOPS每秒平均次数。

LatencyImport

导入延迟

us

数据流动导入任务在周期内的平均延迟。

LatencyExport

导出延迟

us

数据流动导出任务在周期内的平均延迟。

报警规则说明

通过云监控控制台,您可以为不同监控指标设置报警规则。当资源的监控指标达到报警条件时,云监控会自动发送报警通知。下表列出了报警规则的报警级别、通知机制以及报警条件信息。

报警等级

通知机制

报警条件

紧急Critical

电话+短信+邮件+钉钉机器人

连续N个周期监控指标的平均值与指定阈值满足所设置的判断条件。其中N值请根据报警等级进行区分设置。

说明

当所选的指标类型不同时,报警条件会存在差异,请以实际界面为准。

警告Warn

短信+邮件+钉钉机器人

普通Info

邮件+钉钉机器人