本文主要介绍在专有云V3环境ECS集群中,盘古水位过高的处理方法。
说明:适用于专有云V3.0.0~V3.15.0环境,包含V3.0.0和V3.15.0环境。
说明:释放您无用的磁盘,需要您先判断是否可以释放,在您确定的情况下执行本方案。
在专有云V3环境的ECS集群中,盘古服务磁盘使用率过高,需紧急处理。
根据不同环境实施以下操作,查看ECS集群盘古服务的回收站大小。
Total Free Disk Size
参数的值。
/apsara/deploy/puadmin lscs | grep ^Total系统显示类似如下。
/apsara/deploy/pu quota /deleted/
/apsara/river/river_admin master ls cluster系统显示类似如下。
/apsara/deploy/pu quota /deleted/系统显示类似如下。
说明:盘古的环境为3个副本,即物理大小=逻辑大小*3,以下是关于图中参数的说明:
- EntryNumber Limit:目录数,单位为个。
- FileNumber Limit:文件数,单位为个。
- FilePhysicalLength Limit:物理大小,单位为字节。
- FileLogicalLength Limit:逻辑大小,单位为字节。
注意:专有云V2环境和专有云V3环境的混部集群在集群AG服务器上执行,专有云V3存储集群在该集群的PanguTools#服务角色对应的机器上执行。
执行以下命令,检查集群的盘古回收站周期,单位为秒。
/apsara/deploy/puadmin flag -get pangu_master_DelayTimeForFileGC -m
系统显示类似如下。
select * from zone\G系统显示类似如下。
select * from cluster_info;系统显示类似如下。
update cluster_info set deleted_disk_preserve='[$Deleted_Disk_Preserve]' where cluster_id='[$Cluster_ID]';
说明:系统显示类似如下。
- [$Deleted_Disk_Preserve]为需要修改的时间,单位为小时。
- [$Cluster_ID]为集群对应的cluster_id。
注意:专有云V2环境和专有云V3环境的混部集群在集群AG服务器执行以下命令,专有云V3环境存储集群在该集群PanguTools#服务角色对应机器上执行以下命令。
/apsara/deploy/puadmin fs -crb
./AS_SupT -p ecs_vmdisk_usage_v3 -e -o '--cluster_name=[$Cluster_Name]'
说明:[$Cluster_Name]为集群名。系统显示类似如下。
下载以下脚本文件并上传到集群AG服务器。
check_device_info.sh
check_houyi_device_size.sh
执行以下命令,使用cluster_id进行查询。
./check_houyi_device_size.sh [$Cluster_ID] |while read out; do sh ./check_device_info.sh "$out"; done
注意:确认可以释放,则进行磁盘释放操作,否则停止操作。
在专有云控制台和ASCM平台释放相应磁盘,具体环境例图如下。
登录专有云控制台,释放相应的磁盘。
登录ASCM控制台,释放相应的磁盘。
确认集群中盘古服务的磁盘使用率逐渐下降。
select * from cluster_info;
说明:专有云V2环境需要登录ECSAG服务器。
/apsara/deploy/pu quota /deleted/
参见查询盘古集群内所有磁盘的实际大小部分的步骤1,登录houyiregiondb数据库,恢复磁盘在houyi层的延迟删除时间。