使用iostat与iotop定位Linux磁盘I/O过高进程-云服务器ECS-阿里云

问题现象

使用iostat确认磁盘瓶颈，然后利用iotop定位具体进程，最后按需优化或升级资源。

登录ECS实例。
1. 访问ECS控制台-实例。在页面左侧顶部，选择目标资源所在的资源组和地域。
2. 进入目标实例详情页，单击远程连接，选择通过Workbench远程连接。根据页面提示登录，进入终端页面。
使用iostat监控磁盘I/O状态。
1. 安装sysstat工具包。
  Alibaba Cloud Linux / CentOS / Fedora
```
sudo yum install -y sysstat
```
  Ubuntu / Debian
```
sudo apt install -y sysstat
```
  openSUSE
```
sudo zypper install -y sysstat
```
2. 执行iostat，每2秒刷新一次数据。
```
iostat -d -x -k 2
```
分析iostat输出结果。重点关注：
- r/s，w/s：每秒读、写请求次数（IOPS）。
- rkB/s，wkB/s：每秒读、写数据量（吞吐量）。
- %util：磁盘I/O的使用率。如果持续接近100%，说明磁盘设备已达到饱和状态。

磁盘I/O达到饱和状态后，需进一步定位是哪个进程导致的高负载。

使用iotop实时查看进程的I/O活动。
1. 安装iotop。
  Alibaba Cloud Linux / CentOS / Fedora
```
sudo yum install -y iotop
```
  Ubuntu / Debian
```
sudo apt install -y iotop
```
  openSUSE
```
sudo zypper install -y iotop
```
2. 显示活跃的I/O进程。
```
sudo iotop -o
```
分析iotop输出结果。
- 定位进程：从DISK WRITE或DISK READ找出I/O最高的进程。
- 辅助判断：IO>列显示进程等待I/O的时间占比。

分析原因：可能源于SQL慢查询、日志级别过高或文件读写频繁等问题。
处理方法（包括但不限于）：
- 数据库：检查慢查询日志，优化SQL语句和索引。
- 日志服务：降低应用程序的日志级别（如从DEBUG改为INFO），并配置日志轮转。
- 文件锁：检查文件读写逻辑。使用内存缓存，增加缓冲区。

如果排查后无法通过应用层优化降低，可以通过升级磁盘来提升性能。