E-HPC客户端提供了可视化的页面来配置HPL、iPerf和FIO应用,可以快速提交相关作业,测试集群benchmark性能,包括浮点计算能力、带宽性能和读写能力。
背景信息
测试集群benchmark性能主要使用以下几个软件:
HPL:一个测试高性能计算集群系统浮点性能的基准程序。HPL通过对高性能计算集群采用高斯消元法求解一元N次稠密线性代数方程组的测试,评价高性能计算集群的浮点计算能力。
iPerf:一个网络性能测试工具,支持设置协议、时间等相关参数,可以报告带宽、数据包丢失等。
FIO:一个开源的I/O压力测试工具,主要用于测试磁盘的IO性能,支持多引擎和多场景测试。
准备工作
使用客户端运行HPL、iPerf和FIO测试集群性能,请确保已在集群中安装HPL、iPerf和FIO软件及其依赖。需安装的软件及其相关依赖如下:
HPL:需安装intel-mpi 2018、linpack 2018、 openmpi 3.0.0。
iPerf:需安装iPerf、intel-mpi 2018。
FIO:需安装fio 3.1、intel-mpi 2018。
其中,iPerf需要在每个节点上执行yum install -y iperf
命令安装;其他软件可以通过控制台安装,具体操作,请参见安装软件。
操作步骤
打开并登录客户端。
在左侧导航栏,单击应用中心。
测试算力。
单击hpl应用。
在弹出面板配置相关参数,单击提交。
参数类型
参数
示例值
描述
基础参数
作业名称
hpltest
自定义设置。
作业队列
workq
运行该作业的队列。
CPU核数
2
单个节点的CPU核数。
节点数
1
运行该作业所需的计算节点数。
输出日志
hpl_test.log
作业运行日志的输出路径。
应用参数
求解规模
10000
求解的矩阵规模(N)。规模越大,有效计算所占的比例越大,则系统浮点处理性能越高。但矩阵规模越大会导致内存消耗量越多,如果系统实际内存空间不足,使用缓存、性能会大幅度降低。矩阵占用系统总内存的80%左右为最佳,即N×N×8=系统总内存×80%(其中总内存的单位为字节)。
分块大小
192 256
求解矩阵过程中矩阵分块的大小(NB)。NB值的选择主要是通过实际测试得出最优值。
测试带宽。
单击iperf应用。
在弹出面板配置相关参数,单击提交。
参数类型
参数
示例值
描述
基础参数
作业名称
iperftest
自定义设置。
作业队列
workq
运行该作业的队列。
CPU核数
2
单个节点的CPU核数。
节点数
1
运行该作业所需的计算节点数。
输出日志
iperf_test.log
作业运行日志的输出路径。
应用参数
HostName
login0
要测试的节点主机名称。
主机网卡
eth0
要测试的节点主机网卡。
测试读写能力。
单击fio应用。
在弹出面板配置相关参数,单击提交。
参数类型
参数
示例值
描述
基础参数
作业名称
fiotest
自定义设置。
作业队列
workq
运行该作业的队列。
CPU核数
2
单个节点的CPU核数。
节点数
1
运行该作业所需的计算节点数。
输出日志
fio_test.log
作业运行日志的输出路径。
应用参数
ioengine
psync
I/O引擎使用的测试方式。可选项:
psync
libaio
读写方式
rw
测试的读写方式。可选项:
read:顺序读
write:顺序写
rw:顺序读写
randread:随机读
randwrite:随机写
randrw:随机读写
IO块大小
4K
单次I/O测试的块文件大小,可配置为4K或16K。
线程数
1
测试线程数。
测试时间
100s
测试时间。
读写数据量
1024M
要测试的数据量。
测试文件
/home/username
存放系统生成的测试文件的路径。
查看结果
在客户端的左侧导航栏,单击作业查询。
找到HPL、iPerf和FIO作业,分别确认作业状态并获取结果。
当作业状态变为FINISHED时,单击作业对应的详情,在作业详情页面单击作业输出文件与路径后的查看,即可查看结果。结果示例如下:
HPL
iPerf
FIO