运行HPL、iPerf和FIO以测试集群性能

E-HPC客户端提供了可视化的页面来配置HPL、iPerf和FIO应用,可以快速提交相关作业,测试集群benchmark性能,包括浮点计算能力、带宽性能和读写能力。

背景信息

测试集群benchmark性能主要使用以下几个软件:

  • HPL:一个测试高性能计算集群系统浮点性能的基准程序。HPL通过对高性能计算集群采用高斯消元法求解一元N次稠密线性代数方程组的测试,评价高性能计算集群的浮点计算能力。

  • iPerf:一个网络性能测试工具,支持设置协议、时间等相关参数,可以报告带宽、数据包丢失等。

  • FIO:一个开源的I/O压力测试工具,主要用于测试磁盘的IO性能,支持多引擎和多场景测试。

准备工作

使用客户端运行HPL、iPerf和FIO测试集群性能,请确保已在集群中安装HPL、iPerf和FIO软件及其依赖。需安装的软件及其相关依赖如下:

  • HPL:需安装intel-mpi 2018、linpack 2018、 openmpi 3.0.0。

  • iPerf:需安装iPerf、intel-mpi 2018。

  • FIO:需安装fio 3.1、intel-mpi 2018。

其中,iPerf需要在每个节点上执行yum install -y iperf命令安装;其他软件可以通过控制台安装,具体操作,请参见安装软件

操作步骤

  1. 打开并登录客户端。

  2. 在左侧导航栏,单击应用中心

  3. 测试算力。

    1. 单击hpl应用。

    2. 在弹出面板配置相关参数,单击提交

      参数类型

      参数

      示例值

      描述

      基础参数

      作业名称

      hpltest

      自定义设置。

      作业队列

      workq

      运行该作业的队列。

      CPU核数

      2

      单个节点的CPU核数。

      节点数

      1

      运行该作业所需的计算节点数。

      输出日志

      hpl_test.log

      作业运行日志的输出路径。

      应用参数

      求解规模

      10000

      求解的矩阵规模(N)。规模越大,有效计算所占的比例越大,则系统浮点处理性能越高。但矩阵规模越大会导致内存消耗量越多,如果系统实际内存空间不足,使用缓存、性能会大幅度降低。矩阵占用系统总内存的80%左右为最佳,即N×N×8=系统总内存×80%(其中总内存的单位为字节)。

      分块大小

      192 256

      求解矩阵过程中矩阵分块的大小(NB)。NB值的选择主要是通过实际测试得出最优值。

  4. 测试带宽。

    1. 单击iperf应用。

    2. 在弹出面板配置相关参数,单击提交

      参数类型

      参数

      示例值

      描述

      基础参数

      作业名称

      iperftest

      自定义设置。

      作业队列

      workq

      运行该作业的队列。

      CPU核数

      2

      单个节点的CPU核数。

      节点数

      1

      运行该作业所需的计算节点数。

      输出日志

      iperf_test.log

      作业运行日志的输出路径。

      应用参数

      HostName

      login0

      要测试的节点主机名称。

      主机网卡

      eth0

      要测试的节点主机网卡。

  5. 测试读写能力。

    1. 单击fio应用。

    2. 在弹出面板配置相关参数,单击提交

      参数类型

      参数

      示例值

      描述

      基础参数

      作业名称

      fiotest

      自定义设置。

      作业队列

      workq

      运行该作业的队列。

      CPU核数

      2

      单个节点的CPU核数。

      节点数

      1

      运行该作业所需的计算节点数。

      输出日志

      fio_test.log

      作业运行日志的输出路径。

      应用参数

      ioengine

      psync

      I/O引擎使用的测试方式。可选项:

      • psync

      • libaio

      读写方式

      rw

      测试的读写方式。可选项:

      • read:顺序读

      • write:顺序写

      • rw:顺序读写

      • randread:随机读

      • randwrite:随机写

      • randrw:随机读写

      IO块大小

      4K

      单次I/O测试的块文件大小,可配置为4K或16K。

      线程数

      1

      测试线程数。

      测试时间

      100s

      测试时间。

      读写数据量

      1024M

      要测试的数据量。

      测试文件

      /home/username

      存放系统生成的测试文件的路径。

查看结果

  1. 在客户端的左侧导航栏,单击作业查询

  2. 找到HPL、iPerf和FIO作业,分别确认作业状态并获取结果。

    当作业状态变为FINISHED时,单击作业对应的详情,在作业详情页面单击作业输出文件与路径后的查看,即可查看结果。结果示例如下:

    • HPL

      hpl
    • iPerf

      ipref
    • FIO

      fio