运行HPL、iPerf和FIO以测试集群性能

更新时间:2022-11-02 02:10:37

E-HPC客户端提供了可视化的页面来配置HPL、iPerfFIO应用,可以快速提交相关作业,测试集群benchmark性能,包括浮点计算能力、带宽性能和读写能力。

背景信息

测试集群benchmark性能主要使用以下几个软件:

  • HPL:一个测试高性能计算集群系统浮点性能的基准程序。HPL通过对高性能计算集群采用高斯消元法求解一元N次稠密线性代数方程组的测试,评价高性能计算集群的浮点计算能力。

  • iPerf:一个网络性能测试工具,支持设置协议、时间等相关参数,可以报告带宽、数据包丢失等。

  • FIO:一个开源的I/O压力测试工具,主要用于测试磁盘的IO性能,支持多引擎和多场景测试。

准备工作

使用客户端运行HPL、iPerfFIO测试集群性能,请确保已在集群中安装HPL、iPerfFIO软件及其依赖。需安装的软件及其相关依赖如下:

  • HPL:需安装intel-mpi 2018、linpack 2018、 openmpi 3.0.0。

  • iPerf:需安装iPerf、intel-mpi 2018。

  • FIO:需安装fio 3.1、intel-mpi 2018。

其中,iPerf需要在每个节点上执行yum install -y iperf命令安装;其他软件可以通过控制台安装,具体操作,请参见安装软件

操作步骤

  1. 打开并登录客户端。

  2. 在左侧导航栏,单击应用中心

  3. 测试算力。

    1. 单击hpl应用。

    2. 在弹出面板配置相关参数,单击提交

      参数类型

      参数

      示例值

      描述

      参数类型

      参数

      示例值

      描述

      基础参数

      作业名称

      hpltest

      自定义设置。

      作业队列

      workq

      运行该作业的队列。

      CPU核数

      2

      单个节点的CPU核数。

      节点数

      1

      运行该作业所需的计算节点数。

      输出日志

      hpl_test.log

      作业运行日志的输出路径。

      应用参数

      求解规模

      10000

      求解的矩阵规模(N)。规模越大,有效计算所占的比例越大,则系统浮点处理性能越高。但矩阵规模越大会导致内存消耗量越多,如果系统实际内存空间不足,使用缓存、性能会大幅度降低。矩阵占用系统总内存的80%左右为最佳,即N×N×8=系统总内存×80%(其中总内存的单位为字节)。

      分块大小

      192 256

      求解矩阵过程中矩阵分块的大小(NB)。NB值的选择主要是通过实际测试得出最优值。

  4. 测试带宽。

    1. 单击iperf应用。

    2. 在弹出面板配置相关参数,单击提交

      参数类型

      参数

      示例值

      描述

      参数类型

      参数

      示例值

      描述

      基础参数

      作业名称

      iperftest

      自定义设置。

      作业队列

      workq

      运行该作业的队列。

      CPU核数

      2

      单个节点的CPU核数。

      节点数

      1

      运行该作业所需的计算节点数。

      输出日志

      iperf_test.log

      作业运行日志的输出路径。

      应用参数

      HostName

      login0

      要测试的节点主机名称。

      主机网卡

      eth0

      要测试的节点主机网卡。

  5. 测试读写能力。

    1. 单击fio应用。

    2. 在弹出面板配置相关参数,单击提交

      参数类型

      参数

      示例值

      描述

      参数类型

      参数

      示例值

      描述

      基础参数

      作业名称

      fiotest

      自定义设置。

      作业队列

      workq

      运行该作业的队列。

      CPU核数

      2

      单个节点的CPU核数。

      节点数

      1

      运行该作业所需的计算节点数。

      输出日志

      fio_test.log

      作业运行日志的输出路径。

      应用参数

      ioengine

      psync

      I/O引擎使用的测试方式。可选项:

      • psync

      • libaio

      读写方式

      rw

      测试的读写方式。可选项:

      • read:顺序读

      • write:顺序写

      • rw:顺序读写

      • randread:随机读

      • randwrite:随机写

      • randrw:随机读写

      IO块大小

      4K

      单次I/O测试的块文件大小,可配置为4K16K。

      线程数

      1

      测试线程数。

      测试时间

      100s

      测试时间。

      读写数据量

      1024M

      要测试的数据量。

      测试文件

      /home/username

      存放系统生成的测试文件的路径。

查看结果

  1. 在客户端的左侧导航栏,单击作业查询

  2. 找到HPL、iPerfFIO作业,分别确认作业状态并获取结果。

    当作业状态变为FINISHED时,单击作业对应的详情,在作业详情页面单击作业输出文件与路径后的查看,即可查看结果。结果示例如下:

    • HPL

      hpl
    • iPerf

      ipref
    • FIO

      fio

  • 本页导读 (1)
  • 背景信息
  • 准备工作
  • 操作步骤
  • 查看结果