您可通过环境变量对ACCL进行配置调整,文本为您列出了常用环境变量及说明。

环境变量 说明 取值
ACCL_LOG_LEVEL 指定日志打印级别
  • NONE
  • ERR (默认)
  • WARN
  • INFO
ACCL_NET_TYPE 指定使用的网络类型
  • RDMA (默认)
  • TCP
ACCL_P2P_LEVEL 指定使用P2P级别
  • 0:disable
  • 1:NVLINK
  • 2:NVLINK PIX (默认)
  • 3:NVLINK PIX PHB
  • 4:NVLINK PIX PXB PHB
  • 5:NVLINK PIX PXB PHB SYS
ACCL_GDR_LEVEL 指定使用GDR级别
  • 0:disable
  • 1:PIX
  • 2:PIX PXB (默认)
  • 3:PIX PXB PHB
  • 4:PIX PXB PHB SOC
ACCL_ALLREDUCE_TYPE 指定AllReduce算法
  • HIERARCHICAL_MM (推荐)
  • HYBRID_MP
  • RING_CHUNKED
ACCL_ALLGATHER_TYPE 指定AllGather算法
  • HYBRID_MP (推荐)
  • RING_CHUNKED
  • BRUCK
ACCL_BROADCAST_TYPE 指定Broadcast算法
  • BN_TREE (默认)
  • FULLMESH
ACCL_NUM_QP RDMA网络每连接QP数
  • 支持的配置:1~16
  • 推荐的配置:2
ACCL_NUM_SOCKETS TCP网络每连接Socket数
  • 支持的配置:1~16
  • 推荐的配置:2
ACCL_COMM_IFNAME 带外网卡名称 null (默认)