弹性RDMA网卡(ERI)是一种可以绑定到ECS实例的虚拟网卡,ERI必须依附于弹性网卡(ENI)开启RDMA设备。ERI完全复用了弹性网卡所属的网络,让您无需改变业务组网,即可在原有网络下使用RDMA功能,体验RDMA带来的超低延迟。本文介绍如何在ECS实例上配置ERI。
背景信息
ERI基于神龙架构,使用ERI具有以下优势:
- 超低延迟:RDMA功能绕过内核协议栈,将数据直接从用户态程序转移到HCA中进行网络传输,极大地降低了CPU负载和延迟。ERI使弹性网卡具有传统RDMA网卡的优点,您可以在阿里云VPC中体验超低的延迟。
- 规模部署:传统的RDMA功能依赖于网络的无损特性,在规模部署时难度高且成本高。而ERI采用了自研的拥塞控制(CC)算法,容忍VPC网络中的传输质量变化(例如延迟、丢包等),在有损的网络环境中依然拥有良好的性能表现。
- 弹性扩展:ERI依附于弹性网卡,您可以随时创建支持ERI的弹性网卡并绑定到ECS实例,轻松实现弹性扩展。
ERI支持的接口和库:Libfabric 1.13.1、Intel MPI 2021.2、OpenMPI 4.1.1、EPSL v1.10、RSocket(自带RSocket,无需额外安装)。
操作步骤
注意 如果之前已通过DKMS(Dynamic Kernel Module Support)安装过1.0版本的ERI驱动,则需要先执行
dkms remove -m erdma -v 1.0
移除该驱动。