文档

基本概念

更新时间:

本文为您介绍灵骏中用到的基本概念,帮助您正确理解和使用。使用灵骏的过程中,您可以根据业务需求规划多个集群,集群可进一步细化为节点分组,通过对集群、节点的规划来高效率利用节点资源。

image

概念

说明

集群

集群是带有灵骏优化套件的高性能的异构加速计算节点的集合,集群中的各节点间通过800 Gbps高速低延迟RDMA网络进行互联通信。用户可以使用原生的物理集群服务,也可以在原生服务基础上结合阿里云提供的其他云产品一起使用灵骏服务。

分组

分组是节点的一个集合,是集群的一个子集。分组通常是包含一个或多个具有相同规格特征的节点的集合,例如:GU100节点分组等。

节点

节点即计算节点,是经灵骏优化套件加速的高性能的GPU服务器,用户可以选择其上部署的操作系统(OS),目前支持CentOS 7.9。

优化套件

灵骏提供的适合大规模并行计算集群优化组件的集合,包括数据加载优化、集合通信优化、计算资源优化、网络优化等几个组件。