在某些场景下,业务存在着特殊的规格需求,例如GPU、增强的网络能力、高主频、本地盘、AMD机型等。工作流集群支持通过指定的ECS规格运行工作流。本文介绍如何使用指定ECS规格运行工作流。
索引
规格说明
GPU规格说明
当前ECI GPU支持的驱动版本为NVIDIA 460.73.01,可支持的CUDA Tookit版本为11.2。关于CUDA Toolkit的更多信息,请参见NVIDIA CUDA。
ECI支持通过指定ECS GPU规格来进行实例的创建。运行工作流支持的ECS GPU规格如下所示。
GPU计算型实例规格族gn6v(NVIDIA V100),例如ecs.gn6v-c8g1.2xlarge。
GPU计算型实例规格族gn6i(NVIDIA T4),例如ecs.gn6i-c4g1.xlarge。
GPU计算型实例规格族gn5(NVIDIA P100),例如ecs.gn5-c4g1.xlarge。
GPU计算型实例规格族gn5i(NVIDIA P4),例如ecs.gn5i-c2g1.large。
关于完整的ECS GPU规格定义,请参见实例规格族。
AMD规格说明
ECI支持指定ECS AMD规格来创建AMD实例。AMD实例指的是处理器为AMD EPYCTM ROME的实例,该规格的特点为:依托神龙架构,将大量虚拟化功能卸载到专用硬件,降低虚拟化开销,可以提供稳定可预期的超高性能。适用于视频编解码、高网络包收发、Web前端服务器、大型多人在线游戏(MMO)前端、测试开发(DevOps)等场景。
运行工作流支持指定的ECS AMD规格族如下。
通用型实例规格族g7a、g6a,例如ecs.g7a.large、ecs.g6a.large。
计算型实例规格族c7a、c6a,例如ecs.c7a.large、ecs.c6a.large。
内存型实例规格族r7a、r6a,例如ecs.r7a.large、ecs.r6a.large。
关于完整的ECS AMD规格定义,请参见实例规格族。
使用示例
您可以在Pod metadata中添加Annotation来指定ECS GPU和ECS AMD规格,即在Pod声明中增加annotations: k8s.aliyun.com/eci-use-specs
指定支持使用的实例规格。使用示例如下。
GPU示例
apiVersion: argoproj.io/v1alpha1
kind: Workflow
metadata:
generateName: hello-world-
spec:
entrypoint: whalesay
templates:
- name: whalesay
metadata:
annotations:
k8s.aliyun.com/eci-use-specs: ecs.gn5i-c4g1.xlarge # 指定支持的ECS GPU规格。
container:
image: docker/whalesay
command: [ cowsay ]
args: [ "hello world" ]
AMD示例
apiVersion: argoproj.io/v1alpha1
kind: Workflow
metadata:
generateName: hello-world-
spec:
entrypoint: whalesay
templates:
- name: whalesay
metadata:
annotations:
k8s.aliyun.com/eci-use-specs: "ecs.c6a.xlarge" # 指定支持的ECS AMD规格。
container:
image: docker/whalesay
command: [ cowsay ]
args: [ "hello world" ]