使用指定ECS规格运行工作流

在某些场景下,业务存在着特殊的规格需求,例如GPU、增强的网络能力、高主频、本地盘、AMD机型等。工作流集群支持通过指定的ECS规格运行工作流。本文介绍如何使用指定ECS规格运行工作流。

索引

规格说明

GPU规格说明

当前ECI GPU支持的驱动版本为NVIDIA 460.73.01,可支持的CUDA Tookit版本为11.2。关于CUDA Toolkit的更多信息,请参见NVIDIA CUDA

ECI支持通过指定ECS GPU规格来进行实例的创建。运行工作流支持的ECS GPU规格如下所示。

  • GPU计算型实例规格族gn6v(NVIDIA V100),例如ecs.gn6v-c8g1.2xlarge。

  • GPU计算型实例规格族gn6i(NVIDIA T4),例如ecs.gn6i-c4g1.xlarge。

  • GPU计算型实例规格族gn5(NVIDIA P100),例如ecs.gn5-c4g1.xlarge。

  • GPU计算型实例规格族gn5i(NVIDIA P4),例如ecs.gn5i-c2g1.large。

关于完整的ECS GPU规格定义,请参见实例规格族

AMD规格说明

ECI支持指定ECS AMD规格来创建AMD实例。AMD实例指的是处理器为AMD EPYCTM ROME的实例,该规格的特点为:依托神龙架构,将大量虚拟化功能卸载到专用硬件,降低虚拟化开销,可以提供稳定可预期的超高性能。适用于视频编解码、高网络包收发、Web前端服务器、大型多人在线游戏(MMO)前端、测试开发(DevOps)等场景。

运行工作流支持指定的ECS AMD规格族如下。

  • 通用型实例规格族g7a、g6a,例如ecs.g7a.large、ecs.g6a.large。

  • 计算型实例规格族c7a、c6a,例如ecs.c7a.large、ecs.c6a.large。

  • 内存型实例规格族r7a、r6a,例如ecs.r7a.large、ecs.r6a.large。

关于完整的ECS AMD规格定义,请参见实例规格族

使用示例

您可以在Pod metadata中添加Annotation来指定ECS GPU和ECS AMD规格,即在Pod声明中增加annotations: k8s.aliyun.com/eci-use-specs指定支持使用的实例规格。使用示例如下。

GPU示例

apiVersion: argoproj.io/v1alpha1
kind: Workflow                 
metadata:
  generateName: hello-world-    
spec:
  entrypoint: whalesay         
  templates:
    - name: whalesay              
      metadata:
        annotations:
          k8s.aliyun.com/eci-use-specs: ecs.gn5i-c4g1.xlarge # 指定支持的ECS GPU规格。
      container:
        image: docker/whalesay
        command: [ cowsay ]
        args: [ "hello world" ]

AMD示例

apiVersion: argoproj.io/v1alpha1
kind: Workflow                
metadata:
  generateName: hello-world-    
spec:
  entrypoint: whalesay          
  templates:
    - name: whalesay             
      metadata:
        annotations:
          k8s.aliyun.com/eci-use-specs: "ecs.c6a.xlarge"  # 指定支持的ECS AMD规格。
      container:
        image: docker/whalesay
        command: [ cowsay ]
        args: [ "hello world" ]