GPU Pod容量预留

基于Pod的容量预留为弹性业务形态提供资源确定性保障。GPU Pod容量预留不需要直接绑定集群,您只需要购买时指定Pod规格、可用区、锁定时间等属性,ACS会保证在需要资源时,分钟级启动相应规格的Pod。通过GPU Pod容量预留,可以保障资源确定性,同时Pod预留价格相比于按量付费Pod更低。本文介绍GPU Pod容量预留的功能和特点。

功能特点

  • 资源确定性:在GPU Pod容量预留生效期间,系统保障资源成功拉起。

  • 降低成本:Pod拉起后按照按量价格收费,Pod销毁后按照容量预留价格收费,您可以根据业务流量灵活配置Pod拉起和销毁时间点。

  • 资源灵活性:可以创建多种不同规格的GPU Pod容量预留,以满足不同业务的需求。

说明
  • GPU Pod容量预留不支持为BestEffort算力类型的Pod提供保障。

  • GPU Pod容量预留支持地域、类型等属性相匹配的节省计划。

  • GPU Pod容量预留根据库存情况反馈创建是否成功。

使用场景

  • 周期性实时业务的资源需求:业务在每天/每周的周期中呈现"潮汐"特征,任务需要保证实时执行和完成。例如实时推理业务等。

    image
  • 偶发性的大量资源需求:业务中存在突发性的实时计算需求,需要保证资源的快速交付和扩容,避免对业务的影响。例如互联网业务中的热点事件引发的资源需求等。

    image

使用与计费示例

GPU Pod容量预留是按量付费方式。在容量预留生效期间,支付费用包括:

  • 未使用的容量预留按量费用。

  • 启动Pod的按量费用。

本文以购买两个GPU Pod容量预留并分别创建按量付费Pod1和按量付费Pod2的业务场景为例,展示使用流程以及不同阶段的计费算法,如下图所示。

image

阶段1:购买创建容量预留

容器计算服务控制台中,选择资源管理 > 创建GPU资源预留,配置容量预留参数,单击创建

配置项

说明

容量预留名称

用户自定义容量预留名称。

地域

需要预留资源的地域。

可用区

需要预留资源的可用区。

预留类型

GPU卡型。

资源规格

容量预留的Pod规格。

预留方式

Pod预留(不可修改)。

计费模式

按量付费(不可修改)。

释放方式

默认释放容量预留的时间。

数量

此规格GPU Pod容量预留的数量。

对应阶段的费用算法如下:

阶段

费用

说明

阶段1

未创建容量预留

阶段2-6:容量预留生效期

在生效期内,您可以随时创建与预留配置相同的Pod实例,系统保证创建成功,同时扣除对应数量的容量预留额度。Pod销毁后,相应配置的GPU Pod容量预留额度会同时恢复。

对应阶段的费用算法如下:

阶段

费用

阶段2

2×容量预留单价×阶段2时长

阶段3

1×容量预留单价×阶段3时长+

Pod1按量单价×阶段3时长

阶段4

Pod1按量单价×阶段4时长+

Pod2按量单价×阶段4时长

阶段5

1×容量预留单价×阶段5时长+

Pod2按量单价×阶段5时长

阶段6

2×容量预留单价×阶段6时长

其中容量预留单价为未使用的容量预留按量费用,Pod1和Pod2的按量单价以Pod启动后的按量费用计算。

说明

当您创建的Pod规格与预留配置不同时,ACS将采用按量的方式直接进行创建,不会使用当前的容量预留,Pod创建状态会根据库存情况实时反馈。

阶段7:容量预留到期

容量预留到期后,系统会自动释放GPU Pod容量预留。