全部产品
云市场

PAI-EAS计费

更新时间:2019-12-06 15:34:51

PAI-EAS在线预测服务提供将常规机器学习模型/深度学习模型一键发布为Restful API的功能,支持用户通过http请求调用模型服务做实时预测,并且提供蓝绿部署、模型版本管理、在线调试等服务功能。

一、概述

使用EAS进行部署服务,首先要考虑的就是将服务部署在什么样的计算资源上。PAI-EAS提供将模型服务部署在公共资源组专属资源组上两种方式。具体两种资源组的区别详情见文档:资源组使用介绍

对应于这两种部署使用的资源不同,EAS的计费方式也有不同,详见下表:

部署使用资源 计费主体 付费形式 计费规则
公共资源组 模型服务运行时长 后付费 该种计费适用于模型服务直接部署在公共资源组上的情况,此时该模型服务占用多少公共计算资源多长时间,就产生多少按量后付费费用。
专属资源组 资源组运行时长 预付费 该种情况适用于用户将模型服务部署在专属资源组上的情况,由于专属资源组是提前下单购买的,此时用户只需要为资源组付费即可,部署在上面的模型服务不再产生计费。资源组购买提供包年包月预付费和按量使用后付费两种购买形式
后付费

如果以上两种部署方式对应的资源都使用了,那么EAS产生的总费用为所有费用之和。下面介绍两种部署产生费用的具体计算方式。

二、公共资源组部署计费

1、基本规则

按照上述表格的计费规则介绍,使用公共资源组部署情况下,费用计量是按照部署的模型服务的运行时长(即占用公共资源的时长)来计量的。具体计算方式为:

每个模型服务费用 = 部属资源数量 * 部属资源单价 * 使用时长

  • 模型一旦部署并处于running状态就会开始计费,请切记及时停止无用的模型服务,以免造成不必要的费用开销
  • 计费时间起点为模型(即对应占用资源)开始运行(状态转为Running)时间,计费时间终点为模型(即对应占用资源)停止(状态转为Stopped)时间。
  • 模型扩容后,对应的新资源使用时长从扩容成功时刻开始计算。模型缩容后,被释放的资源从释放成功后停止计费,剩余资源继续计费。
  • 使用时长精确到分钟,不足1分钟的时长舍弃不计费。

其中部署资源单价可以见下表,表中1Quota=1核+4GB内存:

部署资源类型 单价 区域
CPU服务 0.4元/Quota/小时 华东1、华东2、华北2、华南1、新加坡
GPU服务(P4卡) 8元/P4Quota/小时 华东1、华东2、华北2、华南1、新加坡

注:上表中公共资源组GPU(P4)资源即将下线,请合理安排使用。

2、计费举例

假设A用户在华东1Region部署了一个模型服务,初始占用资源为2Quota(2核+8GB内存),9:00完成部署并服务进入Running状态,10:00用户完成缩容,占用资源减少为1Quota(1核+4GB内存),11:00用户完成扩容,占用资源增加为4Quota(4核+16GB内存),12:00用户完成停止服务并状态变为Stopped态。那么在这种情况下,用户使用产生的费用为:

部属资源数量 * 部属资源单价 * 使用时长 = 2(Quota) * 0.4(元) * 1(h) + 1(Quota) * 0.4(元) * 1(h) +4(Quota) * 0.4(元) * 1(h) = 2.8 元

三、专属资源组部署计费

用户将模型服务部署在专属资源组上时,由于专属资源组是提前下单购买的,此时用户只需要为资源组付费即可,部署在上面的模型服务不再产生计费。资源组购买提供包年包月预付费(预付费专属资源组)和按量使用后付费(后付费专属资源组)两种购买形式。

1、预付费专属资源组

(1)基本规则

   每个资源组费用 = 购买资源数量 * 资源单价 * 购买时长

  • 购买时长范围可以选择:1月~12月
  • 购买时长从购买次日开始计起(即购买当日为赠送免费使用时间),次日起往后推30天为一个月。例:用户7月31日下单购买一个月,则从8月1日开始计算日子,8月31日00:00资源组到期。
  • 部署资源单价见下表,其中“国内Region”包括:华东1、华东2、华北2、华南1。其中部分机器资源在部分区域可能存在短期无货无法购买。
机器型号 GPU配置 CPU配置 国内Region单价(每机器每月) 新加坡Region单价(每机器每月)
ecs.c5.6xlarge / 24核48G 2360元 3850元
ecs.g5.6xlarge / 24核96G 3200元 4810元
ecs.gn5i-c4g1.xlarge 1 * Nvidia Tesla P4卡 4 核16G 2920元
ecs.gn5i-c8g1.2xlarge 1 * Nvidia Tesla P4卡 8 核32G 3510元
ecs.gn6i-c4g1.xlarge 1 * Tesla T4卡 4 核15G 3683元 4697元
ecs.gn6i-c8g1.2xlarge 1 * Tesla T4卡 8 核31G 4435元 5570元
ecs.gn6i-c16g1.4xlarge 1 * Tesla T4卡 16核62G 5198元 7317元
ecs.gn6i-c24g1.6xlarge 1 * Tesla T4卡 24核93G 5445元 9172元
ecs.gn5-c4g1.xlarge 1 * NVIDIA P100卡 4 核30G 4049元 6646元
ecs.gn5-c8g1.2xlarge 1 * NVIDIA P100卡 8 核60G 4876元 8004元
ecs.gn5-c28g1.7xlarge 1 * NVIDIA P100卡 28核112G 7565元 11517元
ecs.gn6v-c8g1.2xlarge 1 * NVIDIA V100卡 8 核32G 8382元

(2)计费举例

假设用户A购买了华东1Region的4核15G GPU T4卡2张,购买时长为3个月,则购买费用为:

购买资源数量 * 资源单价 * 购买时长 = 2张 * 3683元 * 3个月 = 22098 元

2、后付费专属资源组

(1)基本规则

   每个资源组费用 = 购买资源数量 * 资源单价 * 实际使用时长

  • 资源组一旦创建成功并处于running状态就会开始计费,请切记及时停止无用的资源组,以免造成不必要的费用开销
  • 计费时间起点为资源组开始运行(状态转为运行中)时间,计费时间终点为资源组中所有机器被缩容释放掉后的(状态转为无机器)时间。
  • 资源组扩容后,对应的新资源使用时长从扩容成功时刻开始计算。资源组缩容后,被释放的资源从释放成功后停止计费,剩余资源继续计费。
  • 使用时长精确到分钟,不足1分钟的时长舍弃不计费。
  • 各类资源单价见下表,其中“国内Region”包括:华东1、华东2、华北2、华南1。
    注1:其中部分机器资源在部分区域可能存在短期无货无法购买。
    注2:为方便用户直观查看,下表的单价为小时价。实际计费为分钟价计费,由于单位转换会存在略微差价,请以实际出账为准。
机器型号 GPU配置 CPU配置 国内Region单价(每机器) 新加坡Region单价(每机器)
ecs.c5.6xlarge / 24核48G 4.4元/小时 7.13元/小时
ecs.g5.6xlarge / 24核96G 6.6元/小时 10.69元/小时
ecs.gn5i-c4g1.xlarge 1 * Nvidia Tesla P4卡 4 核16G 10.66元/小时
ecs.gn5i-c8g1.2xlarge 1 * Nvidia Tesla P4卡 8 核32G 12.84元/小时
ecs.gn6i-c4g1.xlarge 1 * Tesla T4卡 4 核15G 12.79元/小时 9.79元/小时
ecs.gn6i-c8g1.2xlarge 1 * Tesla T4卡 8 核31G 15.40元/小时 11.61元/小时
ecs.gn6i-c16g1.4xlarge 1 * Tesla T4卡 16核62G 18.05元/小时 15.25元/小时
ecs.gn6i-c24g1.6xlarge 1 * Tesla T4卡 24核93G 18.91元/小时 19.11元/小时
ecs.gn5-c4g1.xlarge 1 * NVIDIA P100卡 4 核30G 14.06元/小时 13.84元/小时
ecs.gn5-c8g1.2xlarge 1 * NVIDIA P100卡 8 核60G 16.93元/小时 16.67元/小时
ecs.gn5-c28g1.7xlarge 1 * NVIDIA P100卡 28核112G 26.27元/小时 23.99元/小时
ecs.gn6v-c8g1.2xlarge 1 * NVIDIA V100卡 8 核32G 29.11元/小时

(2)计费举例

假设用户A购买了华东1Region的24核96G CPU 2台,使用时长为45分钟,则使用费用为:

购买资源数量 * 资源单价 * 实际使用时长 = 2台 * (6.6 / 60)元/分钟 * 45分钟 = 9.9 元