产品计费

本文为您介绍EMR Serverless Spark的资源估算策略、计费项、计算方式,以及支持地域的费用单价等信息。

CU

CU是EMR Serverless Spark工作空间计算能力的基本单位,其用量按分钟累计。CU的单价取决于EMR Serverless Spark工作空间所配置的CPU架构和可用区(AZ)的高可用属性,默认为Intel X86和单可用区。同时,CU的单价因地域而异。

资源估算

CU对应Serverless Spark底层系统的CPU计算能力。一个计算任务的CU使用量取决于该任务实际处理的数据量、计算复杂程度、处理的数据分布情况,以及是否开启Fusion引擎加速。开启Fusion引擎加速后,单位时间的CU使用量将会增加25%,但作业执行时间通常能够大幅缩短(60%以上),因此具备更高的综合性价比。您可以根据业务规模和数据量合理评估需要的资源,默认1 CU按照1核CPU+4GB内存折算。

1 CU的处理能力如下表所示。

处理场景

处理能力(Java Runtime)

处理能力(Fusion引擎)

简单的数据处理。例如,过滤、清洗等操作。

1 CU每秒可以处理约2000000条数据。

1 CU每秒可以处理约5000000条数据。

复杂的数据处理。例如,聚合、连接、String操作等。

1 CU每秒可以处理约700000条数据。

1 CU每秒可以处理约2000000条数据。

计费项

当前仅支持按量付费模式,其计费公式如下:

一个工作空间的总价 = 1小时内计算资源使用的CU × 单价
说明
  • 按量付费目前仅支持Intel X86架构,使用时长按分钟级别计算,每小时为1个结账周期。

  • 以上计算公式为开通一个EMR Serverless Spark工作空间的费用。一个账户可以开通多个工作空间,结算时,需要按照多个工作空间的总费用结算。

计费方式

按量付费

按量付费是一种后付费的计费模式,无需您提前购买大量资源,系统会根据您工作空间实际的资源使用量进行结算。本节将为您介绍按量付费的适用场景、计费规则以及计费周期。

特性

说明

适用场景

按量付费主要适用于以下业务场景:

  • 业务用量经常有变化。

  • 资源使用有临时性和突发性。

计费规则

您一个周期内(1小时)的账单费用为实际计算所消耗的资源费用,具体为周期内所累计的总资源折算为CU时,再乘以对应地域的小时单价。

计算资源费用为:1小时内CU的用量 × 对应地域的小时单价

例如, Spark任务资源配置如下所示。

spark.driver.cores 1
spark.driver.memory 1g
spark.driver.memoryOverhead 1g

spark.executor.cores 1
spark.executor.memory 1g
spark.executor.memoryOverhead 1g
spark.executor.instances 2

每分钟使用总计3核CPU和6GB的内存,1小时的资源使用量为(3Core, 6GB) /分钟 * 60。按照max(3/1, 6/4),折算为3 CU时,1小时的费用为3 CU时 * 对应地域的小时单价。不同地域的单价信息请参见地域单价

重要
  • 上述计算公式为开通一个EMR Serverless Spark工作空间的费用。如果您的账户内开通了多个工作空间,结算时会计算所有工作空间的总费用。

  • 容器运行时开始计量,Spark Driver和Executor的初始化过程在容器开始运行之后,因此,根据Spark UI上Driver和Executor的运行时间计算得出的CU时长可能与实际CU时长存在差异,请以最终账单为准。

计费周期

按照每小时整点计算一次费用(以UTC+8时间为准),计算完毕后进入新的计费周期。在每个计费周期结束后,系统会生成账单,并从您账户中扣除相应费用。

账单流水数据相对于实际费用消耗可能会有延迟,详情请参见账单使用说明

地域单价

下表详细列出了各类工作空间在不同地域的价格情况。

重要

实际价格请以产品购买页面为准。

  • 中国地区

    地域名称

    单价(元/CU/小时)

    华北2(北京)

    0.33

    华东2(上海)

    0.33

    华东1(杭州)

    0.33

    华南1(深圳)

    0.33

    华北3(张家口)

    0.23

  • 其他国家和地区

    地域名称

    单价(元/CU/小时)

    新加坡

    0.53

    德国(法兰克福)

    0.51

    美国(弗吉尼亚)

    0.42

注意事项

EMR Serverless Spark资源采用按量计费方式,高峰期可能存在抢占资源的情况,无法完全保障资源使用的时效性。