本文为您介绍EMR Serverless Spark的资源估算策略、计费项、计算方式,以及支持地域的费用单价等信息。
CU
CU是EMR Serverless Spark工作空间计算能力的基本单位,其用量按分钟累计。CU的单价取决于EMR Serverless Spark工作空间所配置的CPU架构和可用区(AZ)的高可用属性,默认为Intel X86和单可用区。同时,CU的单价因地域而异。
资源估算
CU对应Serverless Spark底层系统的CPU计算能力。一个计算任务的CU使用量取决于该任务实际处理的数据量、计算复杂程度、处理的数据分布情况,以及是否开启Fusion引擎加速。开启Fusion引擎加速后,单位时间的CU使用量将会增加25%,但作业执行时间通常能够大幅缩短(60%以上),因此具备更高的综合性价比。您可以根据业务规模和数据量合理评估需要的资源,默认1 CU按照1核CPU+4GB内存折算。如果CPU核数与内存的比例不是1:4,则CU的折算方式为CU = max(cpu/1, mem/4)
。
1 CU的处理能力如下表所示。
处理场景 | 处理能力(Java Runtime) | 处理能力(Fusion引擎) |
简单的数据处理。例如,过滤、清洗等操作。 | 1 CU每秒可以处理约2000000条数据。 | 1 CU每秒可以处理约5000000条数据。 |
复杂的数据处理。例如,聚合、连接、String操作等。 | 1 CU每秒可以处理约700000条数据。 | 1 CU每秒可以处理约2000000条数据。 |
计费项
当前仅支持按量付费模式,其计费公式如下:
一个工作空间的总价 = 1小时内计算资源使用的CU × 单价
按量付费目前仅支持Intel X86架构,使用时长按分钟级别计算,每小时为1个结账周期。
以上计算公式为开通一个EMR Serverless Spark工作空间的费用。一个账户可以开通多个工作空间,结算时,需要按照多个工作空间的总费用结算。
计费方式
按量付费
按量付费是一种后付费的计费模式,无需您提前购买大量资源,系统会根据您工作空间实际的资源使用量进行结算。本节将为您介绍按量付费的适用场景、计费规则以及计费周期。
特性 | 说明 |
适用场景 | 按量付费主要适用于以下业务场景:
|
计费规则 | 您一个周期内(1小时)的账单费用为实际计算所消耗的资源费用,具体为周期内所累计的总资源折算为CU时,再乘以对应地域的小时单价。 计算资源费用为: 例如, Spark任务资源配置如下所示。
每分钟使用总计3核CPU和6GB的内存,1小时的资源使用量为 重要
|
计费周期 | 按照每小时整点计算一次费用(以UTC+8时间为准),计算完毕后进入新的计费周期。在每个计费周期结束后,系统会生成账单,并从您账户中扣除相应费用。 账单流水数据相对于实际费用消耗可能会有延迟,详情请参见账单使用说明。 |
地域单价
下表详细列出了各类工作空间在不同地域的价格情况。
实际价格请以产品购买页面为准。
中国地区
地域名称
单价(元/CU/小时)
华北2(北京)
0.33
华东2(上海)
0.33
华东1(杭州)
0.33
华南1(深圳)
0.33
华北3(张家口)
0.23
华北6(乌兰察布)
0.29
其他国家和地区
地域名称
单价(元/CU/小时)
新加坡
0.53
德国(法兰克福)
0.51
美国(弗吉尼亚)
0.42
注意事项
EMR Serverless Spark资源采用按量计费方式,高峰期可能存在抢占资源的情况,无法完全保障资源使用的时效性。