本文为您介绍EMR Serverless Spark的计费组成和计算资源信息,以便您对支付的费用组成有所了解。
计费组成
EMR Serverless Spark的计费项目主要来源于计算资源,即实际可用于计算的资源。费用将根据您按量付费的实际使用量进行收取,计量单位为CU。按量付费的使用量可以通过计算资源抵扣包进行抵扣,详情请参见资源抵扣包。
计算资源
CU
CU是EMR Serverless Spark工作空间计算能力的基本单位,其用量按分钟累计。CU的单价取决于EMR Serverless Spark工作空间所配置的CPU架构和可用区(AZ)的高可用属性,默认为Intel X86和单可用区。同时,CU的单价因地域而异。
资源估算
CU对应Serverless Spark底层系统的CPU计算能力。一个计算任务的CU使用量取决于该任务实际处理的数据量、计算复杂程度、处理的数据分布情况,以及是否开启Fusion引擎加速。开启Fusion引擎加速后,当前不会有额外的资源成本增加,但作业执行时间通常能够大幅缩短(30%以上),因此具备更高的综合性价比。您可以根据业务规模和数据量合理评估需要的资源,默认1 CU按照1核CPU+4GB内存折算。如果CPU核数与内存的比例不足1:4,请根据CU折算优惠活动进行折算,详情请参见EMR Serverless Spark CU优惠活动。
1 CU的处理能力如下表所示。
处理场景 | 处理能力(Java Runtime) | 处理能力(Fusion引擎) |
处理场景 | 处理能力(Java Runtime) | 处理能力(Fusion引擎) |
简单的数据处理。例如,过滤、清洗等操作。 | 1 CU每秒可以处理约2000000条数据。 | 1 CU每秒可以处理约5000000条数据。 |
复杂的数据处理。例如,聚合、连接、String操作等。 | 1 CU每秒可以处理约700000条数据。 | 1 CU每秒可以处理约2000000条数据。 |
- 本页导读 (1)
- 计费组成
- 计算资源
- CU