本文为您介绍云原生数据湖分析(Data Lake Analytics,DLA)的定价及规格,主要包括计费方式、计费示例、优惠政策。

您在使用DLA的过程中会用到两种不同的计费方式:按扫描量付费和按计算资源付费(CU付费)。
说明 具体定价以阿里云官方定价为准。

按扫描量付费

当您通过DLA对本地或第三方数据源中的数据进行关联分析,DLA会根据扫描的数据量进行计费。

计费规则
用按量付费的计费模式(也称为后付费),即根据扫描的字节(Byte)数收费。没有任何前期拉起集群的费用、维护费用和升级费用。详细计费规则为:
  • 扫描每TB数据的费用为28元
  • 扫描每GB数据的费用为0.028元(2.8分)

计费时,系统保证扫描的每条数据至少为32MB。系统每小时生成一个收费订单,并从阿里云账号扣费。您可以登录控制台,通过费用 > 费用账单查看消费记录。

优惠政策
自2019年06月03日起,凡购买DLA的用户可以享受以下优惠:
  • 首购用户即可限时享受1元10TB优惠体验包,单击购买1元10TB优惠体验包
  • 后续使用过程中您可以购买折扣流量包,买的越多省的越多,单击购买折扣流量包
说明 上述优惠价格变更以阿里云官方定价为准。
计费示例

您在OSS中存储了两个容量均为1TB的CSV文件和JSON文件,在RDS中存储一个容量为1TB的数据表。

如果您想通过DLA对OSS和RDS中的数据进行关联分析,根据扫描的数据量和DLA计费方式,您需要支付的费用为:28+28+28=84元。

如何节省费用

您可以先通过以下三种方式对原始数据进行处理,然后再使用DLA扫描数据,可以节省一定的费用。

  • 格式转换:把原始数据的格式转换为高性能格式。

    DLA支持多种高性能数据格式,例如Apache ORC,Apache Parquet和Avro格式。您可以根据不同的业务需求,把原始数据转换为上述三类格式,然后只扫描您需要的数据列,无需扫描所有数据,从而节省扫描费用。

  • 压缩数据:对原始数据进行压缩来减少数据量,建议压缩格式为Parquet或者Orc格式,然后使用DLA扫描压缩过的数据,从而节省扫描费用。
  • 数据分区:通过分区的方式,把原始数据存储在不同的分区中,DLA只扫描其中的一个或者几个分区,无需扫描所有分区,从而节省扫描费用。

针对上述计费示例,您可以通过以下方式来节省DLA扫描费用。

  • 将1TB的CSV文件压缩为GZIP格式,压缩后的文件大小为0.4TB。然后将GZIP格式的数据分区存储,将待扫描的数据存储在同一个分区中。DLA只扫描一个分区,扫描的数据量降低至0.2TB。
  • 将1TB的JSON文件转换为ORC格式,DLA只需按列扫描其中10%的数据,扫描的数据量降低至0.1TB。

经过数据格式转换、压缩和分区后,根据DLA计费模式,您需要支付的DLA扫描费用变更为:28×0.2+28×0.1+28=36.4元,总共为您节省47.6元。

按计算资源付费(CU计费)

当您在使用云原生数据湖分析CU版本时,您需要事先购买一定规格的CU进行资源的计算。图片
  • CU基本规格:1个CU提供1CPU和4GB内存。即1CU = 1核4GB。
  • 长期保有资源(MIN):您长期持有且可以使用的CU规格,我们会按照该CU规格进行收费。
  • 弹性资源上限(MAX):为防止您在使用过程中突发大的容量,我们会给您设置一定的弹性资源,该部分弹性资源采取的是不使用不收费的计费方式,您在购买时可以自行选择。
    说明 如果您需要的CU规格超出弹性资源上限(MAX)所设置的最大规格,您可以提交工单进行申请。
计费规则
CU计费有两种付费方式:按量付费和包年包月。
  • 按量付费

    先使用,后付费的一种付费方式。计费方式如下:

    1CU即1核4GB计算资源一个小时所消耗的费用为0.35元,最小的计费单位为1秒,费用按照1秒增量。
    • SQL引擎主要针对交互式分析,因此CU版无弹性,弹性资源上限(MAX)和长期保有资源(MIN)相同,最小为8CU,即8核32GB。所以我们会根据长期保有资源(MIN)规格进行按量收费。图片
    • Spark引擎是完全弹性,可以做到Job级别的弹性,因此创建CU版虚拟集群的时候,可以不保有任何的资源,即长期保有资源(MIN)可以为0CU。所以我们会根据您实际使用的CU规格进行按量收费。图片
    计费示例
    • Spark引擎:由于长期保有资源(MIN)为0,假设您实际使用4核16GB,即4CU,计算资源时间为3分钟,那么费用为4×0.05×0.35=0.07元。
    • SQL引擎:长期保有资源(MIN)选择8核32GB,您使用了8CU的弹性资源计算了3分钟,那么费用为8×0.05×0.35=0.14元。
  • 包年包月
    先付费,后使用的一种付费方式,具体计费方式及优惠如下表所示:
    购买时长 优惠 价格
    1—9个月 无折扣 140元/月/CU
    1年 8.5折 119元/月/CU
    2年 7折 98元/月/CU
    3年 5折 70元/月/CU
    说明 如果您选择了包年包月的计费方式,并且在所购买的时间内使用的CU规格超出了您当时长期保有资源(MIN)所选择的的规格,那么超出的这部分将会采用按量付费的方式进行费用计算。

    计费示例

    • Spark引擎:长期保有资源(MIN)选择8核32GB,弹性资源上限(MAX)选择32核128GB,购买时长为3个月。那么我们会事先在您的阿里云账户内扣除8×3×140=3360元。
      1. 在购买的3个月内,您没有使用超过8核32GB规格的CU,那么我们将不会扣除额外的费用。
      2. 在购买的3个月内,由于技术升级等原因,您使用了32核128GB规格的CU进行了一天的资源计算,那么我们将会额外收取(32-8)×0.35×24=201.6元。
    • SQL引擎: 长期保有资源(MIN)选择8核32GB,购买时长为3个月。我们会在您的阿里云账户内扣除8×3×140=3360元。

其他

元数据爬取,该功能可以帮忙您快速构建起围绕OSS存储(数据湖存储)的元数据体系,能极大的降低您构建元数据的成本,目前该功能可以免费使用。