计算与分析概述

表格存储支持通过MaxCompute、Spark、Hive或者HadoopMR、函数计算、Flink、Presto、表格存储多元索引以及表格存储SQL查询进行计算与分析。

分析工具选择

表格存储支持宽表模型时序模型等多种数据模型。使用不同数据模型时支持的分析工具不同,请根据实际场景选择相应分析工具。

分析工具

适用模型

操作

描述

MaxCompute

宽表模型

使用MaxCompute

通过MaxCompute客户端为表格存储的数据表创建外部表,即可访问表格存储中的数据。

Spark

宽表模型

使用Spark计算引擎

使用Spark计算引擎时,支持通过E-MapReduce SQL或者DataFrame编程方式访问表格存储

Hive或者HadoopMR

宽表模型

使用Hive或者HadoopMR

使用Hive或者HadoopMR访问表格存储中的数据。

函数计算

宽表模型

使用函数计算

通过函数计算访问表格存储,对表格存储增量数据进行实时计算。

Flink

  • 宽表模型

  • 时序模型

使用Flink

通过实时计算Flink访问表格存储中的源表、维表或者结果表,实现大数据实时计算与分析。

目前数据表支持作为源表、维表或者结果表,时序表只支持作为结果表。

PrestoDB

宽表模型

通过PrestoDB使用Tablestore

使用PrestoDB对接Tablestore后,基于PrestoDB on Tablestore您可以使用SQL查询与分析Tablestore中的数据、写入数据到Tablestore以及导入数据到Tablestore。

表格存储多元索引

宽表模型

多元索引

多元索引基于倒排索引和列式存储,可以解决大数据的多维查询和统计分析难题。当日常业务中有非主键列查询、多列组合查询、模糊查询等多维查询需求,以及求最值、统计行数、数据分组等数据分析需求时,您可以将这些属性作为多元索引中的字段,并使用多元索引查询与分析数据。

表格存储SQL查询

  • 宽表模型

  • 时序模型

使用SQL查询

SQL查询为多数据引擎提供统一的访问接口。通过SQL查询功能,您可以对表格存储中数据进行复杂的查询和高效的分析。

计费说明

CU模式(原按量模式)下,各个计算引擎访问表格存储,会根据具体的读写请求按照读写吞吐量计量计费。VCU模式(原预留模式)下,读写请求会消耗VCU的计算资源。更多信息,请参见计费概述