表格存储是阿里云自研的多模型结构化数据存储,提供海量结构化数据存储以及快速的查询和分析服务。表格存储的分布式存储和强大的索引引擎能够提供PB级存储、千万TPS以及毫秒级延迟的服务能力。

基础概念

使用表格存储前,请了解如下基础概念。

基础概念 描述
实例 实例是使用和管理表格存储服务的实体,表格存储对应用程序的访问控制和资源计量都在实例级别完成。
读写吞吐量 读吞吐量和写吞吐量的单位为读服务能力单元和写服务能力单元,服务能力单元(简称CU)是数据读写操作的最小计费单位。
地域 地域是指阿里云物理数据中心所在的位置。
服务地址 每个表格存储实例对应一个服务地址,应用程序在进行表和数据操作时需要指定服务地址。

模型

表格存储提供多种模型,您可以根据业务需求选择对应的模型进行应用。表格存储提供如下几种模型。

模型 描述
Wide column模型 可应用于元数据、大数据等多种场景。支持数据版本、生命周期、主键列自增、条件更新、局部事务、原子计数器、过滤器等功能。
Timeline模型 针对消息数据场景设计的模型,可应用于IM、Feed流等消息场景。能满足消息场景对消息保序、海量消息存储、实时同步的需求,同时支持全文检索与多维度组合查询。
Timestream模型 针对时序场景设计的模型。
Grid模型 针对多维网格数据设计的模型,可实现对多维网格数据的存储、查询和管理。

功能

表格存储提供如下功能。

功能 描述
主键列自增 设置非分区键的主键列为自增列后,在写入数据时,无需为自增列设置具体值,表格存储会自动生成自增列的值。该值在分区键级别唯一且严格递增。
条件更新 只有满足条件时,才能对数据表中的数据进行更新;当不满足条件时,更新失败。
局部事务 创建数据范围在一个分区键值内的局部事务。对局部事务中的数据进行读写操作后,可以根据实际提交或者丢弃局部事务。
原子计数器 将列当成一个原子计数器使用,对该列进行原子计数操作,可用于为某些在线应用提供实时统计功能,例如统计帖子的PV(实时浏览量)等。
过滤器 在服务端对读取的结果再进行一次过滤,根据过滤器中的条件决定返回哪些行。由于只返回符合条件的数据行,所以在大部分场景下,可以有效降低网络传输的数据量,减少响应时间。
多元索引 基于倒排索引和列式存储,解决大数据的复杂查询难题。
聚合算子下推 表格存储提供Count/Sum/Max/Min/GroupBy的算子下推,在后端服务器提供统计聚合功能,直接将计算结果返回到客户端。
全局二级索引 支持在属性列创建索引。
通道服务 提供了增量、全量、增量加全量三种类型的分布式数据实时消费通道。可以实现对表中历史存量和新增数据的消费处理。
HBase支持 开源HBase API的Java应用可以通过Tablestore HBase Client直接访问表格存储服务。