背景信息以及准备工作

更新时间:2020-04-14 10:43:11

Data Lake Analytics支持接入Tablestore服务,通过标准SQL语句查询Tablestore中的数据或者直接向Tablestore写入数据。Tablestore是阿里云自研的NoSQL多模型数据库,支持多元索引查询。您可以在Data Lake Analytics中调用Tablestore API进行数据查询,例如点查询、范围查询等。同时,支持智能选择主表、二级索引表和多元索引表,大大提升查询性能,降低用户成本。

Tablestore与DLA数据类型对比

  • 数据库和表概念映射

    Tablestore DLA
    实例(instance) schema或database
    表(table) table
    主键列(pk) column,isPrimaryKey=true,isNullable=false
    非主键列(column) column,isPrimaryKey=false,isNullable=<用户通过DDL定义>
  • 字段映射关系

    Tablestore DLA
    INTEGER(8bytes) bigint(8bytes)
    STRING varchar
    BINARY varbinary
    DOUBLE double
    BOOLEAN boolean

准备工作

通过DLA读写Tablestore数据前,您需要通过以下操作在Tablestore中准备测试数据。

  1. 开通表格存储服务,请参见开通表格存储服务

  2. 创建Tablestore实例,请参见创建Tablestore实例

  3. 创建数据表,请参见创建数据表

  4. 绑定VPC,请参见绑定VPC

  5. 写入测试数据,请参见向表中写入数据

    本示例在Tablestore中创建nation表,并向nation中插入25条记录,如下图所示。

  6. 单击授权链接为DLA授予访问Tablestore数据源的权限。

    授权

操作步骤

请参见操作步骤