全部产品
存储与CDN 数据库 安全 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 钉钉智能硬件
分析型数据库

1.3 使用DMS创建和管理表

更新时间:2017-06-07 13:26:11

前文中,我们已经创建了一个分析型数据库数据库,分析型数据库采用关系模型存储数据,也就是使用二维表来进行数据的组织和存储。像MySQL一样,将数据灌入分析型数据库前需要需要建立对应的数据表。而分析型数据库为了管理相关联的数据表,又引入了表组的概念。

表组是数据库的下一级实体,也是表的上一级。在分析型数据库中一个表必须从属于一个表组。关于表组的具体介绍我们会在3.2节中进行。在这里,我们首先创建一个表组。

在DMS for 分析型数据库中,右击左侧表组对象,选择新建表组,弹出新建表组对话框,弹出如下图所示内容,我们填写表组名为test_group,其余参数先暂时使用默认值。

P-1-3-1

点击确定建立好表组后,我们右击表组,选择新建表。在这里,我们根据测试数据的情况,建立一张有五列和一级分区的数据表。如下图所示:

P-1-3-2

在分析型数据库中,数据根据分区列进行分布式的存储和计算。举例来讲,我们在这里的原始数据是按照user_id较均匀的进行分布的,所以我们指定按照user_id进行hash分区,分区数调整为40个(一般来讲,每个分区的数据不超过800万条为宜,当然也不绝对,分区数不能超过256个)。表名和列名根实际情况填写,目前需要和源头数据表的字段名称一致。

另外,如果这个表的数据来源是批量的从其他系统导入(例如从ODPS),那么在更新方式一项,则选择批量更新,随后阅读1.4节中的导入数据部分。如果这个表的数据来源来自于直接的insert插入,那么在更新方式一项选择实时更新,随后阅读1.4节中的插入数据一项。

分析型数据库拥有强大的自动索引功能,用户在创建表时通常无需关心一个列的索引情况,分析型数据库会根据实际数据的分布情况来自动进行索引。所以这里我们先不调整列的索引设置。而表名任意填写,表组名选择我们刚刚创建的test_group,然后点击保存,弹出实际的建表DDL供校验。

有关表和列的详细说明,我们会在3.3和3.4节中稍后叙述。创建表完毕后,右击已有的表可以进行编辑。

本文导读目录