基本概念
本文介绍云原生数据仓库AnalyticDB MySQL版的基本概念。
地域
地域指数据中心所在的地理区域,通常按照数据中心所在的城市划分。例如,华北1(青岛)地域表示数据中心所在的城市是青岛。
可用区
可用区是指在同一地域内,电力和网络互相独立的物理区域。例如,华北1(青岛)地域支持2个可用区,包括青岛 可用区B和青岛 可用区C。同一可用区内实例之间的网络延时更小,其用户访问速度更快。
集群
集群是数据库之上的物理概念。一个集群下可以创建多个数据库,不同集群之间的数据库从物理上是隔离的。
节点
AnalyticDB MySQL版集群由若干节点组成。购买集群时,需要指定节点规格。节点规格决定每个节点的CPU、内存和存储容量,规格详情请参见产品系列。
EIU
弹性IO资源(Elastic IO Unit,简称EIU)是AnalyticDB MySQL版弹性模式集群版(新版)衡量实例存储性能的元单位。您可以在创建集群时购买EIU,也可以在扩容时单独购买EIU扩容存储资源。详情请参见弹性IO资源(EIU)扩容。
数据库
数据库是AnalyticDB MySQL版服务的基本单位。数据库在逻辑上由逻辑分区(Partition)组成,在物理上由物理节点(Node)组成。
账号
AnalyticDB MySQL涉及四种类型的账号。
阿里云账号(主账号):用于创建和管理集群,例如登录阿里云产品控制台、按量付费转包年包月、扩容集群以及删除集群等。
RAM用户(子账号):阿里云账号授予RAM用户一定的权限后,RAM用户也可以在权限范围内创建和管理集群。
数据库账号:数据库账号在权限范围内用于对数据库进行操作,例如创建数据库、删除数据库、连接数据库、创建表或删除表等。同一个集群中不能创建同名的数据库账号。
服务账号:如果在使用AnalyticDB MySQL版集群过程中需要阿里云技术支持对您的集群进行操作,您需要授权AnalyticDB MySQL版集群的服务账号,技术支持人员才可以通过服务账号提供技术支持服务。在授权有效期结束后,服务账号的权限会被自动回收。
表
AnalyticDB MySQL版的表分为分区表和维度表。
分区表
分区表又称普通表,用于存储业务数据的度量值。
AnalyticDB MySQL版根据分布键将数据打散在各个数据节点上。每个节点再根据分区键将数据文件拆分为不同的文件。如果业务明确有增量数据导入需求,创建分区表时可以同时指定分布键和分区键,来实现数据的增量同步。详情请参见创建表。
维度表
维度表是业务特性描述的集合,每个节点冗余一份。通常数据量小,变化频率低。
ACU
ACU(AnalyticDB Compute Unit)是AnalyticDB MySQL湖仓版(3.0)分配计算资源和存储资源的最小单位。一个ACU约等于1核 4 GB。
特征向量
向量是一种将实体和应用代数化的表示。向量将实体间的关系抽象成向量空间中的距离,距离的远近代表相似程度。例如:身高、年龄、性别、地域等。在AnalyticDB MySQL中,特征向量的数据类型为数组,仅支持固定长度数组。 只支持:float[]
、byte[]
、smallint[]
三种数据类型。
向量检索
在特征向量数据集合中进行快速搜索和匹配的方法。
向量索引
特定类型的索引。
距离计算
特定类型的自定义函数,每个距离计算公式对应一个自定义函数。例如:L2_DISTANCE()
。
KNN
KNN(K-Nearest Neighbor)算法用于查找特征向量数据集合中离查询点最近的 K 个点。
RNN
RNN(Radius Nearest Neighbor)算法用于查找特征向量数据集合中查询点某半径范围内的所有点。