什么是云原生数据仓库AnalyticDB MySQL版
云原生数据仓库 AnalyticDB MySQL 版(以下简称AnalyticDB for MySQL)是全托管的PB级实时数仓,支持毫秒级数据更新和亚秒级查询响应,高度兼容MySQL协议。
AnalyticDB for MySQL基于湖仓一体架构,无论是数据湖中的非结构化或半结构化数据,还是数据仓库中的结构化数据,都能统一高效地处理,帮助企业构建全面的数据分析平台。它不仅支持大规模离线数据处理以满足深度洞察需求,同时也提供高性能在线分析能力,帮助企业快速响应业务变化,实现降本增效。
AnalyticDB for MySQL可以帮您完成哪些工作
将各种结构化、半结构化、非结构化数据导入AnalyticDB for MySQL进行多源融合分析。 | 从PolarDB、RDS、Kafka、SLS等数据源实时同步数据到AnalyticDB for MySQL。 |
从数据源抽取数据,并经过清洗转换后,加载到AnalyticDB for MySQL。通过调度工具(DMS、DataWorks、Airflow、DolphinScheduler和Azkaban等)实现周期性ETL处理。 | AnalyticDB for MySQL集成了Spark计算引擎。您可以基于Spark SQL查询结构化数据,利用Spark JAR包开发复杂批处理任务,或通过PySpark执行机器学习及数据科学计算。 |
为什么选择AnalyticDB for MySQL
支持丰富的数据源
AnalyticDB for MySQL支持关系型数据库、NoSQL数据库、大数据平台、存储、日志文件、消息队列、文本文件等多种数据源。
类型 | 数据源 |
关系型数据库 | 云数据库RDS MySQL |
云数据库RDS SQL Server | |
云原生数据库PolarDB MySQL版 | |
云原生数据库PolarDB分布式版(简称“PolarDB-X”) | |
自建MySQL数据库 | |
自建Oracle数据库 | |
非关系型数据库 | 云数据库MongoDB |
云原生多模数据库Lindorm | |
自建HBase数据库 | |
大数据 | MaxCompute |
Flink | |
Hive | |
存储 | OSS |
AWS S3 | |
Azure Blob Storage | |
Google Cloud Storage | |
表格存储Tablestore | |
HDFS | |
日志 | 日志服务SLS |
Logstash | |
消息队列 | Kafka |
本地文件 | 文本文件 |
如何将数据源的数据导入AnalyticDB for MySQL,请参见数据导入。
无缝集成多种客户端、驱动、BI和调度工具
AnalyticDB for MySQL兼容MySQL协议,因此可以无缝集成大部分支持MySQL协议的客户端、驱动、BI工具和调度工具。
类别 | 工具 |
客户端 | |
驱动 | |
BI工具 | |
调度工具 |
|
优秀的性能表现
支持秒级甚至毫秒级对海量数据进行查询和计算,复杂SQL查询速度相比传统的关系型数据库快10倍。
超大规模数据写入实时可见,确保数据的强一致性。
自动弹性与扩容
AnalyticDB for MySQL采用云原生技术架构,实现了存储计算分离,计算资源和存储资源可独立扩缩容。
保障企业数据的安全与合规
AnalyticDB for MySQL从权限、连接、加密、审计、备份等多方面确保了企业数据的安全和合规。下文列举了安全与合规方面的部分重要特性。
类别 | 特性 | 描述 |
权限管理 | 阿里云账号授予RAM用户一定的权限后,RAM用户可以在权限范围内创建和管理集群。例如登录AnalyticDB for MySQL控制台、创建或删除集群、设置白名单等。 | |
支持集群全局级别、数据库级别、表级别、列级别四个粒度的权限,针对不同的权限粒度应授予不同的权限,以达到权限控制的目的。 | ||
数据安全 | 默认禁止所有IP地址访问AnalyticDB for MySQL集群。在访问AnalyticDB for MySQL集群前,需将客户端IP地址添加到白名单中,以便客户端能够访问该集群。 | |
为了提高链路安全性,您可以启用SSL(Secure Sockets Layer)加密,并下载安装CA证书到所需要的应用服务中。SSL在传输层对网络连接进行加密,能提升通信数据的安全性和完整性,防止数据被第三方监听、截取和篡改。 | ||
云盘加密功能开启后,系统会基于块存储对整个数据盘进行加密,即使数据备份泄露也无法被解密,保护集群数据安全。 | ||
SQL审计功能可以实时记录数据库的DML和DDL操作信息,便于及时发现异常操作,定位数据库性能瓶颈。 | ||
备份恢复 | 自动开启数据备份,实现集群级别的周期性自动数据备份。 | |
支持将备份集的数据恢复到新集群。 | ||
监控报警 | 支持调用API或登录控制台查看指定时间段的各项监控指标,包括CPU使用率、计算内存使用率、磁盘使用率、响应时间等,以便您掌握集群的性能和运行状况。 | |
支持调用API或登录云监控控制台查看Spark集群的运行指标,以便您及时掌握Spark的性能和运行状况。 | ||
当监控指标达到阈值时,及时通知报警联系人,以便企业快速处理报警问题。 |
完整的功能特性列表,请参见功能特性。
了解定价
AnalyticDB for MySQL的费用由预留资源费用、弹性资源费用、存储空间费用、缓存空间费用、备份空间费用组成。
了解各计费项的详细说明,请参见企业版和基础版计费项。
了解各计费项的价格,请参见企业版和基础版产品定价。
创建集群
AnalyticDB for MySQL包含两个产品系列:企业版和基础版。两者在功能特性上没有区别。唯一的区别:企业版为多副本,预留节点数只能为3的倍数,可用于生产环境;基础版为单副本,预留节点数只能为1,仅适用于学习和测试。
阅读文档:创建企业版或基础版集群,创建属于您的AnalyticDB for MySQL集群。
上手使用
我们为不同的用户角色准备了不同的文档教程。您可以参考下列文档完成任务。
数据库管理员
管理数据库的用户与权限
管理数据库的访问白名单
审计DML和DDL操作
设置备份的周期与频率,防止数据丢失
数据开发工程师
数据分析师
算法工程师
使用PySpark完成大规模数据的预处理、清洗、转换、数据集联接合并等