云数据库POLARDB(POLARDB)是阿里云自研的下一代关系型云数据库,100%兼容MySQL,存储容量最高可达100 TB,性能最高提升至MySQL 的6倍。单库最多可扩展到16个节点,适用于企业多样化的数据库应用场景。Data Lake Analytics(DLA) 作为云上数据处理的枢纽,您可以在DLA中创建POLARDB Schema(POLARDB映射数据库),然后通过MySQL客户端或者MySQL命令行工具连接DLA,使用标准SQL语句读写POLARDB数据库数据。

准备工作

通过DLA读写POLARDB数据前,您需要通过以下操作在POLARDB中准备好测试数据。

  1. 创建PolarDB MySQL数据库集群
    注意
    • DLA和POLARDB所属地域必须相同。
    • 由于DLA将通过POLARDB的VPC连接POLARDB数据库,建议您创建POLARDB数据库集群时,网络类型选择VPC。
  2. 设置集群白名单
  3. 连接数据库集群
  4. 写入测试数据。
    本文示例在POLARDB中创建person表,并写入测试数据:
    ​CREATE TABLE person (
      id int(11) NOT NULL,
      name varchar(1023) NOT NULL,
      age int(11) NOT NULL,
      PRIMARY KEY (id)
    )
    insert into person 
      values (1, 'james', 10), 
             (2, 'bond', 20), 
             (3, 'jack', 30), 
             (4, 'lucy', 40);​

注意事项

在DLA中创建POLARDB数据库连接前,需要将IP地址段100.104.0.0/16加入到POLARDB白名单列表中,详情请参见设置集群白名单

由于您的POLARDB实例位于VPC内,默认情况下DLA无法访问该VPC中的资源。为了让DLA访问POLARDB,需要利用VPC反向访问技术,即在POLARDB白名单中添加100.104.0.0/16IP地址段。

注意 当您在POLARDB白名单中添加了100.104.0.0/16IP地址段,即视为您同意我们利用VPC反向访问技术读写POLARDB数据库数据。