数据源是存储数据的物理数据库。通过创建数据源的方式,将业务数据引入Dataphin平台进行构建数据中台。同时您也可以将已构建完成的数据导入数据源。

数据源类型

目前,Dataphin支持的数据源类型,如下表所示。
类别 数据源类型
离线数据源 MaxCompute、MySQL、SQL Server、PostgreSQL、Oracle、HDFS、Hive、FTP、Vertica、DRDS、AnalyticDB、Elasticsearch、HBase_1_1_X、HBase_0_9_4、MongoDB、AnalyticDB for MySQL V3、AnalyticDB for PostgreSQL和LogHub。
实时数据源 MaxCompute、DRDS、DataHub、Aliyun_Hbase、Log_Service、Tablestore、Kafka_9_11和RocketMQ。
说明 如果您有其他类型的数据源诉求,请提工单并在工单上填写您需要的数据源版本及配置信息。

访问方式

Dataphin针对不同类型的数据源,支持不同的访问方式:
  • 公网数据库类型的数据源,支持公网IP或公网链接的访问方式,且数据库需开放并授予访问权限。
  • 阿里云数据库类型的数据源,支持VPC网络或公网IP的访问方式,且数据库需开放并授予访问权限或需指定授权IP白名单。
  • ECS(VPC)自建数据源类型的数据源,支持VPC网络的访问方式,且需指定授权IP白名单。
  • MaxCompute类型的数据源,支持Endpoint访问方式,且数据库需授权。
  • 其他类型数据源的访问方式,详情请参见新建离线数据源新建实时数据源
    说明 目前,Dataphin支持将Dataphin实例所在地域(华东2、华南1、北京2)的数据库配置为数据源。其他地域的阿里云VPC网络的数据源,可以通过开通公网访问或高速通道进行连接。
如果数据源的访问方式选择为VPC网络,则需要添加Dataphin的IP白名单。
区域 IP白名单
华东2(上海) 100.104.228.128/26、100.104.115.192/26
华南1(深圳) 100.104.48.128/26
华北2(北京) 100.104.238.64/26