基于MaxCompute的数据仓库能力,您可以与阿里云其他产品集成,实现可视化开发、数据存储、数据迁移、机器学习、业务决策等能力,构建满足实际业务需求的解决方案。本文为您介绍支持与MaxCompute集成的各阿里云产品信息。

MaxCompute支持集成的阿里云产品如下。

阿里云产品 说明
DataWorks

DataWorks是基于MaxCompute计算和存储,提供工作流可视化开发、调度运维托管的一站式海量数据离线加工分析平台。您可以将DataWorks理解为MaxCompute的一种Web客户端,MaxCompute是DataWorks的一种计算引擎。

MaxCompute和DataWorks提供完善的ETL、数据分析、数据地图、数据治理和数据仓库管理能力,并支持SQL、MapReduce、Graph等多种经典的分布式计算模型,能够更快速地解决用户海量数据计算问题,有效降低企业成本,保障数据安全。

更多DataWorks信息,请参见DataWorks

数据集成

MaxCompute可以通过数据集成功能加载不同数据源(例如MySQL数据库)的数据,也可以通过数据集成把MaxCompute的数据导出到各种业务数据库。

数据集成功能已集成在DataWorks上,您可以直接在DataWorks上配置MaxCompute数据源并读写MaxCompute表。更多操作请参见配置MaxCompute数据源读取MaxCompute表写入MaxCompute表

更多数据集成信息,请参见数据集成

机器学习PAI

机器学习PAI是基于MaxCompute的一款机器学习算法平台,实现了数据无需搬迁,便可进行从数据处理、模型训练、服务部署到预测的一站式机器学习。您创建MaxCompute项目并开通机器学习服务后,即可通过机器学习平台的算法组件对MaxCompute数据进行模型训练等操作。

更多机器学习PAI信息,请参见机器学习PAI

Quick BI

Quick BI是一个专为云上用户量身打造的新一代智能BI服务平台。在MaxCompute上对数据进行加工处理后,您可以将MaxCompute项目添加为Quick BI数据源,即可在Quick BI页面制作报表,对MaxCompute表数据进行可视化分析。

更多Quick BI信息,请参见Quick BI

AnalyticDB MySQL版

AnalyticDB MySQL版是海量数据实时高并发在线分析(Realtime OLAP)云计算服务,与MaxCompute结合应用于大数据驱动业务系统的场景。通过MaxCompute离线计算挖掘,产出高质量数据后,导入分析型数据库,供业务系统调用分析。

将MaxCompute数据导入AnalyticDB MySQL版,有如下两种方式:

更多AnalyticDB MySQL版信息,请参见云原生数据仓库AnalyticDB MySQL版

表格存储

表格存储是构建在阿里云飞天分布式系统之上的分布式NoSQL数据存储服务,MaxCompute 2.0支持直接通过外部表方式访问表格存储中的表数据并进行处理,详情请参见OTS外部表

更多表格存储信息,请参见表格存储

对象存储OSS

对象存储OSS是海量、安全、低成本、高可靠的云存储服务,MaxCompute 2.0支持直接通过外部表方式访问对象存储中的表数据并进行处理,详情请参见OSS外部表

更多OSS信息,请参见对象存储OSS

开放搜索OpenSearch

开放搜索OpenSearch是一款阿里云自主研发的大规模分布式搜索引擎平台。您通过MaxCompute对数据进行计算处理后,可以在OpenSearch平台上通过添加数据源的方式将MaxCompute数据接入,详情请参见MaxCompute数据源配置

更多OpenSearch信息,请参见开放搜索OpenSearch

移动数据分析Quick A+ Digital Analytics

移动数据分析Quick A+ Digital Analytics是阿里云推出的一款移动App数据统计分析产品,为开发者提供一站式数据化运营服务。当移动数据分析自带的基础分析报表不能满足App开发者的个性化需求时,App开发者可以将数据一键同步至MaxCompute,结合自己的业务需求来进一步加工、分析数据。

更多Quick A+ Digital Analytics信息,请参见移动数据分析Quick A+ Digital Analytics

日志服务SLS

日志服务SLS能快速完成日志类数据采集、消费、投递以及查询分析等操作。日志数据采集后,需要更多的个性化分析、挖掘,您可以通过DataWorks的数据集成将日志服务数据同步到MaxCompute,通过MaxCompute对日志数据进行个性化、深层次的数据分析、挖掘。

更多SLS信息,请参见日志服务SLS

访问控制RAM
RAM是阿里云为客户提供的用户身份管理与资源访问控制服务。MaxCompute与RAM的集成使用主要有两个场景:
  • 通过DataWorks使用MaxCompute时,管理RAM用户。

    阿里云帐号开通并创建MaxCompute项目后,若需要通过DataWorks使用MaxCompute且多个账户协同开发,必须由阿里云帐号到RAM服务中创建RAM用户,将RAM用户添加为项目成员从而进行协同开发,详情请参见准备RAM用户添加工作空间成员和角色

  • MaxCompute处理非结构化数据时,通过RAM对非结构化数据进行授权。

    MaxCompute支持直接处理非结构化数据(包含OSS和表格存储),但是需要提前在RAM中授予MaxCompute访问OSS或表格存储的权限,详情请参见OSS外部表OTS外部表

阿里云产品支持的字符集

在同时使用MaxCompute和阿里云其他产品过程中,需要关注字符集格式,确保满足MaxCompute字符集格式要求,避免因使用了不支持的字符集导致产品无法正常使用。

产品名称 支持的字符集
MaxCompute UTF-8
DataWorks 在DataStudio中进行数据上传,支持UTF-8、GBK、CP936、ISO-8859,但在DataWorks中会统一为UTF-8。数据下载支持UTF-8、GBK。
数据集成
机器学习PAI UTF-8
Quick BI UTF-8
AnalyticDB MySQL版 UTF-8
表格存储 UTF-8
对象存储OSS UTF-8
开放搜索OpenSearch UTF-8
移动数据分析Quick A+ Digital Analytics UTF-8
日志服务SLS UTF-8
访问控制RAM 不涉及