< 文档首页
E-MapReduce
动态与公告
文档最新动态
产品简介
什么是E-MapReduce
产品优势
产品架构
使用场景
使用限制
发行版本
版本概述
版本说明(EMR-4.x系列)
EMR-4.8.x版本说明
EMR-4.6.x版本说明
EMR-4.5.x版本说明
EMR-4.4.1版本说明
EMR-4.4.0版本说明
EMR-4.3.0版本说明
版本说明(EMR-3.x系列)
EMR-3.34.x版本说明
EMR-3.33.x版本说明
EMR-3.32.x版本说明
EMR-3.30.x版本说明
EMR-3.29.x版本说明
EMR-3.28.x版本说明
EMR-3.27.x版本说明
EMR-3.26.x版本说明
EMR-3.25.x版本说明
EMR-3.24.x版本说明
EMR-3.23.x版本说明
EMR-3.22.x版本说明
EMR-3.22.x之前版本说明
产品定价
费用组成
按量计费
包年包月
到期与欠费
续费流程
按量转包月
快速入门
入门概述
准备工作
创建集群
创建并运行作业
集群管理
集群规划
选型配置说明
实例类型
配置EMR角色
角色授权
EMR服务角色
ECS应用角色(EMR 3.32及之前版本和EMR 4.5及之前版本)
ECS应用角色(EMR 3.32之后版本和EMR 4.5之后版本)
使用自定义ECS应用角色访问同账号云资源
用户管理
RAM用户授权
组件角色部署
Gateway实例说明
ECS实例说明
存储说明
本地盘机型概述
经典网络与VPC互访
集群容灾能力
集群配置
创建集群
创建Gateway
查看集群列表与详情
扩容集群
缩容集群
释放集群
管理集群标签
使用资源组
集群续费管理
使用SSH连接主节点
访问Web UI
通过SSH隧道方式访问开源组件Web UI
访问链接与端口
查看服务列表
组件参数配置
软件自定义配置
集群脚本
安全组
管理集群资源
集群资源概述
Capacity Scheduler使用说明
Fair Scheduler使用说明
配置弹性伸缩
弹性伸缩概述
新建弹性伸缩机器组
管理弹性伸缩
按时间伸缩规则配置
按负载伸缩规则配置
查看弹性伸缩记录
设置弹性伸缩监控告警
配置专有网络
集群服务管理页面
服务管理
添加服务
重启服务
变更配置
升级节点配置
磁盘扩容
移除异常节点
新增机器组
第三方软件
引导操作
集群运维
状态表
集群端口配置
集群运维指南
常用文件路径
集群管理常见问题
集群类型
Hadoop集群
SmartData
Alluxio
Hudi
Kudu
Zeppelin
Oozie
ZooKeeper
OpenLDAP
Flink(VVR)
Sqoop
Knox
Superset
HDFS
HBase
Tez
Livy
Phoenix
Spark
简介
管理LDAP认证
Hive
简介
Hive基础操作
Hive连接方式
管理LDAP认证
Impala
简介
连接Impala
管理LDAP认证
ESS
简介
Delta
EMR Delta概述
快速入门
应用场景
场景一:流式入库
场景二:数据同步
场景三:冷热分层
基本操作
批式读写
流式读写
管理数据
优化表
转换表
修改表
数据质量与Schema演化
访问历史信息
使用Hive读Delta table
使用Presto读Delta table
附录
附录1 重要参数介绍
附录2 优化建议
附录3 常见问题
Presto
简介
系统组成
基本概念
通过命令行工具访问Presto
使用JDBC
通过Gateway访问Presto
管理LDAP认证
Flume
简介
同步HDFS Audit日志至HDFS
同步EMR Kafka数据至HDFS
同步EMR Kafka数据至Hive
同步EMR Kafka数据至HBase
配置说明
同步EMR Kafka数据至OSS
同步LogHub数据至HDFS
Hue
使用说明
Hue对接LDAP
Hue连接开启LDAP认证的引擎
实现Hue多实例负载均衡
配置Hue访问Presto服务
管理LDAP认证
Ranger
概述
组件集成
HDFS配置
HBase配置
Hive配置
Spark配置
Presto配置
Impala配置
YARN配置
Ranger对接LDAP
Ranger Usersync集成LDAP
Ranger Admin集成LDAP
管理LDAP认证
Hive数据脱敏
Kerberos
概述
兼容MIT Kerberos认证
RAM认证
数据开发认证
跨域互信
组件授权
HDFS授权
YARN授权
Hive授权
HBase授权
Kafka集群
Kafka
概述
跨集群访问Kafka
使用Kafka Ranger
使用SSL连接Kafka
Kafka常见问题
Kafka Manager
ZooKeeper
OpenLDAP
Knox
Ranger
概述
Kafka配置
Ranger对接LDAP
Ranger Usersync集成LDAP
Ranger Admin集成LDAP
Hive数据脱敏
组件授权
Kafka授权
ZooKeeper集群
ZooKeeper
DataScience集群
概述
PAI-Alink
Alink调度
Faiss-Server
AutoML
TensorFlow
Jupyterhub
部署TensorFlow模型至PAI EAS
ds-controller使用
使用教程
分布式Inference解决方案
分布式XGBoost训练
分布式Mnist训练
使用AutoML优化XGBoost训练
DataScience的推荐解决方案介绍
Druid集群
Druid
概述
使用Druid
数据格式描述文件
Kafka Indexing Service
SLS Indexing Service
常见问题
Superset
ZooKeeper
Knox
OpenLDAP
Dataflow集群
概述
Flink-Vvp
支持的上下游存储
访问Flink-Vvp的Web UI
Flink SQL作业
作业开发
作业提交
管理自定义函数(UDF)
Flink Datastream作业
作业开发
作业提交
运维管理
作业运维
查看作业日志
配置自动调优
ZooKeeper
Knox
OpenLDAP
Data Development集群
概述
创建集群
快速入门
交互式开发教程
Spark
Flink
Hive
Presto
Shell
TPCH和TPCDS
生产调度
数据开发
简介
项目管理
作业编辑
工作流编辑
临时查询
运维中心
集群模板
云监控事件编码
作业
作业日期设置
Shell作业配置
Hive作业配置
Hive SQL作业配置
Spark作业配置
Spark SQL作业配置
Spark Shell作业配置
Spark Streaming作业配置
Hadoop MapReduce作业配置
Sqoop作业配置
Pig作业配置
Flink(VVR)作业配置
Streaming SQL作业配置
Presto SQL作业配置
Impala SQL作业配置
数据开发常见问题
元数据管理
Hive元数据管理
Hive统一元数据
Hive元数据基本操作
配置独立RDS
数据湖元数据
Hive元数据迁移
从统一元数据库迁出到用户自建的RDS实例
Kafka元数据管理
元数据管理常见问题
监控与报警
监控大盘
概述
仪表盘
事件列表
集群监控
服务监控
概述
HDFS监控
YARN监控
Hive监控
Zookeeper监控
Spark监控
Druid监控
Kafka监控
作业监控
日志搜索
查询自定义指标
配置事件订阅
订阅事件编码对照表
报警管理
管理集群报警
服务状态接入云监控
开发指南
准备
开发准备
OSS参考使用说明
示例项目使用说明
Python使用说明
Spark
准备工作
参数说明
Spark对接OSS
Spark对接MaxCompute
Spark对接RocketMQ
Spark对接Table Store
Spark对接LogService
开发入门
实时Spark Streaming消费示例
离线Spark消费示例
Spark对接MNS
Spark对接HBase
Spark对接Kafka
Spark对接MySQL
Spark对接DataHub
Spark-Submit参数设置说明
Spark Streaming SQL
简介
流式查询
作业模板(EMR-3.23.0及之后版本)
作业模板
流式查询配置说明
DDL概述
建表语句
SCAN语句
STREAM语句
查询概述
SELECT语句
WHERE语句
GROUP BY语句
JOIN语句
WATERMARK语句
UNION ALL语句
DML概述
MERGE INTO
INSERT INTO
窗口函数
概述
滚动窗口
滑动窗口
数据源
数据源支持概述
HBase数据源
JDBC数据源
Kafka数据源
Loghub数据源
TableStore数据源
Druid数据源
Redis数据源
DataHub数据源
内建函数
DTS_BINLOG_PARSER
Flink SQL参考
关键字
创建数据视图
DDL语句
创建数据源表
Datagen源表
日志服务SLS源表
消息队列Kafka源表
数据总线DataHub源表
全量MaxCompute源表
增量MaxCompute源表
消息队列RocketMQ版源表
交互式分析Hologres源表
全量Elasticsearch源表
Postgres的CDC源表
MySQL的CDC源表
创建数据结果表
Blackhole结果表
日志服务SLS结果表
消息队列Kafka结果表
数据总线DataHub结果表
表格存储Tablestore结果表
MaxCompute结果表
消息队列RocketMQ版结果表
云数据库HBase版结果表
云数据库Redis版结果表
交互式分析Hologres结果表
云数据库MongoDB版结果表
Elasticsearch结果表
Phoenix5结果表
云数据库RDS MySQL结果表
云原生数据仓库AnalyticDB MySQL版3.0结果表
创建数据维表
云数据库HBase版维表
表格存储Tablestore维表
MaxCompute维表
云数据库Redis版维表
Elasticsearch维表
交互式分析Hologres维表
云数据库RDS MySQL维表
云原生数据仓库AnalyticDB MySQL版3.0维表
DML语句
INSERT INTO语句
Multi INSERT语句
QUERY语句
SELECT语句
WHERE语句
HAVING语句
GROUP BY语句
JOIN语句
维表JOIN语句
UNION ALL语句
TopN语句
去重语句
自定义函数(UDX)
概述
自定义标量函数(UDF)
自定义聚合函数(UDAF)
自定义表值函数(UDTF)
窗口函数
概述
滚动窗口
滑动窗口
会话窗口
OVER窗口
内置函数
Hadoop
参数说明
MapReduce开发手册
Hive开发手册
Pig开发手册
Hadoop Streaming
Hive + TableStore
MR+TableStore
HBase
访问HBase
备份HBase集群
最佳实践
SmartData
迁移Hadoop文件系统数据至JindoFS
使用MapReduce处理JindoFS上的数据
使用Hive查询JindoFS上的数据
使用Spark处理JindoFS上的数据
使用Flink处理JindoFS上的数据
使用Impala/Presto查询JindoFS上的数据
使用JindoFS作为HBase的底层存储
基于JindoFS存储YARN MR/SPARK作业日志
将Kafka数据导入JindoFS
跨集群访问JindoFS
改写Jindo HDFS客户端路径
支持Flink可恢复性写入JindoFS或OSS
使用Flume写入JindoFS
集群管理
为集群配置安全组
使用YARN CGroups功能对CPU进行控制测试
OSS数据权限隔离
数据开发
通过Presto查询RDS或MySQL数据库
使用E-MapReduce采集Kafka客户端Metrics数据
使用E-MapReduce处理离线作业
SparkSQL自适应执行
E-MapReduce数据迁移方案
通过Flink作业处理OSS数据
使用E-MapReduce Hive关联云HBase
使用E-MapReduce进行MySQL Binlog日志准实时传输
Gateway节点运行Flume进行数据同步
在EMR上使用Sqoop与数据库同步数据时的网络配置
通过Spark Streaming作业处理Kafka数据
通过Kafka Connect进行数据迁移
E-MapReduce本地盘实例大规模数据集测试
通过Hive作业处理TableStore数据
通过JDBC连接HiveServer2来访问Hive数据
自建Hadoop数据迁移到阿里云E-MapReduce
E-MapReduce弹性低成本离线大数据分析
自建Hive数据仓库迁移到阿里云E-MapReduce
通过PyFlink作业处理Kafka数据
SmartData
概述
JindoFS介绍和使用
SmartData 3.4.x
SmartData 3.4.x版本简介
JindoFS Block模式
Block模式使用说明
使用RocksDB作为元数据后端
使用Raft-RocksDB-Tablestore作为存储后端
AuditLog使用说明
访问JindoFS Web UI
权限功能
数据管理策略
文件元数据离线分析
JindoFS Credential Provider使用说明
JindoFS Block模式加密使用说明
JindoFS Cache模式
Cache模式使用说明
使用JindoFS SDK免密功能
AuditLog使用说明
Jindo Job Committer使用说明
JindoFS OSS Credential Provider使用说明
访问JindoFS Web UI
权限功能
JindoTable
开启ORC查询加速
JindoTable使用说明
JindoCube使用说明
JindoTable表分区访问热度收集
工具集
FUSE使用说明
Jindo DistCp使用说明
Jindo DistCp场景化使用指导
分层存储命令使用说明
SmartData 3.2.x
SmartData 3.2.x版本简介
JindoFS Block模式
Block模式使用说明
使用RocksDB作为元数据后端
使用Raft-RocksDB-Tablestore作为存储后端
AuditLog使用说明
访问JindoFS Web UI
权限功能
数据管理策略
文件元数据离线分析
JindoFS Cache模式
Cache模式使用说明
使用JindoFS SDK免密功能
AuditLog使用说明
Jindo Job Committer使用说明
Credential Provider使用说明
访问JindoFS Web UI
权限功能
JindoTable
开启ORC查询加速
JindoTable使用说明
JindoCube使用说明
JindoTable表分区访问热度收集
工具集
FUSE使用说明
Jindo DistCp使用说明
Jindo DistCp场景化使用指导
分层存储命令使用说明
SmartData 3.1.x
SmartData 3.1.x版本简介
JindoFS Block模式
Block模式使用说明
使用RocksDB作为元数据后端
使用Raft-RocksDB-Tablestore作为存储后端
AuditLog使用说明
访问JindoFS Web UI
权限功能
数据管理策略
文件元数据离线分析
JindoFS Cache模式
Cache模式使用说明
使用JindoFS SDK免密功能
AuditLog使用说明
Jindo Job Committer使用说明
Credential Provider使用说明
访问JindoFS Web UI
权限功能
JindoTable
JindoTable使用说明
JindoTable表或分区的访问热度收集
JindoCube使用说明
工具集
FUSE使用说明
Jindo DistCp使用说明
Jindo DistCp场景化使用指导
分层存储命令使用说明
SmartData 3.0.x
SmartData 3.0.x版本简介
JindoFS Block模式
JindoFS Block模式使用说明
使用RocksDB作为元数据后端
使用Raft-RocksDB-Tablestore作为存储后端
访问JindoFS Web UI
权限功能
AuditLog使用说明
文件元数据离线分析
JindoFS Cache模式
JindoFS缓存模式使用说明
使用JindoFS SDK免密功能
访问JindoFS Web UI
JindoFS权限功能
Jindo Job Committer使用说明
JindoFS AuditLog使用说明
Credential Provider使用说明
JindoTable
JindoTable使用说明
JindoCube使用说明
工具集
JindoFS FUSE使用说明
分层存储命令使用说明
Jindo DistCp使用说明
Jindo DistCp场景化使用指导
SmartData 2.7.3-2.7.4
JindoFS Block模式
Block模式使用说明
使用Tablestore作为存储后端
使用RocksDB作为元数据后端
使用Raft-RocksDB-Tablestore作为存储后端
JindoFS权限功能
Jindo AuditLog使用说明
JindoFS Cache模式
JindoFS缓存模式使用说明
使用JindoFS SDK免密功能
Jindo Job Committer使用说明
JindoFS权限功能
Jindo AuditLog使用说明
JindoTable
JindoCube使用说明
工具集
Jindo DistCp使用说明
FUSE使用说明
SmartData 2.6.0-2.7.2
SmartData 2.6.0-2.7.2版本简介
JindoFS Block模式
JindoFS块存储模式使用说明
使用Tablestore作为存储后端
使用RocksDB作为元数据后端
使用Raft-RocksDB-Tablestore作为存储后端
JindoFS权限功能
JindoFS Cache模式
JindoFS缓存模式使用说明
JindoFS权限功能
Jindo Job Committer使用说明
JindoTable
JindoCube使用说明
工具集
Jindo DistCp使用说明
SmartData 2.2.x及之前版本
SmartData使用说明(EMR-3.20.0~3.22.0版本)
SmartData使用说明(EMR-3.22.0~3.25.1版本)
JindoFS块存储模式
JindoFS缓存模式
使用JindoFS SDK免密功能
JindoFS外部客户端
SmartData常见问题
API参考
API概览
调用说明
请求结构
公共参数
签名机制
返回结果
集群
创建集群
创建集群模板
通过模版创建集群
删除集群模版
查询集群模版详情
查询集群基本信息
查询集群信息
查询集群主机列表
查询集群列表
查询集群模版列表
查询服务的快捷链接
查询集群机器组列表
查询可用集群信息列表
查询可用资源
查看EMR版本信息
修改集群模版
修改集群名称
释放集群
集群扩容
加入资源组
集群缩容
集群服务
添加服务
修改伸缩配置项
创建资源池
创建资源队列
删除指定资源池
删除资源队列
查看集群操作日志
查看资源池策略类型
查询服务信息
查询服务配置详情
查询集群服务配置标签
查询组件列表
查询集群的操作历史列表
查看指定主机的任务列表
查询操作历史的主机列表
查询集群已安装服务列表
查询指定主机的任务列表
查看集群支持的服务列表
查询集群的服务列表
查看健康信息列表
查询服务配置的修改历史
查询资源池列表
修改集群指定服务的配置信息
更新资源池
修改资源池调度类型
修改资源队列
同步资源池并配置到集群
运行指定操作
弹性伸缩
创建伸缩组
新建弹性伸缩配置项
修改伸缩组
查看伸缩组
查看伸缩配置项
查看伸缩活动
查询伸缩配置项详情
查看伸缩组实例详情
查询伸缩组详情
操作伸缩组实例
删除弹性伸缩配置项
标签
创建并绑定标签
查询标签列表
解绑标签
数据开发
克隆工作流
克隆作业
创建工作流目录文件夹
创建工作流
创建作业
创建数据开发项目
创建项目集群设置
添加项目用户
删除工作流
删除工作流目录
删除作业
删除数据开发项目
删除项目集群设置
删除项目用户
查询工作流信息
查询目录信息
获取目录树
获取工作流实例信息
查询作业信息
查询节点实例详情
查询节点实例容器日志
查询节点实例启动器日志
查询项目详情
查询项目设置详情
停止作业实例
查询工作流列表
查询项目中可用的集群列表
查询数据开发中可用的集群列表
获取提交代理节点列表
查询可提交作业的客户端列表
查询工作流实例列表
查询作业列表
查询作业运行实例列表
查询工作流节点实例列表
查询节点实例的容器状态详情
查询节点实例SQL结果
查询项目列表
查询项目集群设置列表
查询项目用户信息
修改工作流
查询工作流目录
修改项目集群设置
重命名目录
修改图形信息的工作流
修改数据开发项目
修改作业
重试工作流
恢复工作流
提交运行工作流
提交运行作业
暂停工作流
常用API教程
创建集群
修改集群配置
扩容集群
管理项目
编辑作业
运行工作流
SDK参考
E-MapReduce SDK发布说明
Java SDK
SDK下载
快速开始
示例项目
Python SDK
安装SDK
样例代码
常见问题
常见问题汇总
视频专区
E-MapReduce基本介绍
创建并运行作业
快速运行一个实时作业
创建集群
使用数据开发编写工作流
相关协议
服务条款
全部产品
弹性计算
云服务器 ECS
轻量应用服务器
GPU云服务器
FPGA云服务器
专有宿主机
弹性容器实例
弹性云桌面
弹性高性能计算E-HPC
批量计算
弹性伸缩
资源编排
运维编排服务
服务器迁移中心
弹性加速计算实例EAIS
函数计算
Serverless应用引擎
Serverless工作流
云盒
存储
阿里云存储服务
对象存储 OSS
日志服务
文件存储 NAS
文件存储 CPFS
文件存储 HDFS
数据库文件存储
相册与网盘服务
表格存储 Tablestore
智能媒体管理
离线迁移服务(闪电立方)
在线迁移服务
混合云备份服务
混合云容灾服务
云存储网关
混合云存储阵列
智能云相册
数据库
PolarDB MySQL 云原生数据库
PolarDB-O 云原生数据库
PolarDB PostgreSQL 云原生数据库
PolarDB-X 云原生分布式数据库
云数据库 RDS
云数据库 OceanBase
云数据库专属集群 MyBase
云原生多模数据库 Lindorm
云数据库 Redis
云数据库 MongoDB
云数据库 HBase
云数据库 Cassandra
时序数据库 TSDB
图数据库 GDB
云数据库 Memcache
可信账本数据库 LedgerDB
云原生数仓 AnalyticDB MySQL
云原生数仓 AnalyticDB PostgreSQL
云数据库 ClickHouse
云原生数据湖分析 DLA
数据传输服务 DTS
数据管理 DMS
数据库备份 DBS
数据库自治服务 DAS
数据库网关 DG
数据库专家服务
数据库和应用迁移服务 ADAM
HybridDB for MySQL
安全
阿里云安全产品和技术
DDoS防护
Web 应用防火墙
SSL证书
云安全中心
云防火墙
堡垒机
漏洞扫描
操作审计
终端访问控制系统
访问控制
应用身份服务
数据库审计
加密服务
数据安全中心
内容安全
密钥管理服务
风险识别
实人认证
游戏盾
安全管家
先知(安全众测)
安骑士
阿里云验证码
金融级实人认证
智能核身(增强版)
云安全访问服务
威胁情报
特权访问服务
大数据
MaxCompute
E-MapReduce
阿里云Elasticsearch
数据湖构建
实时计算Flink版
交互式分析Hologres
Databricks数据洞察
开放搜索
图计算服务
DataWorks
智能数据构建与管理 Dataphin
Quick BI
DataV数据可视化
智能推荐
智能用户增长
数据资源平台
DataHub
公众趋势分析
隐私增强计算
人工智能
机器学习PAI
卫星及无人机遥感影像分析产品
图像搜索
视觉计算服务
智能视觉生产
城市视觉智能引擎
多媒体AI
智能语音交互
印刷文字识别
自然语言处理
交通云控平台
工业大脑开放平台
机器翻译
人工智能众包
全息空间
智能语义理解
视频内容检索
语言协同平台
三维空间重建
阿里云视觉智能开放平台
网络与CDN
网络介绍
专有网络 VPC
云解析 PrivateZone
负载均衡
NAT 网关
弹性公网 IP
IPv6转换服务
共享带宽
共享流量包
云企业网
全球加速
智能接入网关
高速通道
CDN
全站加速
SCDN
PCDN
边缘节点服务ENS
IPv6网关
VPN网关
私网连接 PrivateLink
任播弹性公网IP
云网管
视频服务
视频直播
视频点播
音视频通信
云视频会议
媒体处理
视频监控
智能视觉
智能媒体生产
容器与中间件
容器服务Kubernetes版
服务网格 ASM
容器镜像服务 ACR
企业级分布式应用服务 EDAS
微服务引擎MSE
应用配置管理 ACM
全局事务服务 GTS
云服务总线CSB
消息队列RocketMQ版
事件总线EventBridge
消息队列Kafka版
消息队列RabbitMQ版
微消息队列 MQTT 版
消息服务MNS
分布式任务调度 SchedulerX
开发与运维
应用实时监控服务ARMS
Prometheus监控
云监控
应用高可用服务 AHAS
智能顾问
Node.js 性能平台
链路追踪Tracing Analysis
Web应用托管服务
性能测试 PTS
移动测试
应用发现服务
移动研发平台EMAS
移动DevOps
移动热修复
崩溃分析
性能分析
远程日志
移动推送
移动数据分析
移动用户反馈
HTTPDNS
OpenAPI Explorer
云命令行
逻辑编排
Alibaba Cloud Toolkit
云效
云效2020
资源管理
小程序云
全局流量管理
配置审计
管理控制台
IT治理样板间
云架构设计工具
配额中心
全域用户行为洞察分析平台
API与工具
阿里云CLI
.NET SDK
Ansible
阿里云交易和账单管理API
云开发平台
CodePipeline
Go SDK
Java SDK
Node.js SDK
PHP SDK
Pulumi
Python SDK
集成开发最佳实践
Terraform
工单系统API
物联网
阿里云物联网平台
设备接入Link SDK
IoT物联网操作系统
IoT设备身份认证
物联网应用开发
物联网数据分析
物联网边缘计算
视频边缘智能服务
物联网络管理平台
物联网无线连接服务
IoT安全运营中心
IoT可信执行环境
IoT固件安全检测
IoT安全解决方案
IoT可信服务管理
生活物联网平台
AIoT开放平台
物联网应用托管服务
物联网应用服务
智联车管理云平台
物联网行业方案
工业互联网平台
物联网市场
阿里云IoT技术认证
数字社区平台
线下广告投放平台
AIoT数字园区引擎
专有云
企业版
敏捷版
敏捷大数据版
一体机
专有云(线下)
移动研发平台EMAS-专有云
Native DevOps
跨平台 DevOps
移动API网关
通道服务
远程配置
移动监控
移动测试
移动热修复
移动数据分析
移动推送
企业应用与服务
Teambition
云投屏
机器人流程自动化RPA
云行情
工业视觉智能
货架商品识别与管理
政务钉钉
地址标准化
IP地理位置库
云游戏平台
备案
云 AP
API 网关
邮件推送
云价签
专属钉钉解决方案
区块链服务 BaaS
可信计算服务
分布式数字身份
跨链数据连接服务
短信服务
语音服务
智能联络中心
号码隐私保护
号码认证服务
号码百科
云通信网络加速
云呼叫中心
智能对话机器人
智能外呼机器人
智能语音导航
智能对话分析
云客服
智能双录质检
Linkedmall
鹿班
智能数据助理
云市场
云码(广告营销)
新零售智能助理
数字金融
移动开发平台 mPaaS
金融分布式架构 SOFAStack
SOFAStack 微服务
SOFAStack API 统一网关
金融云
域名与网站
域名
云虚拟主机
云解析 DNS
阿里云公共DNS
企业邮箱
弹性 Web 托管
ICP许可证
EDI许可证
食品经营许可证
云·速成美站
云·企业官网
资质管家服务
网络文化经营许可证(文网文)
CDN经营许可证
IDC经营许可证
SP经营许可证
ISP经营许可证
高新技术企业认定
工商财税与知识产权
阿里云商标服务
工商注册服务
软件著作权登记
图片服务
代理记账
智能logo设计
智能财税
解决方案
SAP 解决方案
通用解决方案
阿里政务云
MindSphere on Alibaba Cloud
会员服务
财务
用户中心
账号管理
费用中心
会员积分
活动
云大使推荐返现
飞天会员
更多
支持与服务
信任中心
阿里云App
阿里云图标
法律条款
阿里云规则
Red Hat云接入和Windows许可证
阿里云认证
首页
>
E-MapReduce
>
最佳实践
>
数据开发
数据开发
更新时间:2020-03-31 13:50
我的收藏
新浪微博
微信
钉钉
本页目录
通过Presto查询RDS或MySQL数据库
使用E-MapReduce采集Kafka客户端Metrics数据
使用E-MapReduce处理离线作业
SparkSQL自适应执行
E-MapReduce数据迁移方案
通过Flink作业处理OSS数据
使用E-MapReduce Hive关联云HBase
使用E-MapReduce进行MySQL Binlog日志准实时传输
Gateway节点运行Flume进行数据同步
在EMR上使用Sqoop与数据库同步数据时的网络配置
通过Spark Streaming作业处理Kafka数据
通过Kafka Connect进行数据迁移
E-MapReduce本地盘实例大规模数据集测试
通过Hive作业处理TableStore数据
通过JDBC连接HiveServer2来访问Hive数据
自建Hadoop数据迁移到阿里云E-MapReduce
E-MapReduce弹性低成本离线大数据分析
自建Hive数据仓库迁移到阿里云E-MapReduce
通过PyFlink作业处理Kafka数据
上一篇:
下一篇:
以上内容是否对您有帮助?
在文档使用中是否遇到以下问题
内容错误
更新不及时
链接错误
缺少代码/图片示例
太简单/步骤待完善
其他
内容错误
更新不及时
链接错误
缺少代码/图片示例
太简单/步骤待完善
其他
更多建议
提交建议
匿名提交
感谢您的打分,是否有意见建议想告诉我们?
提交建议
感谢您的反馈,反馈我们已经收到
文档反馈
鼠标选中内容,快速选择问题
选中存在疑惑的文档内容,即可生成截图进行反馈,我们会跟进处理。
好的,知道了
文档反馈
在文档使用中是否遇到以下问题
更多建议
匿名提交