数据上云工具

MaxCompute平台支持丰富的数据上传和下载工具(其中大部分工具已经在GitHub公开源代码,以开源社区的方式进行维护)。您可以根据实际应用场景,选择合适的工具进行数据的上传和下载。阿里云数加产品 MaxCompute客户端(Tunnel通道系列)...

迁移场景

开源软件:开源软件指开发者从开源社区下载未做源码修改的软件或者所使用操作系统生态中默认携带的软件。当前大部分开源软件在倚天ARM平台上已经提供较好的应用生态,您可以直接使用操作系统提供的开源生态软件来安装部署。更多信息,请...

进阶功能

说明 有些包管理工具会在代码库的配置文件中,嵌入第三方包管理工具(比如Maven、Gradle)的下载链接,源码部署过程中将自动检测这些配置并替换,最终基于阿里云提供的镜像进行构建。托管第三方库版本 源码部署支持托管的第三方工具如下...

开源支持

MaxCompute是阿里巴巴自研的一站式的快速、完全托管的TB/PB/EB级数据仓库...源代码请参见GitHub Aliyun MaxCompute Data Collectors。插件说明请参见 wiki。服务支持方式:在GitHub Aliyun MaxCompute Data Collectors 中留言或新建Issue。

EMR Spark功能增强

阿里云E-MapReduce产品构建于阿里云云服务器ECS上,基于开源的Apache Hadoop和Apache Spark,做了大量优化。本文为您介绍E-MapReduce(简称EMR)Spark相对开源增强的功能。背景信息 阿里云EMR 100%采用社区开源组件,随开源版本升级迭代,...

迁移概述

说明 基于倚天710 ARM CPU架构的实例规格族有:通用型实例规格族g8y 计算型实例规格族c8y 内存型实例规格族r8y 迁移必要性 与x86架构不同的是,倚天云服务器采用的ARM架构,一个基于x86平台上源代码的程序,如果需要部署到基于阿里云倚天...

开源自建对比

提供镜像仓库和代码源等。权限管理 自研解决方案。基于K8s RBAC机制完成认证访问授权,但无法满足企业多租户权限隔离需求。对接RAM系统,提供命名空间级别和应用级别的权限隔离能力。弹性效率 分钟级。分钟级。秒级。使用体验 创建应用前置...

SmartData常见问题

JindoFS核心代码采用C++ native代码开发,各种基本操作性能优于社区版本。JindoFS提供Fuse支持吗?和OSS自带的Fuse有什么优势?提供。JindoFS提供的Fuse优势在于能够利用JindoFS分布式缓存和Block模式功能。JindoFS支持哪些开源组件?支持...

示例项目使用说明

示例项目 示例名称如下所示,详情代码示例请参见 集群运行。MapReduce WordCount:单词统计 Hive sample.hive:表的简单查询 Pig sample.pig:Pig处理OSS数据实例 Spark SparkPi:计算Pi SparkWordCount:单词统计 LinearRegression:线性...

Demo App《软件许可协议》

定义 软件:指由阿里云开发并享有知识产权的示例性应用程序,包括源代码和二进制代码。源代码:指未编译的一系列可读的计算机语言指令、文本代码,包括相关文档。二进制代码:指计算机可以直接识别并执行,不需要进行任何翻译的计算机语言...

Lindorm for Cassandra应用实践

开源标准 CQL 兼容CQL(大部分情况下无需改造代码)一致性 可调一致性,需定期repair。可调一致性(无需repair数据)服务模式 自建 集群托管或者Serverless可选 可靠性 无SLA保障,开源软件BUG需要自行修复。SLA保障,并具备主备双活、备份...

开源软件迁移

当前大部分应用系统都基于开源软件构建,并且大部分的开源软件在倚天ARM平台上已经提供较好的应用生态,您可以直接使用操作系统提供的开源生态软件来安装部署。本文介绍Nginx、MySQL、Redis、TensorFlow、PyTorch等开源软件如何在倚天...

免费体验Lindorm宽表性能&价格力

Lindorm宽表引擎支持千万级高并发吞吐,支持百PB级存储,吞吐性能是开源HBase(Apache HBase)的3~7倍,P99时延为开源HBase(Apache HBase)的1/10,平均故障恢复时间相比开源HBase(Apache HBase)提升10倍,支持冷热分离,压缩率比开源...

合作伙伴及开源生态

活动与社群 SOFALab 源码共建 SOFALab 为 SOFAStack 社区发起源码解析系列文章的共建活动,该系列详细介绍了各个部分的代码设计和实现,由蚂蚁 SOFA 团队和源码爱好者们共同出品。截至目前,SOFALab 源码共建累计完结 4 个系列——SOFARPC...

Flink Python参考

背景信息 DataFlow集群的Flink Python API完全兼容开源的Flink版本,关于Flink Python API的详细信息,请参见 Python API。使用Python依赖 通过以下场景为您介绍如何使用Python依赖:使用自定义的Python虚拟环境 使用第三方Python包 使用...

产品架构

从上图可以看出EMR由四部分组成:社区开源产品 集成Apache社区开源大数据组件,例如Hadoop、Hive和HBase,随着EMR版本更新,开源软件也会相应的升级,详情请参见 版本概述 下各版本的版本说明。注意 已经创建好的EMR集群不支持组件升级。...

产品优势

阿里云E-MapReduce(简称EMR)为您提供相对方便可控的企业级开源大数据服务。您可以快速搭建开源大数据服务,例如Hadoop、Spark、Flink、Kafka和HBase服务。稳定可靠的开源组件 100%采用社区开源组件,随开源版本升级迭代,详情请参见 版本...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

什么是EMR on ECS

100%采用社区开源组件,适配并优化开源组件,性能远高于开源版本。基于时间的弹性伸缩能力,抢占式实例可进一步降低成本。解耦了计算与存储之间的绑定关系,实现了资源的弹性利用。分钟级别创建和扩容集群,无需手动部署和启动服务。产品...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

什么是EMR Serverless Milvus

阿里云向量检索Milvus版是一款Serverless全托管服务,确保了与开源Milvus的完全兼容性,并支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控...

OpenLDAP

OpenLDAP是LDAP协议(Lightweight Directory Access Protocol)的开源实现,在EMR集群中主要提供用户管理和身份认证的功能。服务集成OpenLDAP 在EMR集群中,Knox服务默认与OpenLDAP服务对接。当您通过EMR控制台的 访问链接与端口 功能访问...

EMR Studio概述

EMR Studio是E-MapReduce提供的开源大数据开发套件,包含Apache Zeppelin、Jupyter Notebook和Apache Airflow等开源组件。能够无缝关联EMR集群(EMR on ECS和EMR on ACK)的计算引擎提交任务,并提供了交互式开发、任务调度和任务监控等...

Zeppelin常见问题

EMR Studio上的Zeppelin与开源版本一致吗?如何设置Zeppelin Note的权限?Zeppelin执行时无法正常启动Interpreter EMR Studio上的Zeppelin与开源版本一致吗?EMR Studio上的Zeppelin是增强版的Zeppelin,与开源版本不一致。E-MapReduce的...

授权信息

开源大数据平台 E-MapReduce(EMR)的RAM代码(RamCode)为 emr,emr-apm-server,ecm,emr-serverless-spark,dls,支持的授权粒度为 OPERATION。权限策略通用结构 权限策略支持JSON格式,其通用结构如下:{"Version":"1","Statement":[{...

相关的云服务

本文为您介绍典型场景下,使用开源大数据平台E-MapReduce时通常会使用到的其他云服务。云服务名称 说明 云服务器ECS 使用云服务器ECS(Elastic Compute Service)作为集群的节点,每个ECS实例集群中的一个节点。专有网络VPC 专有网络VPC...

支持倚天云服务器

阿里云E-MapReduce支持使用倚天云服务器构建开源大数据集群。适用客户 全网用户 新增功能/规格 阿里云E-MapReduce(简称EMR)支持使用倚天云服务器构建开源大数据集群。与现有X86架构实例体验完全相同的情况下,具有更高的性价比,帮助用户...

访问链接与端口

通过访问链接与端口功能,您可以方便地通过控制台方式访问集群中已安装开源组件Web UI的地址。本文将介绍如何设置安全组规则和访问链接,以便查看集群中开源组件的UI界面。前提条件 已创建E-MapReduce集群,详情请参见 创建集群。背景信息 ...

Iceberg概述

您可以借助Iceberg快速地在HDFS或者阿里云OSS上构建自己的数据湖存储服务,并借助开源大数据生态的Spark、Flink、Hive和Presto等计算引擎来实现数据湖的分析。核心能力 Apache Iceberg设计初衷是为了解决Hive数仓上云的问题,经过多年迭代...

使用OpenAPI

本文为您介绍使用开源大数据平台E-MapReduce OpenAPI的基本信息。关于使用阿里云OpenAPI的详细介绍,请参见 使用OpenAPI。基本信息 版本说明 版本号 说明 2021-03-20 推荐使用。接入点说明 根据实例所在的地域,选择对应的服务接入点地址,...

Hive概述

Hive是一个基于Hadoop的数据仓库框架,在大数据业务场景中,主要用来...Hive语法 EMR产品最大程度的保持了开源社区的语法以及体验,在Hive语法上保持与开源社区Hive语法100%的兼容性。关于Apache Hive的更多介绍,请参见 Apache Hive官网。

Shell

开源Zeppelin相比,E-MapReduce(简称EMR)数据开发集群中的Shell解释器支持在不同EMR集群环境里切换。本文通过示例为您介绍如何在Zeppelin中使用Shell。使用示例 运行hadoop命令 执行如下命令会显示当前EMR集群根目录下的所有文件,切换...

Superset(仅对存量用户开放)

您可以使用Superset连接多个数据自助分析并可视化、定义图表和看板、导入或导出看板,并且可以对用户和角色进行权限管理。本文以EMR-3.34.0版本的集群为例为您介绍如何使用Superset。背景信息 Superset对E-MapReduce Druid做了深度集成,...

查看账单

在 明细账单 页签中,设置查询 账期,并在列表中筛选产品为 开源大数据平台E-MapReduce,产品明细为 EMR StarRocks Serverless按量 或 EMR StarRocks Serverless包年包月。您还可以通过 统计项 和 统计周期 选择账单的展示内容。账单详细...

ClickHouse概述

开源大数据平台E-MapReduce(简称EMR)的ClickHouse提供了开源OLAP分析引擎ClickHouse的云上托管服务。EMR ClickHouse完全兼容开源版本的产品特性,同时提供集群快速部署、集群管理、扩容、缩容和监控告警等云上产品功能,并且在开源的基础...

概述

Alluxio是一个面向基于云的数据分析和人工智能的开源的数据编排技术。Alluxio为数据驱动型应用和存储系统构建了桥梁,将数据从存储层移动到距离数据驱动型应用更近的位置,从而能够更容易被访问,同时使得应用程序能够通过一个公共接口连接...

什么是EMR Workflow

EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据湖仓,并为生产任务的稳定运行提供保障。产品优势 ...

Flink DataStream参考

DataFlow集群的Flink DataStream API完全兼容开源的Flink版本,关于Flink DataStream API的详细信息,请参见 Flink DataStream API Programming Guide。上下游存储(Connector)开源Flink的上下游存储,请参见 DataStream Connectors。...

概述

Flink(VVR)是基于Apache Flink(以下简称Flink)开发的商业版,VVR引擎接口完全兼容Flink开源版本,且提供GeminiStateBackend等高增值功能,以提升作业性能及稳定性。背景信息 Flink核心是一个流式的数据流执行引擎,其针对数据流的分布...

EMR Doctor概述

E-MapReduce Doctor(简称EMR Doctor)是E-MapReduce产品自研的面向开源大数据集群的智能运维诊断系统。通过EMR Doctor(即集群管理页面的“健康检查”功能)可以全局了解集群的健康状况和动态走势,为运维决策和资源优化提供有力的信息...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
开源大数据平台 E-MapReduce 云数据库 RDS 微服务引擎 检索分析服务 Elasticsearch版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用