HDFS概述

HDFS(Hadoop Distributed File System)是一种Hadoop分布式文件系统,具备高度容错特性,支持高吞吐量数据访问,可以在处理海量数据(TB或PB级别以上)的同时最大可能的降低成本。HDFS适用于大规模数据的分布式读写,特别是读多写少的场景...

搭建Hadoop环境

Hadoop是由Apache基金会使用Java语言开发的分布式开源软件框架,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的能力进行高速运算和存储。本文介绍如何在Linux操作系统的ECS实例上快速搭建Hadoop分布式环境。前提...

功能特性

无缝集成 文件存储 HDFS 版 允许您就像在Hadoop分布式文件系统(HDFS)中一样管理和访问数据。文件存储 HDFS 版 SDK可在所有Apache Hadoop 2.x环境中使用,包括阿里云EMR和阿里云Flink。文件存储 HDFS 版 支持的原生文件系统语义被开发人员...

什么是文件存储 HDFS 版

产品概述 文件存储 HDFS 版 允许您就像在Hadoop分布式文件系统(Hadoop Distributed File System)中一样管理和访问数据。您无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等...

集群容灾能力

数据容灾 在Hadoop分布式文件系统(HDFS)中,每一个文件的数据均是分块存储的,每一个数据块保存有多个副本(默认为3),并且尽量保证这些数据块副本分布在不同的机架之上。一般情况下,HDFS的副本系数是3,存放策略是将一个副本存放在...

快速入门

部署成功后,您就可以像在Hadoop分布式文件系统(Hadoop Distributed File System)中一样管理和访问数据。前提条件 已开通 文件存储 HDFS 版 服务。具体操作,请参见 开通文件存储HDFS版服务。已购买ECS实例。更多信息,请参见 选购ECS...

文件存储HDFS版

您可以像在Hadoop分布式文件系统(Hadoop Distributed File System)中管理和访问数据那样使用文件存储HDFS版。您无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等特性的分布...

Hive连接器

背景信息 Hive数仓系统由以下三部分内容组成:不同格式的数据文件,通常存储在Hadoop分布式文件系统(HDFS)或对象存储系统(例如,阿里云OSS)中。存储着数据文件到Schema和Table映射的元数据。该元数据存储在数据库(例如,MySQL)中,并...

通过HDFS Shell连接并使用文件引擎

HDFS Shell是Hadoop分布式文件系统(HDFS)提供的命令行工具。Lindorm文件引擎100%兼容HDFS协议,您可以通过HDFS Shell工具交互式管理文件引擎中存储的文件,例如文件查询、文件删除、文件权限管理和修改文件名称等。本文介绍通过HDFS ...

迁移开源HDFS的数据到文件存储 HDFS 版

文件存储 HDFS 版 可以帮助您实现将开源HDFS的数据迁移到云上,并允许您在云上就像在Hadoop分布式文件系统中管理和访问数据。准备工作 开通 文件存储 HDFS 版 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。...

大数据型

大数据型实例规格族旨在解决大数据时代下海量业务数据的云上计算和存储难题,适用于Hadoop分布式计算、海量日志处理和大型数据仓库等需要海量数据存储和离线计算的业务场景,充分满足以Hadoop为代表的分布式计算业务对实例存储性能、容量和...

文件存储 HDFS 版和对象存储OSS双向数据迁移

文件存储 HDFS 版 允许您就像在Hadoop分布式文件系统中一样管理和访问数据,并对热数据提供高性能的数据访问能力。对象存储OSS是海量、安全、低成本、高可靠的云存储服务,提供标准型、归档型等多种存储类型。您可以在 文件存储 HDFS 版 ...

安装文件系统SDK

其中MapReduce以伪分布式方式运行。有关MapReduce的伪分布方式,请参见 Apache Hadoop。配置Hadoop 本节以Hadoop 2.7.2版本为例,介绍如何配置Hadoop。下载 Hadoop,建议版本不低于2.7.2。执行以下命令,解压Hadoop压缩包。tar-zxf hadoop-...

Hadoop DistCp介绍

Hadoop DistCp(分布式复制)是一个用于大型集群间或集群内数据复制的工具,通过MapReduce实现复制过程中数据的分发、错误处理、恢复及报告。本文为您介绍Hadoop DistCp与Jindo DistCp的区别、Hadoop DistCp使用方法以及常见问题。说明 ...

Teamtnt变种攻击Hadoop集群

概述 Hadoop作为一个分布式计算应用框架,种类功能繁多,而Hadoop Yarn作为其核心组件之一,负责将资源分配至各个集群中运行各种应用程序,并调度不同集群节点上的任务执行。Hadoop Yarn未授权访问使得攻击者无需认证即可通过REST API部署...

概述

分布式事务 DTX(Distributed Transaction-eXtended)是蚂蚁集团自主研发的金融级分布式事务中间件,用来保障在大规模分布式环境下业务活动的最终一致性。在蚂蚁集团内部被广泛地应用于交易、转账、红包等核心资金链路,服务于亿级用户的...

基础术语

发起方 initiator 分布式事务的发起方负责启动分布式事务,通过调用参与者的服务,将参与者纳入到分布式事务当中,并决定整个分布式事务是提交还是回滚。一个分布式事务有且只能有一个发起方。参与者 participant 参与者提供分支事务服务。...

功能特性

分布式事务(Distributed Transaction-eXtended,简称 DTX)是蚂蚁集团自主研发的金融级分布式事务中间件,支持跨数据库、跨服务以及混合的方式处理分布式应用,具备多种接入模式和金融级配套功能,本文将主要介绍分布式事务的功能特性。...

开通SchedulerX

背景信息 阿里云分布式任务调度SchedulerX已于2021年09月01日正式商业化。操作步骤 登录 分布式任务调度平台。首次使用并登录分布式任务调度平台,在弹出的对话框中单击 开通。在 分布式任务管理 页面,单击 立即购买。在 确认订单 页面 ...

中间件产品总览

提供高可用消息云服务 任务调度 提供分布式任务调度框架 提供自动化任务调度服务 分布式事务 金融级分布式事务中间件 支持跨数据库、跨服务以及混合分布式事务 数据访问代理 通过 MySQL 协议与 RDS\OceanBase 通信 通过触发 DDL 任务管理...

开通服务

本节介绍如何开通分布式事务服务。前提条件 已注册阿里云账号,并完成实名认证。操作步骤 开通 SOFAStack 产品服务。使用阿里云账号登录 阿里云官网。在上方菜单栏选择 产品与服务>中间件>金融分布式架构 SOFAStack。在 SOFAStack 产品主页...

功能特性

数据访问代理兼容 MySQL 协议和语法,支持分库分表、平滑扩容、服务升降配、透明读写分离和分布式事务等特性,具备分布式数据库全生命周期的运维管控能力。分库分表 支持 RDS、OceanBase、MySQL 的分库分表。在创建分布式数据库后,只需...

概述

SOFAStack 提供了一套用于快速构建金融级分布式架构的中间件,是在严苛的金融场景里锤炼出来的最佳实践。要使用 SOFA 中间件,例如微服务或消息队列,推荐使用 SOFABoot 框架进行开发。SOFABoot SOFABoot 是蚂蚁科技基于 Spring Boot 自研...

应用场景

分布式事务可应用在多个涉及数据库操作的领域,尤其在金融领域可以做到全场景的覆盖与落地验证,包括:支付与转账、账务:对于吞吐量有很高的要求 金融与理财:往往涉及的金额较大,所以对于产品的稳定性要求非常高 保险与监管报送:参与方...

什么是分布式任务调度SchedulerX

分布式任务调度SchedulerX是阿里巴巴基于Akka架构自研的新一代分布式任务调度平台,提供定时调度、调度任务编排和分布式批量处理等功能。您可以在控制台配置、管理您的定时调度任务、查询任务执行记录和运行日志,还可以通过工作流进行任务...

分布式序列问题

分布式序列是否全局唯一 单库单表的分布式序列可以保证生成的序列 ID 全局唯一。分库分表的分布式序列仅保证单个分片的序列 ID 唯一,如果需要确保分库分表的分布式序列全局唯一,可以在序列 ID 中拼接分库分表位,以此保证全局唯一。分布...

分布式事务问题

数据访问代理是否支持分布式事务 数据访问代理支持与分布式事务的集成使用。版本要求:数据访问代理 V2.9.5 或更高版本 分布式事务 V2.5.2 或更高版本 具体配置信息请参考 分布式事务>开发指南>依赖与配置项。在数据访问代理 V2.9.5 之前的...

什么是分布式任务调度SchedulerX

分布式任务调度SchedulerX是阿里巴巴自研的分布式任务调度平台,兼容开源XXL-JOB、ElasticJob、Spring Schedule,K8s Job,支持Cron定时、一次性任务、可视化工作流任务编排和分布式跑批,具有高可用、可观测、可运维和低延时等能力。...

产品优势

微服务产品在蚂蚁集团内部已支撑数万个节点规模的分布式应用架构,具有高可用性、高可扩展性、高性能、高时效性、稳定可靠等核心优势,并提供丰富的功能来帮助用户简化分布式系统的管理,让业务开发人员可以专注于业务逻辑实现,提升研发...

开通SchedulerX

背景信息 阿里云分布式任务调度SchedulerX于2021年09月01日正式商业化。对于公测期间创建的实例,如果2021年09月01日00:00:00前没有释放,那么我们将默认您所创建的集群采用按量付费模式开始收费。操作步骤 首次使用并登录分布式任务调度...

分布式任务调度平台(SchedulerX)服务等级协议

本文介绍分布式任务调度平台(SchedulerX)的服务等级协议。关于服务等级协议,请参见 分布式任务调度平台(SchedulerX)服务等级协议。

产品优势

分布式中间件 蚂蚁分布式中间件的产品发展路径,一直秉承引领和拥抱业界先进标准和实践,同时亦能满足传统金融架构的平滑迁移、融合适配,以稳妥应对业务升级变更,并积极应对金融交易系统所面临的服务和数据扩展性、事务一致性、秒级容灾...

组件中心

中间件 分布式链路跟踪 一款实时监控并管理企业应用性能和故障的云服务,其提供数字化性能管理解决方案,帮助企业在分布式架构下快速发现并准确定位应用全生命周期的性能问题。任务调度 提供分布式任务调度框架,实现任务的分布式处理,并...

分布式任务调度平台(SchedulerX)服务等级协议

本文介绍分布式任务调度平台(SchedulerX)的服务等级协议。关于服务等级协议,请参见 分布式任务调度平台(SchedulerX)服务等级协议。

应用场景

SOFABoot 可帮助用户快速搭建高效、可靠的分布式应用,同时能与 Spring Boot 工程无缝集成,降低用户的迁移成本。快速开发分布式应用 SOFABoot 框架集成了所有 SOFA 中间件,以“依赖即服务”的调用形式实现快速配置,轻松搭建稳定、可靠、...

天弘基金

业务挑战 在大规模分布式应用中,曾经的单体应用按横向和纵向的维度被拆分到集群的各个节点之中,为了解决服务及数据调用的问题,引入了分布式服务框架、分布式消息集群、分布式文件存储、分布式缓存等一系列服务。应用的拆分及分布式中间...

其他漏洞汇总说明

Apache HadoopHadoop Yarn ResourceManager未授权访问漏洞 Apache Hadoop YARN ZKConfigurationStore反序列化代码执行漏洞(CVE-2021-25642)Apache HadoopHadoop Yarn ResourceManager未授权访问漏洞 Hadoop是一款分布式基础架构,...

常见问题

本文主要介绍在操作分布式事务过程中的常见问题。SOFAStack 是否可以部署在虚拟机、物理机上?可以,SOFAStack 部署支持物理机、虚机机 VM。SOFAStack 当前是否只支持阿里云飞天 ACK?SOFAStack 部署支持多云异构、目前支持华为云、开源 ...

什么是蚂蚁链分布式身份服务 DIS

蚂蚁链分布式身份服务 DIS(Decentralized Identity Service),是一种基于区块链的身份管理方案,提供实体身份的创建、验证和管理等一整套功能,实现更规范化地管理和保护实体数据,同时保证信息流转的真实性和效率,解决了跨机构的身份...

金融云分布式任务调度平台(SchedulerX)服务等级协议

本文介绍金融云分布式任务调度平台(SchedulerX)的服务等级协议。关于服务等级协议,请参见 金融云分布式任务调度平台(SchedulerX)服务等级协议。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
金融分布式架构 企业级分布式应用服务 开源大数据平台 E-MapReduce 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用