什么是DataWorks

DataWorks发展之路 阿里巴巴集团内发展历程 从2009年产品立项开始,DataWorks与阿里巴巴业务共同发展,结合MaxCompute、Hologres等数据计算引擎的能力,跨越多个技术阶段,支撑阿里巴巴数据中台与数据治理建设。目前阿里巴巴集团内...

构建数据仓库

方案优势:阿里巴巴大数据最佳实践,高性能、低成本、Serverless服务,免运维、全托管模式,让企业的大数据研发人员更聚焦在业务数据的开发、生产、治理。产品组合:MaxCompute+Flink+DataWorks。场景说明 用户数据来源丰富,包括来自云端...

文档修订记录

创建数仓分层 配置及使用数仓分层检查器 2023.3.16 新增功能 数据建模 DataWorks智能数据建模联合具备丰富行业建模经验的数据架构师,总结阿里云百万用户最全面的业务场景,结合阿里巴巴技术创新能力,提供零售电子商务、金融、制造等多个...

产品概述

AIRec智能推荐 阿里云智能推荐AIRec(Artificial Intelligence Recommendation,简称AIRec)基于阿里巴巴大数据和人工智能技术,结合在电商、内容、新闻资讯、视频直播和社交等多个行业领域的积累,为全球企业及开发者提供个性化推荐服务。...

EMR数据开发停止更新公告

作为一站式大数据开发治理平台,DataWorks沉淀阿里巴巴十多年大数据建设方法论,为客户完成从入湖、建模、开发、调度、治理、安全等全链路数据湖开发治理能力,帮助客户提升数据的应用效率。迁移流程 阿里云DataWorks on EMR团队提供了完善...

开通审计日志

背景信息 阿里云日志服务SLS(Log Service)是针对日志类数据的一站式服务,由阿里巴巴集团经历大量大数据场景锤炼而成。无需开发就能快捷完成日志数据的采集、消费、投递以及查询分析,是提升运维与运营效率的极佳工具。云数据库MongoDB将...

什么是数据管理DMS

高效协同:提供覆盖数据全生命周期的 DevOps,内置阿里巴巴大规模实践的数据管控体系。保障数据安全的同时,提升企业研发效率。更多信息,请参见 产品优势。如何使用数据管理DMS 您可以通过以下方式使用DMS,进行数据资产管理、数据库开发...

阿里云电子政务云产品全家福

云原生分布式数据库 PolarDB-X PolarDB-X 是由阿里巴巴自主研发的云原生分布式数据库,具备水平扩容、金融级高可用、HTAP混合负载、兼容 MySQL 等重要特性,专注解决超高并发吞吐、海量数据存储、表瓶颈等数据库瓶颈难题,历经各届天猫双...

专家成长计划技术培训课程

现场面授(特殊情况可调整为线上钉钉群直播)大数据方向 阿里大数据计算平台解析 2天 30人 本课程将全面介绍大数据产品体系,技术架构及产品特性,学员可以熟悉大数据计算平台(MaxCompute)和数据工场(DataWorks)基础概念、术语、产品...

PolarDB-X历史

2011~2015,TDDL成为阿里巴巴数据库系统的统一接入标准,开始面向阿里巴巴所有业务提供分布式数据库服务。目前集团内运行实例约30万套,业务覆盖支付、资金、即时通信、媒体等十余类。丰富的业务模型造就了TDDL优秀的MySQL语法兼容性,...

Tair(Redis企业版)简介

从服务淘宝详情和验证码等业务的持久化系统TBStore,到初始服务于淘宝用户中心的TDBM等等,后端系统缓存技术经历了多个系统和阶段的演变与积累,到2009年,这些系统、技术经验经过进一步的研发,融合成了阿里巴巴大规模高性能内存数据库...

客户案例

阿里妈妈 公司介绍 阿里妈妈广告业务主要是一种 P4P(Pay for Performance)形式的广告业务系统,而报表中心作为阿里妈妈向广告主透出广告效果数据的唯一平台,在阿里巴巴大平台丰富多样的商业场景下,为客户提供优质,高效,可靠的数据...

金融大数据

架构优势:合理解决了金融行业内外部数据整合问题 优化了结数据架构分层 提供了高效的数数据加工与服务方式 技术架构 架构说明:阿里云大数据数据仓库解决方案经历了阿里巴巴集团内部的实战验证,完全基于自主研发,且在不断优化、完善,以...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

数仓分层

基于阿里巴巴OneData方法论最佳实践,在阿里巴巴数据体系中,建议将数据仓库分为三层:数据引入层(ODS,Operational Data Store)、数据公共层(CDM,Common Dimensions Model)和数据应用层(ADS,Application Data Store)。数据仓库...

常见问题

1.售前咨询渠道 尊敬的“准”大数据专家服务用户您好:如果您准备购买阿里大数据专家服务,但是遇到如服务范围、规格、服务选择等售前方面的问题,您可以通过钉钉与我们联系,您将“当面”获得阿里大数据专家咨询专家的建议。...

发展历程

深度参与和推动全球大数据领域标准化建设 MaxCompute代表阿里巴巴计算平台,成为国际TPC(Transaction Processing Performance Council)委员会大数据评测标准BigBench的委员会委员,是中国担任此国际性能标准化测试组织委员的唯一企业。...

概述

数据同步服务的内核在阿里巴巴跨域长途实时同步、实时增量分发、分布式数据库、大数据等场景中提供着功能丰富和服务稳定的数据方案,支持着阿里巴巴交易异地多活、广告、搜索、大数据实时抽取、商务对账单等双十一媒体大屏等众多业务场景。

蓝牙BLE非交互式广播规范

广播数据格式 阿里巴巴的厂商自定义格式(Manufacturer Specific Data)的AD Type须位0xFF。广播中的数据必须按照小端(Little-Endian)格式存储。类别 字段 字节数 取值 说明 Flags length 1 0x2 Flags length AD Type 1 0x1 Flags Type ...

技术架构选型

本教程中使用阿里大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

技术架构选型

本教程中使用阿里大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

数仓分层

阿里巴巴数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。数据仓库的分层和各层级用途如下图所...

数仓分层

阿里巴巴数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。数据仓库的分层和各层级用途如下图所...

E-MapReduce本地盘实例规模数据集测试

本文介绍如何使用阿里云E-MapReduce搭建本地盘机型集群节点,并进行大数据基准性能测试。应用范围 需要使用阿里云E-MapReduce+本地盘进行大数据业务前进行性能测试的用户。需要将线下自建大数据集群迁移到阿里云云上E-MapReduce+本地盘进行...

通用数据开发

说明 上图中,虚线框内的开发流程均可基于阿里大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的数据,存储在业务系统所对应的数据库中,包括MySQL、Oracle和RDS等类型。数据收集与存储:您需要同步...

功能概览

1.4 生态融合 系出飞天,与阿里大数据系统深度整合,无缝对接MaxCompute、实时计算、交互式分析等产品,打通整个大数据体系。2.产品功能 2.1 数据接入 提供多种SDK、API和Flume、Logstash等第三方插件,让您高效便捷的把数据接入到数据...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

电商网站智能推荐

电商网站智能推荐基于阿里巴巴大数据和人工智能技术,结合在电商行业的多年积累,为开发者提供个性化推荐服务,提升商品的购买率和转化率。概述 本实践以电商网站为例,通过日志服务采集日志,将RDS作为后端数据服务、MaxCompute作为数据...

Cost-based SQL诊断引擎

和其它公司一样,在阿里巴巴业务场景下,部分业务跟数据库有着非常紧密的关系,数据库一个微小的抖动都有可能对业务造成非常的影响,如何让数据库更稳定,得到持续优化一直都是非常重要的诉求。数据库环境下的业务优化,通常涉及三个...

模型说明

长文本分类融合模型【推荐】阿里巴巴达摩院自研的融合了CNN,FastText,Self-Attention等机制的集成学习模型,适用各类文本分类场景,包括篇幅较长的文体(如新闻、小说等),训练时间较长。短文本分类融合模型 阿里巴巴达摩院自研的针对...

什么是云原生内存数据库Tair

如今,云原生内存数据库Tair 已经是阿里巴巴集团调用量最大的系统之一,在多年的阿里巴巴双十一全球狂欢节上提供了核心的在线访问加速能力,承受住了每秒数亿次的调用。时间 事件 2022年10月 发布 内存型(兼容Redis 6.0),相比较同规格的...

基本介绍

与云原生多模数据库Lindorm的关系 云原生多模数据库Lindorm是阿里巴巴自主研发的多模型数据库,云数据库HBase增强版的内核由 云原生多模数据库Lindorm宽表引擎 提供,为了获取更新、更完善的能力,推荐直接使用云原生多模数据库Lindorm。...

ETL工作流快速体验

案例提供的数据仅用于阿里大数据开发治理平台DataWorks数据应用体验。仅 空间管理员 角色可导入ETL模板至目标工作空间。如需给账号授予空间管理员角色,请参见 空间级模块权限管控。导入ETL工作流模板 您可以将DataWorks ETL工作流模板...

DataWorks交流钉钉群

阿里巴巴内部,每天有数万数据、算法开发工程师正在使用DataWorks。您需要先单击 申请链接 加入“阿里云大数据AI平台”交流群,再扫描下方二维码加入DataWorks产品钉钉交流群,加入后,即可获得专属产品技术支持,技术直播活动,产品新...

阿里巴巴外贸邮需要添加的解析值

本文主要介绍阿里巴巴外贸邮需要添加的MX和SPF解析值。阿里巴巴外贸邮解析记录值 主机记录 记录类型 优先级 解析记录值@MX 5 mx01.mail.alibaba....

快速入门

阿里云数据库RDS MySQL基于阿里巴巴的MySQL源码分支,经过双11高并发、大数据量的考验,拥有优良的性能和吞吐量。此外,阿里云数据库MySQL版还拥有经过优化的 读写分离、数据库代理、智能调优 等高级功能。当前RDS MySQL支持5.5、5.6、5.7...

将云消息队列 Kafka 版的数据迁移至MaxCompute

本文介绍如何使用DataWorks数据同步功能,将 云消息队列 Kafka 版 集群上的数据迁移至阿里大数据计算服务MaxCompute,方便您对离线数据进行分析加工。前提条件 在开始本教程前,确保您在同一地域中已完成以下操作:云消息队列 Kafka 版 ...

X-Engine引擎常见问题

X-Engine是阿里巴巴自研的基于LSM-tree架构的存储引擎,提供了强大的数据压缩能力,满足了归档数据库低存储成本的要求。通过LSM-Tree(Log-Structured Merge-Tree)层次化架构和Zstandard(ZSTD)压缩算法实现了更高的数据压缩率,对比使用...

什么是云数据库HBase

数据库HBase是低成本、高扩展、云智能的大数据NoSQL,兼容标准HBase访问协议,提供低成本存储、高扩展吞吐、智能数据处理等核心能力,是为淘宝推荐、花呗风控、广告投放、监控大屏、菜鸟物流轨迹、支付宝账单、手淘消息等众多阿里巴巴...

鹿班介绍

技术原理 深度学习在图像领域的快速发展是智能设计的技术基础,阿里巴巴智能设计实验室依托达摩院机器智能技术,通过对人类过往大量设计数据的学习,训练出一个设计大脑—Luban。根据用户输入的需求,机器从无到有经过规划、行动多轮规模...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 弹性公网IP 短信服务 人工智能平台 PAI 物联网平台
新人特惠 爆款特惠 最新活动 免费试用