什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

发展历程

深度参与和推动全球大数据领域标准化建设 MaxCompute代表阿里巴巴计算平台,成为国际TPC(Transaction Processing Performance Council)委员会大数据评测标准BigBench的委员会委员,是中国担任此国际性能标准化测试组织委员的唯一企业。...

产品架构

云行情指标计算:接入交易所行情数据交易所在线股票的行情走势、盘口等实时行情数据)、个股市场数据交易所盘前、盘中、盘后的市场指标数据)与板块数据(板块指标数据)并进行指标计算处理,最终生成通用行情数据指标。行情集群服务:...

数据服务入门

步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,您需将数据库或数据仓库添加为DataWorks的数据源,并保障数据服务资源组与您的目标数据源网络连通,以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...

客户案例

基于金融云计算平台以及 OceanBase 的海量存储,网商银行拥有处理高并发金融交易、海量大数据和弹性扩容的能力,可以利用互联网和大数据的优势,给更多小微企业提供金融服务。唐家才 网商银行 CTO“网商银行选择 OceanBase 三地五中心部署...

云行情美股商品介绍

数据类型 商品名称 数据模式 数据形态 最新价 买卖档 MBP 美股基础版 Stream Realtime 全美(NASDAQ、NYSE、AMEX)交易所上市股票的实时最新价、NASDAQ综合指数(盘前、盘中、盘后)无 MBP 美股基础PLUS版 Stream Realtime 无 MBP 美股标准...

入湖基础操作

关系数据库全量入湖:可以实现RDS MySQL或PolarDB数据库表数据全量同步到数据湖,选择在数据源管理中配置好的数据源,将数据源对应数据库中选定表的数据全量同步到OSS中,如果待同步表中数据,则消耗的资源也会比较,建议在业务...

新零售:特步

PolarDB-X 专注解决海量数据存储、超高并发吞吐、表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及阿里云各行业客户业务的考验,助力企业加速完成业务数字化转型。本文介绍特步(中国)有限公司如何通过 PolarDB-X 应对...

阶段一:基础防护建设

在该阶段,DataWorks为您提供了数据分类分级、规范数据开发流程、企业级身份认证、开源身份隔离等多个场景的最佳实践,帮助企业做好数据安全治理的相关基础防护工作。场景一:数据分级分类 无论在任何行业,数据分级分类都是监管首要检查的...

识别任务说明

文件或表扫描限制 为了避免数据源中文件或表过影响整体扫描进度,数据安全中心对可以扫描的文件大小或表的字段大小做了限制,请您在进行敏感数据扫描前了解以下规则:结构化数据(RDS MySQL、RDS PostgreSQL、PolarDB等)、大数据...

数据归档

随着冷数据体量的不断变,存储成本也会水涨船高。所以降低冷数据存储成本,提升热数据读取性能,对于使用时序引擎的企业用户具有现实意义。在Lindorm时序引擎中,随着时间的不断推移,数据呈现出很明显的冷温热分层。其相应的概念如下:...

区域热力层

图表样式 区域热力层是3D地球的子组件,支持独立的样式和数据配置,能够使用GeoJson数据展示区域边界信息并渲染区域样式,适用于在3D地球上展示某个区域的数据信息。样式面板 搜索配置:单击 样式 面板右上角的搜索配置项图标,可在搜索...

区域热力层

数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

东软案例

如下图示,阿里Lindorm数据库在赋能政企数字运维团队更强大的运维大数据分析能力的同时,幅度提升了政府、企业数字系统性能和在线服务的客户数字体验,降低了低价值密度监控数据存储管理成本。图 1.阿里云Lindorm数据库驱动的IT运维...

概述

数据备份物理空间大小如下图示:说明 PolarDB 集群 数据备份物理空间大小(上图中①示):指数据备份的收费对象,物理空间大小是指所有数据备份(快照)独占的物理空间大小之和,PolarDB集群的数据与多个数据备份(快照)会复用相同的...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下示:数据产生:业务系统每天会产生大量结构化的...

区域热力层

数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

梯形柱状图

图表样式 梯形柱状图是柱状图的一种,能够清晰智能地展示各类别之间和各类别内部的数据差异,但在数据看板中占空间较。支持自定义y轴区间、多系列数据配置,以及根据数据类目自动分组展示。样式面板 搜索配置:单击 样式 面板右上角的...

分组柱状图

图表样式 分组柱状图是柱状图的一种,支持根据数据类目自动分组展示,能够更加清晰智能地展示各类别之间和各类别内部的数据差异,但在数据看板中占空间较。样式面板 搜索配置:单击 样式 面板右上角的搜索配置项图标,可在搜索配置面板...

概述

说明 PolarDB 集群 一级备份(快照)总大小 是所有一级备份独占的物理空间之和(即上图中①示),而非逻辑数据大小之和(即上图中②示),PolarDB 集群的数据与多个一级备份(快照)会复用相同的物理数据块,在计费时只会计算一次。...

DataV读取数据源超时

问题描述 阿里云DataV数据可视化产品主要用于动态、实时数据展示场景,需要对数据高频实时查询,对数据访问性能有一定要求,您的数据源访问经常出现超时的情况。问题原因 查询超时的原因如下:使用SQL查询的业务数据表数量太。API接口...

聚合支付:Ping+

PolarDB-X 专注解决海量数据存储、超高并发吞吐、表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及阿里云各行业客户业务的考验,助力企业加速完成业务数字化转型。本文介绍Ping+如何通过 PolarDB-X 应对业务挑战。所属行业...

概述

同一份数据以不同的格式保存,数据所占用的存储空间不同,使用DLA扫描数据花费的时间和费用也不同。通常情况下,同一份数据以ORC格式和PARQUET格式存储时,其数据扫描性能要优于普通文本CSV格式。因此,您可以将文本类型的数据转换为...

基本概念

栅格数据(Raster Data)是将地理空间分割成有规律的网格,每一个网格称为一个单元(像元或像素),并在各单元上赋予相应的属性值来表示实体的一种数据形式。栅格数据通常有两种类型的栅格数据:专题数据和影像数据。专题数据:每个栅格像...

LTS(原BDS)服务介绍

在线离线业务分离 通过LTS,将在线业务数据实时同步到HDFS或者OSS等存储,结合Spark、MR等大数据组件进行数据分析,从而不影响在线业务的查询。主备容灾 通过LTS在主备集群之间实现实时数据的双向同步,当主集群出现问题,可以切换到备集群...

LTS(原BDS)服务介绍

在线离线业务分离 通过LTS,将在线业务数据实时同步到HDFS或者OSS等存储,结合Spark、MR等大数据组件进行数据分析,从而不影响在线业务的查询。主备容灾 通过LTS在主备集群之间实现实时数据的双向同步,当主集群出现问题,可以切换到备集群...

通过RAM角色授权模式配置数据

本文以OSS数据源为例,为您介绍如何通过RAM角色授权模式配置数据源,提高云上数据的安全性。前提条件 如果您需使用RAM用户登录并完成本文操作流程,请先为RAM用户授予 AliyunDataWorksFullAccess 和 AliyunRAMFullAccess 权限策略,详情请...

NASDAQ美股数据的优势

已经形成了广泛的认可和共识:美国股票市场有16家交易所,每一家交易所发布的每只股票的价格都可能不同,这在美国市场被所有人熟知和认可,但中国投资者习惯于股票市场有一个 统一的标准,目前中国10交易类APP均使用NASDAQ美股行情数据,...

数据扫描和识别

支持扫描的数据源类型如下:结构化数据:RDS、PolarDB、PolarDB-X、MongoDB、OceanBase、自建数据库 非结构化数据:OSS 大数据:TableStore、MaxCompute、ADB-MYSQL、ADB-PG 数据源授权完成后需要多长时间完成扫描?DSC 完成数据源授权后,...

管理内置数据

内置数据集大小约为10 GB,该部分数据所占用的存储空间不会计费。加载内置数据集耗时约6~8分钟,加载数据集期间会占用user_default资源组中的计算预留资源,确保user_default资源组中至少预留16 ACU的计算资源用于数据初始化。请确保集群...

大数据安全治理的难点

使用大数据系统的常见人员包括开发、运营、分析师,甚至销售及HR都会来查询自己需的数据。如此多类型的用户,授权、管理难度加大,什么样的人员需要授予什么样的权限?如果他们离职、换部门了怎么办?这其中很有可能出现 权限蠕变、过度...

基本概念

概念 说明 地域 地域(Region)指的是用户购买的云数据库MongoDB实例的服务器处的地理位置。用户需要在开通云数据库MongoDB实例时指定地域,购买实例后暂不支持更改。在购买云数据库MongoDB实例时,需要搭配阿里云服务器ECS使用,云...

数仓分层

在阿里巴巴的数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。数据仓库的分层和各层级用途如下图...

数仓分层

在阿里巴巴的数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。数据仓库的分层和各层级用途如下图...

云行情港股商品介绍

云行情(港股)关于标准版和高级版Streaming(串流式)差异介绍:SEC标准版 客户(非内部使用者)可通过云行情产品实时接收所有在香港交易所证券市场(即联交所)上市的证券产品的重要交易数据,包括股本证券、权证、房地产投资信托基金、...

技术架构选型

本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

大数据AI公共数据集分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

技术架构选型

本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

客户案例

MaxCompute已被广泛应用于各领域处理云上大数据,帮助众多企业解决了海量数据分析问题,同时降低企业运维成本,企业人员可更专注于业务开发。本文为您介绍MaxCompute的精选客户案例。MaxCompute的全量客户案例信息,请参见 行业客户案例...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 数据库备份 DBS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用