MaxFrame概述

使用场景 MaxCompute MaxFrame使用场景如下:熟悉Python开发生态,需要开箱即用的Python开发环境,并快速进行数据科学规模数据处理及交互式数据探索等开发。处理数据量大、处理逻辑复杂,需要基于MaxCompute海量数据及弹性计算资源、...

相关的云服务

访问控制RAM 通过访问控制RAM,可以为不同人员、云服务等指定身份并基于身份授予资源访问权限,从而控制对开源大数据平台E-MapReduce的访问。对象存储OSS-HDFS 对象存储OSS-HDFS服务用于存储用户数据。云监控 通过云监控(CloudMonitor)...

权限说明

数据湖构建(DLF)产品的权限体系主要分为RAM权限以及DLF数据权限控制类,如果您要访问DLF的页面或数据,一般都需要通过这两层权限校验,才可以正确的访问到数据资源。RAM 权限:主要控制DLF所有OpenAPI的访问权限,决定RAM用户是否...

自媒体:易撰

所属行业:自媒体 网站地址:易撰 客户介绍 长沙营智信息技术有限公司是专业的新媒体大数据服务商,其旗下知名品牌易撰,基于新媒体大数据挖掘技术及NLP算法分析,为各内容创客、广告主提供全面、科学、精准的大数据分析服务以及大数据架构...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

DataWorks产品安全能力介绍

数据列级别多级审批:基于底层大数据引擎的访问控制列表与数据分级分类,DataWorks支持按项目与数据分级分类,定义数据列的权限申请及审批策略。说明 仅DataWorks企业版支持您根据业务需要自定义审批流程。数据质量规则:支持管理员配置...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

大数据安全治理的难点

存储 众所周知,大数据系统以数据类型多(结构化、非结构化、半结构化)、数据(动辄PB级别)著称,某些巨头组织一天就能新增数十万甚至数百万张表,如此体量给数据分级分类带来了极挑战,通过人工进行数据分级分类显然是不现实的,...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

客户案例

价值体现 从大数据平台上云整体“降本增效”的方案快速切入,迁移到大数据MaxCompute、实时计算、DataWorks后,部分任务有10倍以上的性能提升,存储从自建Hadoop 3PB降到900T,利用Flink实时数据处理能力,将宝宝树现有的场景实时化(...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

数据标准

数据是由特定的环境产生的,这些环境因素包括生产者、时间、系统等,从而造成了同一个语义的数据,有...说明 目前使用DDM进行数据建模可以进行逻辑建模和物理建模,但物理建模仅支持MaxCompute和Hive两种大数据引擎,不支持自定义数据源类型。

云产品集成

您可以使用 DMS 录入云数据库 OceanBase 的数据,通过 DMS 的全域数据资产管理、数据治理、数据库设计开发、数据集成、数据开发和数据消费等功能,帮助企业高效、安全地挖掘数据价值,助力企业数字化转型。什么是数据管理DMS 支持的数据库...

实验介绍

数据采集 数据加工 配置数据质量监控 数据可视化展现 目标人群 开发工程师、数据分析师、产品运营等存在数仓数据获取与数据分析洞察人员。涉及产品 本案例涉及以下产品:一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据采集,...

概述

高性能版引入Parquet模块化加密格式,用户可以使用自有密钥加解密数据,从而完全掌控数据控制权。关于密钥的详细信息,请参见 密钥介绍。高性能版的加密密钥由应用程序管理,密钥在计算过程中由默认应用程序中的InMemoryKMS类保管,并在...

平台安全诊断

安全检测维度 安全检测项 检测对象 检测方式 MaxCompute精细化数据权限控制 MaxCompute列级别权限控制 说明 MaxCompute 2.0安全模型具有更细粒度的数据权限管理能力、更科学的项目分权管控机制、更强大的端识别能力,支持用户实现更加贴合...

快速体验

数据采集 数据加工 配置数据质量监控 数据可视化展现 目标人群 开发工程师、数据分析师、产品运营等存在数仓数据获取与数据分析洞察人员。涉及产品 本案例涉及以下产品:一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据采集、...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将...MaxCompute处理业务数据和日志数据后,可以通过Quick BI快速地以可视化方式展现数据处理结果,详情请参见 基于MaxCompute的大数据BI分析。

数据源权限管理

一个数据源分享给目标用户后,源数据源可以控制分享关系,随时解除分享,且无需检查已分享数据源的任务依赖情况。一个数据源以 可编辑 模式分享给目标用户后,如果目标用户执行 取消分享 操作,会检查该分享数据源的任务依赖情况。如果有...

附录:数据地图权限管控能力总览

DataWorks默认租户成员可进入数据地图模块,在数据地图模块中,默认可查看已接入数据地图的项目元数据,您可通过当前文档针对以上场景进行不同粒度的访问控制。数据地图权限管控介绍 ...控制某表是否允许非该项目成员在数据地图查看表元数据。

数据集成

数据源支持情况 数据集成目前支持40种以上的数据源类型(包括关系型数据库、非结构化存储、大数据存储、消息队列等),通过定义来源与去向数据源,并使用数据集成提供的数据抽取插件(Reader)、数据写入插件(Writer),实现任意结构化、...

数据保护机制

MaxCompute提供了数据保护机制,支持对数据流出行为进行控制,为项目数据的安全性提供保障。本文为您介绍MaxCompute的数据保护机制以及开启数据保护机制后数据的流出策略。背景信息 部分公司对数据安全非常敏感,例如,只允许员工在公司...

系统配置

您可在数据保护伞的系统配置页面,设置数据保护伞的识别内容、识别范围,水印文件保存时间,是否展示风险识别的数据安全等级,以及告警信息的接收邮件及WebHook地址,以便及时发现并处理潜在安全风险。进入系统配置页面 进入数据开发页面。...

查看与减少数据备份

查看备份大小 备份大小=全量数据备份的大小+增量数据备份的大小 登录 DBS控制台。单击左侧导航栏中的 备份计划,然后在上方选择目标地域。单击目标备份计划名称,进入 备份任务配置 页面。在 付费信息 区域,查看全量备份数据量和增量备份...

RDS SQL Server空间不足问题

数据空间的回收通常有如下几种方式:归档数据 删除数据库中不常用的数据(例如早期的历史数据),或者根据需要迁移到其他数据库实例中,或者以其他形式归档保存,通过直接减少数据量来降低已使用数据空间大小。这种方式是控制数据空间增长...

离线同步并发和限流之间的关系

在一些数据同步场景,脏数据的出现会导致任务同步效率下降,以关系数据库写出为例,默认是执行batch批量写出模式,在遇到脏数据时会退化为单条写出模式(以找出batch批次数据具体哪一条是脏数据,保障正常数据正常写出),但单条写出效率会...

数据归档常见问题

归档为CSV格式的数据数据量可能会比归档为ORC格式的数据数据量更。为什么归档后的冷数据及文件在主账号下面的OSS上看不到?PolarDB 的冷数据存储在系统默认的OSS上,不在客户的OSS里,所以客户无法看到。目前只支持在PolarDB控制台上...

折线图

图表样式 折线图,一个类目只对应一个值,主要通过多系列数据配置的方式,展示同一类目下不同数据的变化,能够以折线和区域相结合的方式,智能地展示多维的数据变化趋势。样式面板 搜索配置:单击 样式 面板右上角的搜索配置项图标,可在...

区域图

标记描边 区域图内数据点的标记的描边样式,包括标记描边线的线型、粗细值和线的颜色,可单击 图标控制数据点标记描边样式的显隐。折线标签 折线的标签样式,单击 图标,控制折线标签配置项的显隐。标签字段:标签的内容需要和数据面板中...

折线图

重要 在画布编辑器中添加BI分析组件时,图层栏内会自动在当前BI组件上方对应生成一个分析器,且需要提前创建数据集以供BI分析组件选择并配置使用,创建数据集和分析器交互使用说明详情,请参见 添加数据集 和 BI分析器交互使用说明。...

区域图

重要 在画布编辑器中添加BI分析组件时,图层栏内会自动在当前BI组件上方对应生成一个分析器,且需要提前创建数据集以供BI分析组件选择并配置使用,创建数据集和分析器交互使用说明详情,请参见 添加数据集 和 BI分析器交互使用说明。...

将云消息队列 Kafka 版的数据迁移至MaxCompute

本文介绍如何使用DataWorks数据同步功能,将 云消息队列 Kafka 版 集群上的数据迁移至阿里云大数据计算服务MaxCompute,方便您对离线数据进行分析加工。前提条件 在开始本教程前,确保您在同一地域中已完成以下操作:云消息队列 Kafka 版 ...

Delta Lake概述

Delta Lake以数据为中心,围绕数据流走向(数据从流入数据湖、数据组织管理和数据查询到流出数据湖)推出了一系列功能特性,协助您搭配第三方上下游工具,搭建快捷、易用和安全的数据湖。背景信息 通常的数据湖方案是选取大数据存储引擎...

2023年

授权实践 2023-09-14 新增(邀测)MaxCompute Notebook使用说明 新说明 MaxCompute Notebook是由MaxCompute提供的全托管、交互式数据分析挖掘模块,为数据工程师、数据分析师及数据科学家等人员提供Web交互式开发环境。支持用户通过SQL、...

升级数据库版本

支持升级的数据版本 云数据库 MongoDB 版 控制台可以直接升级数据版本,但不同产品架构、不同版本的实例支持升级的版本不同,具体情况如下:产品架构 规格类型 实例的数据版本 可升级到的数据版本 单节点架构 通用型云盘版...

通过函数计算节点实现GitHub实时数据分析与结果发送

步骤四:配置案例 在 DataWorks控制台 左侧导航栏选择 大数据体验>ETL工作流模板,单击 Github十大热门编程语言 模板,单击 载入模板,配置模板参数。参数 说明 模板名称 显示当前模板名称,即“Github十大热门编程语言”。工作空间 选择 ...

从MaxCompute迁移至RDS MySQL

确保您已完成以下操作:开通MaxCompute 创建项目空间 设置阿里云产品访问MaxCompute白名单 注意事项 DTS在执行全量数据迁移时将占用源库和目标库一定的读写资源,可能会导致数据库的负载上升,在数据库性能较差、规格较低或业务量较的...

新功能试用申请

2023年9月 Notebook功能 MaxCompute Notebook是由MaxCompute提供的全托管、交互式数据分析挖掘模块,为数据工程师、数据分析师及数据科学家等人员提供Web交互式开发环境。支持用户通过SQL、PyODPS、Python等进行数据分析、探索,挖掘数据的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云数据库 Redis 版 数据库备份 DBS 云数据库 RDS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用