数据洞察

您可以通过数据洞察了解数据分布,创建数据卡片,并组合成数据报告。此外,数据洞察结果能够通过长图形式的报告进一步分享。该功能利用AI技术辅助数据分析,帮助您解析复杂数据,并为业务决策提供支持。权限说明 已拥有数据分析权限,查看...

新建分析报告

通过自由拼装生成的洞察分析图表,并添加个人业务想法生成洞察报告用于报告分析,本文主要介绍如何新建报告。前提条件 已成功添加洞察卡片,具体操作,请参见 添加洞察卡片。背景信息 报告由数据综合洞察分析的图表结果组成的,可包含多个...

数据源概览

本章节主要介绍如何使用Databricks数据洞察完成对多种数据源的读写,以及如何使用Databricks数据洞察完成与其他阿里云产品数据源之间的网络连接。静态数据源 Databricks数据洞察支持直接读取静态数据源。CSV文件 JSON文件 Parquet文件 ORC...

角色授权

首次使用Databricks数据洞察服务创建集群时,需要使用主账号为Databricks数据洞察服务授权名为AliyunDDIEcsDefaultRole的系统默认角色。同时需要您创建一个系统目录存储Bucket。背景信息 关于角色详细信息,具体可以参见 RAM角色概览。通过...

产品架构

Databricks数据洞察构建在ECS之上,使用阿里云对象存储服务(OSS)为核心存储。本文介绍Databricks数据洞察的产品架构。存储访问加速层方便您可以像操作HDFS上的数据一样访问OSS上的数据。目前,Databricks数据洞察提供了两种执行Spark作业...

弹性伸缩概述

本文介绍Databricks数据洞察的弹性伸缩功能,您可以根据业务需求和策略设置伸缩策略。弹性伸缩开启并配置完成后,当业务需求增长时Databricks数据洞察会自动为您增加Task节点以保证计算能力,当业务需求下降时Databricks数据洞察会自动减少...

Python库管理

本文介绍在Databricks数据洞察控制台,执行Spark作业时,如何安装自定义的库或者第三方库。添加库 使用阿里云账号登录 Databricks数据洞察控制台。在Databricks数据洞察控制台页面,选择所在的地域(Region)。创建的集群将会在对应的地域...

阿里云Databricks数据洞察服务等级协议(SLA)

阿里云Databricks数据洞察服务等级协议(SLA)的详情,请参见 阿里云Databricks数据洞察服务等级协议。

集群

Q:如何购买Databricks数据洞察集群 请使用阿里云账号进行购买,如需折扣优惠,请提工单或在产品群中联系我们享受折扣优惠。Q:可以使用阿里云子账号创建集群么?可以。但子账号必须通过主账号进行授权方可购买,权限包括:...

服务关联角色

本文介绍Databricks数据洞察服务关联角色AliyunServiceRoleForDDI以及如何删除该角色。背景信息 Databricks数据洞察服务关联角色AliyunServiceRoleForDDI是Databricks数据洞察在某些情况下,为了完成自身的某个功能,需要获取其他云服务的...

管理运维中心

在Databricks数据洞察控制台页面,选择所在的地域(Region)。创建的集群将会在对应的地域内,一旦创建后不能修改。在左侧导航栏,单击 项目空间。在 项目空间 页面,单击待操作项目所在行的 运行记录。单击上方的 概览 页签。展示当前项目...

产品优势

全托管的Databricks数据洞察大数据分析平台,可以让您从繁杂的环境运维、内核优化等工作中解脱出来,专注于开发Spark作业本身。本文介绍Databricks数据洞察的产品优势。高效稳定 产品内核使用Databricks商业版的Runtime和Delta Lake。与...

应用场景

Databricks数据洞察(简称DDI)的核心引擎是Databricks Runtime和Databricks Delta Lake。商业版引擎的加持下,为您提供了新一代云数仓的解决方案。本文为您介绍Databricks数据洞察适用的典型应用场景。数据湖分析 Databricks数据洞察支持...

数据湖元数据管理

Databricks 数据洞察DBR 7.3,Spark 3.0.1,Scala 2.12及之后版本,在创建集群选择元数据类型时支持数据湖元数据作为Hive数据库。数据湖元数据是服务化高可用并且可扩展的元数据库,您无需额外购买独立的元数据库,就可以实现多个引擎计算,...

为RAM用户授权

为确保RAM用户能正常使用Databricks 数据洞察控制台的功能,您需要使用云账号登录访问控制RAM(Resource Access Management),授予RAM用户相应的权限。背景信息 访问控制RAM是阿里云提供的资源访问控制服务,更多详情请参见 什么是访问...

访问外部数据

本文介绍如何在Databricks数据洞察实现访问外部数据源的需求。背景信息 Databricks数据洞察为了满足您在计算任务里访问您在阿里云上已有的数据,支持通过添加外部数据源的方式,打通集群到您自己VPC下的网络环境。绑定数据源 绑定数据源的...

为什么次日才可以查看报表数据

数据洞察报表功能说明 数据洞察报表功能说明 参见「代码洞察报表」Q:开启数据洞察服务之后,为什么次日才可以查看数据?A:Codeup 将 客户数据资产安全 永远放在第一位,因此在未授权 Codeup 访问你的代码数据前,我们不会主动采集分析你...

释放集群

在Databricks数据洞察控制台页面,选择所在的地域(Region)。在左侧导航栏中,单击 集群。设置释放。在集群管理页面,单击待释放集群所在行的释放。单击待释放集群的集群ID,在集群基础信息页面,单击集群操作>释放。在弹出的集群管理-...

什么是Databricks数据洞察

Databricks数据洞察(简称DDI)是基于Apache Spark的全托管大数据分析平台。产品内核引擎使用Databricks Runtime,并针对阿里云平台进行了优化。DDI为您提供了高效稳定的阿里云Spark服务,您无需关心集群服务,只需专注在Spark作业的开发上...

阿里云Databricks数据洞察云产品服务协议

阿里云Databricks数据洞察云产品服务协议,请参见 阿里云产品服务协议(通用)。

管理项目告警

添加联系人 登录阿里云 Databricks 数据洞察控制台 在左侧导航栏单击 项目空间 单击 项目空间 中的 告警 在 联系人 区域,单击 添加;在 联系人 对话框中,输入 姓名、手机号码 和 Email 信息。分别单击 手机号码 和 Email 所在行的 获取...

PySpark及Python库使用

本文介绍如何使用阿里云 Databricks数据洞察 Notebook 进行 PySpark 开发。重要 若要使用其他数据源进行数据开发,需开通相应服务。本示例采用OSS数据源。步骤一:创建 Databricks数据洞察集群 登录 阿里云Databricks数据洞察控制台。创建...

到期与欠费

本文介绍Databricks数据洞察的停服欠费策略。停服欠费说明 计费方式 停服或欠费说明 包年包月 购买的集群资源到期后立即停机。停机后168小时(7天),集群资源会被释放。按量计费 暂不支持

数据

本文将解答与数据源相关的问题。Q:Databricks数据洞察的支持哪些数据源?目前支持读写阿里云对象存储(OSS)的数据。Q:是否支持当前的DDI集群访问其他集群的HDFS数据?支持访问同账号下的EMR Hadoop集群上的HDFS数据。

使用Spark Structured Streaming实时处理Kafka数据

本文介绍如何使用阿里云 Databricks 数据洞察创建的集群去访问外部数据源 E-MapReduce,并运行Spark Structured Streaming作业以消费Kafka数据。前提条件 已注册阿里云账号,详情请参见 阿里云账号注册流程。已开通 E-MapReduce服务。已...

集群扩容

当Databricks 数据洞察集群计算资源或存储资源不足时,您可以对集群进行水平扩展。目前支持Worker 实例的扩容。扩容操作步骤 登录阿里云 Databricks 数据洞察控制台。在左侧导航栏的菜单下,单击 集群管理。选择想要扩容的集群,单击 集群...

管理Notebook

在Databricks数据洞察控制台页面,选择所在的地域(Region)。创建的集群将会在对应的地域内,一旦创建后不能修改。在左侧导航栏中,单击 Notebook。在 Notebook 区域,选择待操作的集群。单击 Create new note。在 Create new note 对话框...

Databricks数据洞察 vs Open-Source Delta Lake功能...

本文提供Databricks数据洞察中的Databricks Runtime Delta与社区开源版本Delta Lake。Databricks Runtime vs Apache Spark 下表中的 feature 列表来自 Databricks 官网...

续费流程

本文为您介绍如何手动和自动续费Databricks数据洞察(DDI)集群,以及取消自动续费。背景信息 只有包年包月集群才需要进行续费操作,按量集群是实时结算的。DDI续费方式包括手动续费和自动续费两种。前提条件 请确认包年包月集群还未到期。您...

创建集群

本节介绍如何使用Databricks数据洞察控制台创建集群。前提条件 已注册阿里云账号,并完成实名认证。详情请参见 阿里云账号注册流程。操作步骤 使用阿里云账号登录 Databricks数据洞察控制台。在Databricks数据洞察控制台页面,选择所在的...

查看ECS使用成熟度评估与洞察报告

ECS使用成熟度评估与洞察报告展示了该账号ECS使用成熟度评估现状全貌,您可通过单击六大维度页签,查看各维度下各评估项说明、得失分结果和对应的最佳实践。①:展示该账号下ECS使用成熟度评估现状全貌:包括六大维度总分,每个维度的得分...

Databricks Runtime版本说明

Databricks数据洞察的内核引擎是Databricks Runtime,Databricks Runtime包括Apache Spark,并在此基础上进行了大量的功能和性能优化,可以显著提高大数据分析的可用性、性能和安全性。Databricks Runtime版本与Databricks官方保持一致,...

用户管理

本文介绍如何通过Databricks 数据洞察的用户管理功能,管理集群DDI用户。DDI用户信息存储在集群自带的OpenLDAP中,主要用于在DDI集群内的身份认证。DDI用户可以用于访问链接与端口,查看组件Web UI时的用户身份认证,也可以在开启组件LDAP...

Notebook概述

相关操作 有关Notebook的更多操作,请参见:管理Notebook 使用Notebook 说明 每个Databricks数据洞察集群都会部署独立DataInsight Notebook服务。用户在使用Notebook时,需要先选择一个可用的集群。icmsDocProps={'productMethod':'created...

独立RDS元数据库

本文介绍如何配置独立的阿里云RDS,作为Databricks数据洞察集群的元数据。前提条件 已购买RDS,详情请参见 创建RDS MySQL实例。说明 本文以MySQL 5.7版本为例介绍。元数据库准备 创建hivemeta的数据库 详情请参见 创建数据库和账号 中的...

按负载伸缩规则配置

在使用Databricks数据洞察集群时,如果您无法准确的预估大数据计算的波峰和波谷,则可以使用按负载伸缩配置的策略。在Databricks数据洞察中开启弹性伸缩时,如果选择按负载配置伸缩规则,则根据以下说明配置相关参数即可。详细配置步骤请...

包年包月

本文主要介绍Databricks数据洞察产品使用包年包月的付费方式时计算资源的费用参考(不包含块存储的价格)。说明 公测期间创建的按量付费集群,在公测结束后,将被释放。请您提前做好作业备份。使用对象存储OSS产生的费用需要另行计算,不...

查看集群列表信息

在Databricks数据洞察控制台页面,选择所在的地域(Region)。创建的集群将会在对应的地域内,一旦创建后不能修改。在左侧导航栏中,单击 集群。集群管理 页面展示您所拥有的所有集群的基本信息,以及各集群支持的操作。参数 说明 集群ID/...

风险事件

云盘数据保护 如果云盘未创建快照备份数据,系统会在数据洞察的风险事件列表推送数据安全事件。以下步骤指导您如何查看哪些云盘没有创建快照以及如何创建快照。登录 块存储EBS控制台。首次登录EBS控制台时,请根据页面提示创建一个EBS服务...

云盘分析

您可以通过EBS控制台的数据洞察(CloudLens for EBS)查看云盘的监控数据,进而实时掌控业务波动与资源消耗情况。本文主要介绍如何查看云盘性能数据、风险事件以及ESSD AutoPL云盘的Burst详情。开通CloudLens for EBS 首次登录CloudLens ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 DBS 数据传输服务 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用