数据保护规则简介

说明 进行任意查询时,涉及的数据都可以用<数据库,数据表,数据列>来表示。只有当数据库、数据表、数据列都被一条规则中的 meta 数据匹配上时,数据才会按照规则中指定的算法进行处理。在设置数据保护规则时,您需要保证 不同规则作用的...

大数据安全治理的难点

同时,大数据系统基于“存储、用户、入口、流转、交付”等多方面的特点,存在诸多安全治理难点。数据安全治理的关键问题 数据安全治理能否清楚、准确地回答如下问题,将从侧面反映安全治理项目是否能有效地落地。哪些资产需要被保护?您有...

JindoFS介绍和使用

这些高阶存储接口对实现完整的POSIX和对接更多的大数据引擎到OSS是不可或缺的,例如,Flink、HBase、Kafka和Kudu。其他两种方式使用OSS也可以对接部分接口,但是能力和优势会有所不足。Block模式在费用上优于其他两种方式使用OSS。Block...

常见问题

(自动生成是指配置cleanup=true执行同步任务)向ES写入数据时,会一次无用户名的提交,但仍需验证用户名,导致提交失败,因此提交的所有请求数据都被记录,导致审计日志每天都会有很多,如何处理?Elasticsearch writer配置了Settings,...

X-Engine简介

因为目标是面向大规模的海量数据存储,提供高并发事务处理能力和降低存储成本,在大部分大数据量场景下,数据被访问的机会是不均等的,访问频繁的热数据实际上占比很少,X-Engine根据数据访问频度的不同将数据划分为多个层次,针对每个层次...

索引优化

大数据集场景下优先考虑稀疏索引:如果您的数据量非常地大,并且您的查询限定条件为<、、=、>=、>,需要从大数据量的表中取出少于50%的数据,那么使用稀疏索引(BRIN Index或者AOCS表的metascan)可以极大地减少无效数据的加载。...

分区表常见问题

是的,分区表把数据切分成小的分片独立管理,从而使得拥有大数据量的表仍然拥有高性能和高可用。分区表的更多介绍请参见 分区表概述。业务上估算单张表的数据量为2 TB,选择使用 PolarDB MySQL版 还是PolarDB-X?PolarDB MySQL版 单表最大...

实时同步常见问题

若源端数据更新快,数据量多,但同步延迟,您可以:修改任务配置:您可以在源端数据库最大连接数许可范围内,基于同步库或表个数综合评估调整实时同步并发数。说明 并发设置上限为当前资源组支持的最大并发数。不同规格资源组支持的最大...

SmartData常见问题

Hortonworks版本(Hortonworks Data Platform,简称HDP)和Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH)都可以使用,但可能会存在冲突,需要修改配置 fs.oss.impl=JindoOssFileSystem。JindoFS可以在ECS自...

数据库代理常见问题

每个RDS实例在开通数据库代理后,都可以申请1~7个代理地址,每个代理地址都可以申请1个内网连接地址和外网连接地址,更多信息,请参见 新增代理连接地址。数据库代理的性能会随着代理地址的增多而提升吗?不会。如果您的RDS MySQL实例为高...

DataWorks数据集成

无论是哪种应用场景,都可以通过DataWorks的数据集成功能完成数据的同步过程,详细的操作步骤(包括创建数据集成任务、数据源配置、作业配置、白名单配置等),请参考 DataWorks文档 中的使用指南->数据集成一栏。文章中余下部分会介绍 ...

Tunnel命令常见问题

可以并行上传。是否支持多个客户端同时上传数据至同一张表?支持。使用Tunnel Upload命令上传数据时一定要先存在分区吗?您也可以使用Tunnel Upload命令的-acp 参数,自动创建目标分区,默认值为False。详情请参见 Tunnel命令。使用Tunnel ...

数据资产定级

假设该应用会直接影响整个企业的重要业务决策,您可以定级应用为A2,从而整个数据链路上的表的数据等级,都可以标记为A2-PV_UV_Region。说明 当前MaxCompute暂无配套资产等级打标工具,您可以使用第三方工具完成打标。

数据资产定级

假设该应用会直接影响整个企业的重要业务决策,您可以定级应用为A2,从而整个数据链路上的表的数据等级,都可以标记为A2-PV_UV_Region。说明 当前MaxCompute暂无配套资产等级打标工具,您可以使用第三方工具完成打标。icmsDocProps={'...

常见问题

支持的数据库部署位置(接入方式)阿里云实例 有公网IP的自建数据库 通过数据库网关DG接入的自建数据库 通过云企业网CEN接入的自建数据库 ECS上的自建数据库 通过专线/VPN网关/智能接入网关接入的自建数据库 阿里云实例 通过数据库网关DG接...

常见问题

数据迁移 搜索索引数据可以通过LTS迁移吗?什么是搜索索引?搜索索引是宽表引擎的一种新型索引,可以对查询进行加速。主要面向复杂的多维查询场景,能够覆盖分词、模糊查询、聚合分析、排序翻页、向量检索等场景。详细介绍,请参见 搜索...

常见问题

磁盘 HDD和SSD都可以。磁盘容量评估,可以按照压缩比3,磁盘利用率70%~75%作为上限来进行评估。如果导入到SR的数据是Parquet或Orc的Hive数据,则压缩比按照1:1来评估。例如,Hive数据是3T,则导入StarRocks的数据也是3T。CPU CPU必须支持...

DQL操作常见问题

MAPJOIN中的大表和小表是否可以互换位置?其他 MaxCompute SQL设置过滤条件后,报错提示输入的数据超过100 GB,如何解决?MaxCompute SQL中模糊查询的WHERE条件是否支持正则表达式?如果只同步100条数据,如何在过滤条件WHERE中通过LIMIT...

混合存储型(已停售)

云原生内存数据库Tair 混合存储型整合了内存和磁盘二者的优势,在提供高速数据读写能力的同时满足了数据持久化的需求。说明 混合存储型已停止售卖,更多信息,请参见【通知】混合存储型实例停止售卖,推荐选择 持久内存型 实例。简介 图 1....

常见问题

如果无法调整批量大小,可以在控制台修改参数:merge_tree.parts_to_throw_insert,将参数的取值设置的大一些。为什么DataX导入速度慢?常见原因及解决方案如下。常见原因1:参数设置不合理。ClickHouse适合使用大batch、少数几个并发进行...

PolarDB PostgreSQL版(兼容Oracle)间的迁移

通过数据传输服务DTS(Data Transmission Service),可以实现 PolarDB PostgreSQL版(兼容Oracle)集群间的迁移。背景信息 PolarDB PostgreSQL版(兼容Oracle)作为一款企业级关系型数据库管理系统,具有广泛的应用和强大的社区支持。每个...

离线同步常见问题

数据同步原则:来源端数据源的数据要能写入目的端数据源(来源端和目的端类型需要匹配,字段定义的大小需要匹配),即源端数据类型需要与写端数据类型匹配,源端是VARCHAR类型的数据不可写到INT类型的目标列中;目标端的数据类型定义的大小...

PolarDB PostgreSQL版间的迁移

通过数据传输服务DTS(Data Transmission Service),可以实现 PolarDB PostgreSQL版 集群间的迁移。前提条件 已创建源和目标 PolarDB PostgreSQL版 数据库集群,详情请参见 创建PolarDB PostgreSQL版数据库集群。已将源和目标 PolarDB ...

查看数据校验详情

本文介绍如何查看数据传输服务DTS(Data Transmission Service)数据校验任务的详情。前提条件 已创建并配置数据校验任务,详情请参见 配置数据校验。注意事项 在DTS同步或迁移实例中配置的校验任务,支持在实例详情和校验任务列表查看;...

概述

仪表盘是数据分析和数据展示的画布,在仪表盘中可以做实时的数据分析,也可以将数据制作为报表进行展示或分享。大屏是针对屏幕的特殊数据展示画布,支持灵活自定义的样式配置。应用场景 安全自助式数据分析 基于DMS安全管控底座,确保...

冷热分层

更多介绍请参见 结构化大数据分析平台设计、面向海量数据的极致成本优化-云HBase的一体化冷热分离 和 云上如何冷热数据分离。冷热数据 数据按照实际访问的频率可以分为热数据、温数据和冷数据。其中冷数据的数据量较大,很少被访问,甚至...

互联网、电商行业离线大数据分析

通过阿里云MaxCompute、云数据库RDS MySQL、DataWorks等产品,可以实现互联网、电商网站的...可视化编辑:在图形化的编辑页面,通过拖拽即可完成专业级的大数据可视化。方案详情 方案的详情请参见 互联网、电商行业离线大数据分析和大屏展示。

MySQL分库分表同步至MaxCompute

自动生成逻辑表的功能,可以大大简化逻辑表的配置步骤,一般情况下,我们都可以使用自动生成逻辑表来扫描源端数据源,简化部分配置操作。如果自动扫描的结果不符合预期,只需要对自动扫描的结果简单修正即可。复杂的物理库表规则可以...

MySQL分库分表同步至MaxCompute

自动生成逻辑表的功能,可以大大简化逻辑表的配置步骤,一般情况下,我们都可以使用自动生成逻辑表来扫描源端数据源,简化部分配置操作。如果自动扫描的结果不符合预期,只需要对自动扫描的结果简单修正即可。复杂的物理库表规则可以...

自媒体:易撰

所属行业:自媒体 网站地址:易撰 客户介绍 长沙营智信息技术有限公司是专业的新媒体大数据服务商,其旗下知名品牌易撰,基于新媒体大数据挖掘技术及NLP算法分析,为各内容创客、广告主提供全面、科学、精准的大数据分析服务以及大数据架构...

概述

如果使用自建开源大数据生态体系,例如Hive、Spark等,需要专门的大数据工程师来操作和运维,且操作流程也不像使用MySQL一样简单,成本极高。解决方案 T+1全量同步一键建仓是指通过DLA控制台配置数据源(RDS、PolarDB for MySQL、MongoDB...

Quick BI连接MaxCompute

背景信息 智能分析套件Quick BI是一个专为云上用户量身打造的易上手、性能强的大数据分析及可视化平台,可以让每个人能成为数据分析师。Quick BI不仅是业务人员查看数据的工具,更是数据化运营的助推器。更多Quick BI信息,请参见 Quick ...

Hive统一元数据

使用统一的元数据库,如果您的所有数据都存放在OSS之上,则不需要做任何元数据的迁移和重建,所有集群是可以直接访问数据,这样每个EMR集群可以做不同的业务,但是可以很方便地实现数据的共享。创建使用统一元数据的集群 支持以下两种...

常见问题

在数据水印的基础上,数据安全中心通过系统内置的异常事件检测,对运维高危操作、异常访问、拖库攻击、数据库注入、数据库外联、数据库高危操作等行为进行监控告警,覆盖传统数据库的基础上,还支持对象存储OSS、大数据平台MaxCompute以及...

仪表盘

配置图表筛选器 部分图表或组件都可以配置图表筛选器,操作步骤如下:在仪表盘编辑页面选中需要进行配置的图表。在图表配置区域,选择 数据 配置标签。将需要配置筛选 WHERE 条件的字段从数据集面板拖拽到筛选字段配置区域。单击字段后的...

什么是EMR on ACK

可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注大数据任务本身。形态对比 阿里云EMR提供on ECS和on ACK两种方式,以...

ECS实例说明

大数据量(10 TB或以上)情况下,推荐使用大数据机型,可以获得极高的性价比。重要 当Core核心实例使用本地盘时,HDFS数据存储在本地盘,需要您自行保证数据的可靠性。Task计算实例 用于补充集群的计算能力,可以使用除大数据型外的所有...

产品优势

全托管的Databricks数据洞察大数据分析平台,可以让您从繁杂的环境运维、内核优化等工作中解脱出来,专注于开发Spark作业本身。本文介绍Databricks数据洞察的产品优势。高效稳定 产品内核使用Databricks商业版的Runtime和Delta Lake。与...

PyODPS概述

不同的是,这样写的程序在提交到MaxCompute端执行时,有多台机器同时处理数据可以节约很多时间。调用persist接口会将产生的数据直接写到另一张MaxCompute表中,所有的数据产生与消费在 MaxCompute集群完成,也节约了本地的网络与内存。...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据传输服务 云数据库 Redis 版 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用