阿里云数据集成平台-阿里云数据集成平台文档介绍内容-阿里云

通过SeaTunnel集成平台将数据写入OSS-HDFS服务

通过SeaTunnel<em>集成平台</em>将<em>数据</em>写入OSS-HDFS服务

SeaTunnel是一个开源、易用的超高性能分布式数据集成平台，支持海量数据的实时同步。本文介绍如何通过SeaTunnel集成平台将数据写入OSS-HDFS服务。背景信息 SeaTunnel可稳定高效地同步百亿级数据，专注于数据集成和数据同步，主要解决数据...

在大数据平台中集成Tair

常见大数据分析平台集成 Tair 的方法如下：大数据开发治理平台DataWorks：请参见配置Redis Writer插件。说明 Tair 完全兼容Redis，您可以参考该文档配置 Tair 实例信息，但暂不支持接入 Tair 自研的扩展数据结构。实时计算Flink版：请参见...

离线数据集成（DataWorks+MaxCompute）

计费说明物联网平台数据集成流出会消耗数据处理单元（CU）。详细说明，请参见数据服务计费说明的数据集成。DataWorks中数据集成的计费逻辑，请参见计费逻辑说明。MaxCompute的计费信息，请参见计费概述。使用流程前提条件如果集成...

实时数据集成的连接器

在使用Flink SQL开发作业集成物联网平台数据时，需要使用SQL连接器连接物联网平台的数据表（产品属性时序数据、产品事件数据和自定义时序存储表）。物联网平台提供了连接器作为实时计算Flink全托管自定义连接器使用。本文介绍如何使用实时...

收费常见问题

本文为您介绍数据集成收费相关问题及解决方案。数据集成是怎么收费的？数据集成收费包含三种途径，详情请参见独享数据集成资源组计费说明：包年包月、公共数据集成（调试）资源组：按量计费、公网流量计费说明。

概述

消息集成是一个全栈式的消息与数据集成平台，可显著简化您的消息集成流程，并支持云上云下、跨区域集成，帮助您实现数字化转型。消息集成为消息产品提供的低代码，全栈事件流（EventStreaming）服务平台，聚焦消息集成、数据连接、数据处理...

概述

消息集成是一个全栈式的消息与数据集成平台，可显著简化您的消息集成流程，并支持云上云下、跨区域集成，帮助您实现数字化转型。消息集成为消息产品提供的低代码，全栈事件流（EventStreaming）服务平台，聚焦消息集成、数据连接、数据处理...

概述

消息集成是一个全栈式的消息与数据集成平台，可显著简化您的消息集成流程，并支持云上云下、跨区域集成，帮助您实现数字化转型。消息集成为消息产品提供的低代码，全栈事件流（EventStreaming）服务平台，聚焦消息集成、数据连接、数据处理...

日志服务通过数据集成投递数据

本文将以LogHub数据同步至MaxCompute为例，为您介绍如何通过数据集成功能同步LogHub数据至数据集成已支持的目的端数据源（例如MaxCompute、OSS、Tablestore、RDBMS和DataHub等）。前提条件准备好相关的数据源，详情请参见创建MaxCompute...

数据集成审批策略

数据集成审批策略支持管理员从DataWorks空间级别为数据集成任务的保存操作定义审批策略。本文为您介绍如何创建数据集成审批策略。背景信息支持管理员按源端、目的端数据源的组合来定义需要被审批的数据集成任务，包括：在数据集成或数据...

物联网数据处理分析架构参考

业务描述企业案例有四个业务同时使用物联网平台数据：企业信息部门需要分析1年范围的设备时序数据，产出设备增长、活跃的企业经营指标。业务部门需要查询近3天左右数据，用于分析设备启停周期的业务应用。企业风控部门需要追踪设备近6个月...

独享数据集成资源组

在数据集成任务高并发执行且无法错峰运行的情况下，需要专有的计算资源组来保障数据快速、稳定的传输时，建议您选择使用DataWorks的独享数据集成资源组。本文为您概要介绍独享数据集成资源组。功能介绍独享数据集成资源组的功能亮点如下：...

集成概述

Connector生态集成是一个全栈式的消息与数据集成平台，可显著简化您与其他产品集成的流程，并支持云上云下、跨区域集成，帮助您实现数字化转型。Connector生态集成为消息产品提供的低代码，全栈事件流（EventStreaming）服务平台，聚焦消息...

UpdateDISyncTask

调用UpdateDISyncTask更新数据集成同步任务。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。请求参数名称类型是否必选示例值描述 Action String 是 ...

CreateDISyncTask

调用CreateDISyncTask创建数据集成同步任务。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。请求参数名称类型是否必选示例值描述 Action String 是 ...

DataWorks公共数据集成（调试）资源组下线公告

已经配置了DataWorks公共数据集成资源组的任务可继续正常运行，但不能对这些任务进行修改，若您需修改这些任务，请于 2024年4月1日前切换为 DataWorks独享数据集成资源组。2024年9月1日起，DataWorks公共数据集成资源组不再提供服务，...

计费方式

运行数据集成任务会产生DataWorks相关费用，此外还可能其他产品费用，具体如下：DataWorks相关收费 数据集成资源组（独享数据集成资源组计费说明：包年包月，如果使用公共数据集成（调试）资源组：按量计费，则还包括公共数据集成资源组...

TerminateDISyncInstance

下线数据集成实时同步任务。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。请求参数名称类型是否必选示例值描述 Action String 是 ...

专有网络VPC的数据源连通独享数据集成资源组

本文以阿里云RDS数据库为例，为您介绍专有网络VPC的数据源如何连通独享数据集成资源组。前提条件购买RDS MySQL实例。本文以购买MySQL 5.7版本的MySQL实例为例，您可以根据业务需求进行配置。详情请参见快速创建RDS MySQL实例。在目标实例...

DeleteDISyncTask

调用DeleteDISyncTask接口，删除数据集成同步任务。当前仅支持使用该接口删除实时数据同步任务。如果您希望删除离线数据同步任务，请使用DeleteFile接口，具体操作流程请参考删除同步任务。调试您可以在OpenAPI Explorer中直接运行该接口...

实时数据集成（Flink版）

物联网平台数据服务中的产品属性时序表、产品事件表和自定义存储表（时序表）数据，可以集成到阿里云实时计算Flink版中计算和分析，以便您实时分析和诊断设备的运行状况，实时检测运行故障等。本文介绍使用实时计算Flink版的连接器功能集成...

MySQL分库分表同步至MaxCompute

本文以MySQL分库分表实时写入MaxCompute场景为例，为您介绍如何通过数据集成同步分库分表数据至MaxCompute。前提条件已完成MaxCompute和MySQL数据源配置。您需要将数据库添加至DataWorks上，以便在同步任务配置时，可通过选择数据源名称来...

新增和使用独享数据集成资源组

您可以使用DataWorks独享数据集成资源组功能，为数据集成同步任务分配独立的计算资源，从而提高任务的执行效率和稳定性。购买独享资源组后，在实际使用前您还需进行网络绑定、白名单等配置操作。本文为您介绍从购买至使用独享数据集成资源...

配置资源组与网络连通

在数据同步任务配置前，您需要确保用于执行同步任务的独享数据集成资源组与您将要同步的数据来源端与目的端数据库的网络连通性，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本文为您介绍数据库在不同网络环境中...

MySQL分库分表同步至Hologres（方案1.0）

本文以MySQL分库分表实时写入Hologres场景为例，为您介绍如何通过数据集成同步分库分表数据至Hologres。前提条件已完成Hologres和MySql数据源配置。您需要将数据库添加至DataWorks上，以便在同步任务配置时，可通过选择数据源名称来控制...

离线同步写入MongoDB数据

DataWorks的数据集成为您提供MongoDB Writer插件，可从其他数据源中读取数据，并将数据同步至MongoDB。本文以一个具体的示例，为您演示如何通过数据集成将MaxCompute的数据离线同步至MongoDB。前提条件本实践进行操作时，需满足以下条件。...

通过数据集成导入数据至Elasticsearch

本文为您介绍如何通过数据集成导入离线Elasticsearch数据。前提条件准备阿里云账号，并创建账号的访问密钥。详情请参见开通DataWorks服务。开通MaxCompute，自动产生一个默认的MaxCompute数据源，并使用主账号登录DataWorks。创建工作...

Napatech案例

Lindorm支持海量数据的低成本存储、快速批量导入和实时访问，具备高效的增量及全量数据通道，可轻松与各类大数据平台集成，完成数据的大规模离线分析。基于Lindorm的解决方案，用户在采用到100Gbps+流量产生的大量数据包元数据直接通过...

Kafka单表实时入湖OSS（HUDI）

本文以Kafka实时入湖写入至OSS场景为例，为您介绍如何通过数据集成实时入湖。使用限制 Kafka的版本需要大于等于0.10.2小于等于2.2.0。本实践仅支持使用独享数据集成资源组。准备独享数据集成资源组并与数据源网络连通在进行数据同步前，...

公共数据集成（调试）资源组：按量计费

公共数据集成（调试）资源组是DataWorks提供的公共资源组的一种，计费方式为按量计费。本文为您介绍公共数据集成（调试）资源组的按量计费详情。背景信息所有阿里云DataWorks用户共享使用公共数据集成（调试）资源组资源，使用高峰期可能...

MySQL整库实时同步至OSS数据湖

本文以MySQL实时入湖写入至OSS场景为例，为您介绍如何通过数据集成实时入湖。前提条件已购买合适规格的独享数据集成资源组。详情请参见：新增和使用独享数据集成资源组。已完成MySQL和OSS数据源配置，以便在同步任务配置时，可通过选择...

MySQL分库分表同步至Hologres（方案2.0）

本文将以MySQL分库分表实时写入实时数仓Hologres场景为例，为您介绍分库分表写入Hologres数据集成最佳实践。前提条件已完成Hologres和MySql数据源配置。您需要将数据库添加至DataWorks上，以便在同步任务配置时，可通过选择数据源名称来...

实时同步字段格式

本文为您介绍数据集成实时同步字段的格式及附加列。数据集成实时同步MySQL或Oracle数据的记录格式如下。sequence_id_operation_type_execute_time_before_image_after_image_字段1 字段2 字段3 增量事件的记录 ID，值唯一且递增。操作类型...

GenerateDISyncTaskConfigForUpdating

DataWorks目前仅支持直接使用 UpdateDISyncTask 接口更新数据集成离线同步任务，而数据集成实时同步任务和解决方案同步任务则需要先调用GenerateDISyncTaskConfigForUpdating和 QueryDISyncTaskConfigProcessResult 接口，异步生成更新数据...

常见问题

本文为您介绍数据集成任务常见问题。资源组操作及网络连通在做离线同步时，我们需要先了解哪些DataWorks及其网络能力？同步ECS自建的数据库的数据时，如何保障数据库与DataWorks的网络连通？数据库和DataWorks不在同一个地域（Region）下...

离线同步读取MongoDB数据

DataWorks的数据集成为您提供MongoDB Reader插件，可从MongoDB中读取数据，并将数据同步至其他数据源。本文以一个具体的示例，为您演示如何通过数据集成将MongoDB的数据离线同步至MaxCompute。背景信息本实践的来源数据源为MongoDB，去向...

通过OpenAPI创建、修改、删除离线同步任务

本文为您介绍如何使用OpenAPI创建、修改、删除数据集成同步任务，同步来源端数据至去向端。前提条件已创建Maven项目，详情请参见创建Maven项目。已创建业务流程，详情请参见创建周期业务流程。已创建同步任务需要的数据源，详情请参见 ...

通过OpenAPI创建、修改、删除离线同步任务

本文为您介绍如何使用OpenAPI创建、修改、删除数据集成同步任务，同步来源端数据至去向端。前提条件已创建Maven项目，详情请参见创建Maven项目。已创建业务流程，详情请参见创建周期业务流程。已创建同步任务需要的数据源，详情请参见 ...

DataWorks数据集成服务关联角色

数据集成支持RAM角色授权模式。本文为您介绍如何获取DataWorks数据集成相关的RAM角色列表、删除服务关联角色，以及子账号如何创建服务关联角色所需要的权限。应用场景当您通过RAM角色授权模式创建DataWorks数据源时，请选择相关的自定义...

UpdateDIProjectConfig

调用UpdateDIProjectConfig修改当前工作空间中数据集成同步解决方案任务默认的全局配置。当前DataWorks仅支持为同步解决方案任务中的实时同步DDL消息处理策略设置默认的全局配置。如果您的同步解决方案任务包含实时同步任务，则配置 DDL...

阿里云数据集成平台

新品推荐