本文为您介绍如何通过DataWorks数据同步功能,迁移阿里云Elasticsearch集群上的数据至MaxCompute。
前提条件
- 已开通MaxCompute服务。
开通指导,详情请参见开通MaxCompute。
- 已开通DataWork服务。
开通指导,详情请参见开通DataWorks。
- 在DataWorks上已完成创建业务流程。
本例使用DataWorks简单模式,详情请参见创建业务流程。
- 已搭建阿里云Elasticsearch集群。
进行数据迁移前,您需要保证自己的阿里云Elasticsearch集群环境正常。搭建阿里云Elasticsearch集群的详细过程,请参见快速入门。
本示例中阿里云Elasticsearch的具体配置如下:- 地域:华东2(上海)
- 可用区:上海可用区B
- 版本:5.5.3 with Commercial Feature
背景信息
Elasticsearch是一个基于Lucene的搜索服务器,它提供了一个多用户分布式的全文搜索引擎。Elasticsearch是遵从Apache开源条款的一款开源产品,是当前主流的企业级搜索引擎。
阿里云Elasticsearch提供Elasticsearch 5.5.3 with Commercial Feature、6.3.2 with Commercial Feature、6.7.0 with Commercial Feature及商业插件X-pack服务,致力于数据分析、数据搜索等场景服务。在开源Elasticsearch基础上提供企业级权限管控、安全监控告警、自动报表生成等功能。
操作步骤
- 在Elasticsearch上创建源表。详情请参见通过DataWorks将MaxCompute数据同步至Elasticsearch。
- 在MaxCompute上创建目标表。
- 同步数据。
- 查看结果。