创建OpenLake工作空间

您可以通过DataWorks的工作空间模块快速创建适用于OpenLake解决方案的工作空间。

OpenLake工作空间介绍

  • 产品介绍

    DataWorks创建工作空间时,工作空间模板选择了OpenLake即为OpenLake工作空间。OpenLake工作空间是一个适用于开放可控数据湖仓构建的大数据/搜索/AI一体化解决方案的工作空间。更多工作空间模板请参见DataWorks工作空间模板介绍

    • 基于开放可控数据湖仓构建的大数据/搜索/AI一体化解决方案。

    • 通过DLF管理结构化与半/非结构化数据,支持湖仓表和文件的安全访问及IO加速。

    • 具备多引擎对接和平权协同计算能力,依托DataWorks实现统一开发与大规模任务调度。

  • 地域限制

    仅华东1(杭州)、华东2(上海)、华北2(北京)、华南1(深圳)地域支持创建使用OpenLake工作空间。

前提条件

创建工作空间

配置基本信息

  1. 登录DataWorks控制台,并在顶部菜单栏中切换至目标地域。

    重要

    OpenLake工作空间目前仅支持在华东1(杭州)、华东2(上海)、华北2(北京)和华南1(深圳)地域使用。

  2. 单击左侧导航栏中的解决方案 > OpenLake解决方案,进入OpenLake解决方案页面。

  3. 选择创建工作空间,并按照指引配置工作空间相关信息。具体参数如下:

    参数

    描述

    工作空间名称

    必填项,当前工作空间的唯一标识,创建后无法修改。

    显示名

    建议基于业务属性命名,便于标识工作空间用途。

    描述

    用于辅助标识工作空间的主要用途、相关信息。

    生产、开发环境隔离

    定义工作空间模式,即工作空间的生产环境和开发环境是否隔离。创建OpenLake工作空间时,此项需关闭

    参加数据开发(Data Studio)公测

    是否参加新版数据开发公测。创建OpenLake工作空间时,此项必须开启

    工作空间模板

    工作空间模板定义DataWorks工作空间中可以使用的工具、资源和功能。创建OpenLake工作空间,此项默认选择OpenLake模板。更多详情请参见DataWorks工作空间模板介绍

    空间管理员

    定义该工作空间的管理员。

    创建同名AI工作空间

    是否创建相同名称的AI工作空间,默认开启,您可以在AI工作空间中调度PAI上的算法任务。

    DataWorks工作空间默认资源组

    工作空间默认使用的DataWorks资源组,后续可在工作空间配置中修改。资源组的更多信息,请参见DataWorks资源组管理

    阿里云资源组

    选择阿里云资源管理中创建的资源组,默认选择默认资源组

  4. 配置完成后,单击页面左下方的创建工作空间。确认创建后可继续绑定数据目录

绑定数据目录

进入绑定数据目录步骤页,为OpenLake工作空间添加或新建DLF数据目录。

  1. 绑定数据目录。

    • 没有可绑定的DLF数据目录:可单击新建数据目录,前往数据湖构建控制台去开通并创建DLF 2.5数据目录

    • 已有可绑定的DLF数据目录:单击添加数据目录,在搜索框中选择目标DLF 2.5数据目录名称,然后单击确定绑定。

  2. 绑定完成后,单击下一步,可继续绑定计算资源

绑定计算资源

绑定计算资源步骤页,您可为OpenLake工作空间绑定所需的计算资源。

  1. 切换页签(离线计算实时查询多模态搜索)并选择所需添加的计算资源。

    页签

    计算资源类型

    离线计算

    MaxCompute

    Serverless Spark

    实时查询

    Hologres

    Serverless StarRocks

    Flink

    多模态搜索

    OpenSearch

  2. 单击上方的添加计算资源,根据以下内容绑定对应的计算资源,并测试连通性。

  3. 单击完成,即可在OpenLake解决方案页面查看已创建的OpenLake工作空间。

查看工作空间详情

  1. OpenLake解决方案页面,单击目标OpenLake工作空间操作栏中的详情进入空间详情页。

  2. 您可以通过以下区域查看工作空间的相关信息:

    • 重点关注:查看工作空间内实例的运行情况。

    • 空间资产:查看数据源、节点和资源数量等资产信息。

    • 计算资源用量明细:切换计算资源类型(仅支持Hologres、Serverless Spark、Serverless StarRocks),选择具体实例,可查看计算资源的使用情况。

创建相关任务

如需创建相关任务,可在空间详情页上方单击OpenLake 解决方案数据入湖(数据集成)或DataStudio等模块,快速跳转至对应功能页面进行任务创建。