您可以通过DataWorks的工作空间模块快速创建适用于OpenLake解决方案的工作空间。
OpenLake工作空间介绍
产品介绍:
在DataWorks创建工作空间时,工作空间模板选择了OpenLake即为OpenLake工作空间。OpenLake工作空间是一个适用于开放可控数据湖仓构建的大数据/搜索/AI一体化解决方案的工作空间。更多工作空间模板请参见DataWorks工作空间模板介绍。
基于开放可控数据湖仓构建的大数据/搜索/AI一体化解决方案。
通过DLF管理结构化与半/非结构化数据,支持湖仓表和文件的安全访问及IO加速。
具备多引擎对接和平权协同计算能力,依托DataWorks实现统一开发与大规模任务调度。
地域限制:
仅华东1(杭州)、华东2(上海)、华北2(北京)、华南1(深圳)地域支持创建使用OpenLake工作空间。
前提条件
已准备创建工作空间所需的账号:
使用阿里云主账号创建,详情请参见准备阿里云账号(主账号)。
使用RAM用户(子账号)创建,详情请参见准备RAM用户。
已为RAM用户(子账号)授权
CreateWorkspace
权限,授权操作详情请参见为RAM用户授权。
创建工作空间
配置基本信息
登录DataWorks控制台,并在顶部菜单栏中切换至目标地域。
重要OpenLake工作空间目前仅支持在华东1(杭州)、华东2(上海)、华北2(北京)和华南1(深圳)地域使用。
单击左侧导航栏中的
,进入OpenLake解决方案页面。选择创建工作空间,并按照指引配置工作空间相关信息。具体参数如下:
参数
描述
工作空间名称
必填项,当前工作空间的唯一标识,创建后无法修改。
显示名
建议基于业务属性命名,便于标识工作空间用途。
描述
用于辅助标识工作空间的主要用途、相关信息。
生产、开发环境隔离
定义工作空间模式,即工作空间的生产环境和开发环境是否隔离。创建OpenLake工作空间时,此项需关闭。
参加数据开发(Data Studio)公测
是否参加新版数据开发公测。创建OpenLake工作空间时,此项必须开启。
工作空间模板
工作空间模板定义DataWorks工作空间中可以使用的工具、资源和功能。创建OpenLake工作空间,此项默认选择OpenLake模板。更多详情请参见DataWorks工作空间模板介绍。
空间管理员
定义该工作空间的管理员。
创建同名AI工作空间
是否创建相同名称的AI工作空间,默认开启,您可以在AI工作空间中调度PAI上的算法任务。
DataWorks工作空间默认资源组
工作空间默认使用的DataWorks资源组,后续可在工作空间配置中修改。资源组的更多信息,请参见DataWorks资源组管理。
阿里云资源组
选择阿里云资源管理中创建的资源组,默认选择默认资源组。
配置完成后,单击页面左下方的创建工作空间。确认创建后可继续绑定数据目录。
绑定数据目录
进入绑定数据目录步骤页,为OpenLake工作空间添加或新建DLF数据目录。
绑定数据目录。
没有可绑定的DLF数据目录:可单击新建数据目录,前往数据湖构建控制台去开通并创建DLF 2.5数据目录。
已有可绑定的DLF数据目录:单击添加数据目录,在搜索框中选择目标DLF 2.5数据目录名称,然后单击确定绑定。
绑定完成后,单击下一步,可继续绑定计算资源。
绑定计算资源
在绑定计算资源步骤页,您可为OpenLake工作空间绑定所需的计算资源。
切换页签(离线计算、实时查询、多模态搜索)并选择所需添加的计算资源。
页签
计算资源类型
离线计算
实时查询
多模态搜索
单击上方的添加计算资源,根据以下内容绑定对应的计算资源,并测试连通性。
单击完成,即可在OpenLake解决方案页面查看已创建的OpenLake工作空间。
查看工作空间详情
在OpenLake解决方案页面,单击目标OpenLake工作空间操作栏中的详情,进入空间详情页。
您可以通过以下区域查看工作空间的相关信息:
重点关注:查看工作空间内实例的运行情况。
空间资产:查看数据源、节点和资源数量等资产信息。
计算资源用量明细:切换计算资源类型(仅支持Hologres、Serverless Spark、Serverless StarRocks),选择具体实例,可查看计算资源的使用情况。
创建相关任务
如需创建相关任务,可在空间详情页上方单击OpenLake 解决方案、数据入湖(数据集成)或DataStudio等模块,快速跳转至对应功能页面进行任务创建。