准备环境
为保证您可以顺利完成本次实验,请您首先确保自己云账号已开通大数据计算服务MaxCompute、数据工场DataWorks和机器学习PAI。
前提条件
背景信息
本次实验涉及的阿里云产品如下:
大数据计算服务MaxCompute
数据工场DataWorks
机器学习PAI
开通大数据计算服务MaxCompute
如果您已经开通MaxCompute,请跳过该步骤,直接创建DataWorks工作空间。
登录阿里云官网,单击右上角的登录/注册,输入您的阿里云账号和密码。
鼠标悬停至顶部菜单栏中的产品,单击 ,进入MaxCompute产品详情页。
单击立即开通。
在购买页面,选择地域,并选中服务协议,单击确认订单并支付。
说明购买页面默认提供的规格类型为MaxCompute按量计费标准版和DataWorks基础版。
MaxCompute的项目管理和查询编辑集成DataWorks的功能,因此需要同时开通DataWorks服务。DataWorks基础版为0元开通,如果您不使用数据集成、不执行调度任务,则不会产生费用。
选择地域时,您需要考虑的最主要因素是MaxCompute与其它阿里云产品之间的关系。例如,ECS所在地域、数据所在地域等。
创建工作空间
使用主账号登录DataWorks控制台。
在概览页面,单击右侧的创建工作空间。
在创建工作空间对话框,配置各项参数,单击提交。
工作空间的参数配置详情,请参见配置工作空间。
提交成功后,在左侧导航栏的工作空间列表界面,鼠标悬停至目标工作空间后的
图标,选择 。
进入引擎绑定页面,配置选购引擎的参数。
参数
描述
资源显示名称
用于定义当前引擎配置在DataWorks作为一个执行计算引擎实例的显示名称,用于在DataWorks上标识该套引擎配置(类似于该引擎在DataWorks的别名)。
您可以自定义该显示名称。 名称必须唯一。
项目来源
默认为创建项目。
付费模式
定义MaxCompute项目按照哪种付费方式进行计费,包括按量付费和包年包月。 关于MaxCompute计费模式详情请参见计费项与计费方式概述。
说明标准模式下不支持添加开发者版本的实例。
Quota组
定义MaxCompute项目使用的计算资源池。关于Quota相关说明详情请参见配额。
数据类型
定义MaxCompute项目使用哪一类数据类型。包括2.0数据类型(推荐)、1.0数据类型(面向已有使用1.0数据类型用户)和Hive兼容类型(面向Hive迁移用户),详情请参见:数据类型版本说明。
是否加密
根据实际情况选择当前MaxCompute项目是否需要通过密钥管理服务KMS(Key Management Service)对数据进行存储加密,详情请参见数据加密。
项目名称
需使用的MaxCompute项目名称。
调度访问身份
DataWorks任务提交调度后,作为在MaxCompute项目内执行代码的身份(账号)。
配置完成后,单击完成绑定。