Data Studio新版数据开发支持将个人开发环境制作成镜像,以供其他环境使用。本文将介绍如何在个人开发环境制作个人开发实例镜像。
前提条件
已创建个人开发环境实例。
完成自定义镜像的创建,并绑定目标工作空间。详情请参见:镜像管理。
完成自定义镜像的VPC绑定。
说明自定义镜像绑定的VPC需与个人开发环境实例绑定的VPC保持一致。
如果您个人开发环境运行程序,需从公网获取第三方包,为VPC配置公网,请参见使用公网NAT网关SNAT功能访问互联网。
制作个人开发环境实例镜像
最佳实践:制作Python镜像
步骤一:完成个人开发环境
创建个人开发环境(可选)。
进入DataWorks工作空间列表页,在顶部切换至目标地域,找到已创建的工作空间,单击操作列的 ,进入Data Studio。
单击顶部个人开发环境·请选择。
如果您还没有个人开发环境实例,需要您自主创建,单击前往新建,按照界面提示进行实例创建。
如果您已有个人开发环境实例,则单击管理实例,然后个人开发环境实例列表中,单击新建实例,按照界面提示进行实例创建。
更多创建个人开发环境实例详情可参见:创建个人开发环境实例。
创建Python文件。
在数据开发页面,单击顶部个人开发环境·请选择选择已创建的个人开发环境实例,进入个人开发环境。
进入个人开发环境后,选中左侧个人目录下的workspace右键新增文件,并将文件名命名为
.py
文件。单击进入已创建的
.py
文件编辑页面。
步骤二:配置自定义类
步骤三:Python代码开发调试
安装完成自定义类后,需在个人开发环境中对相应的工具类进行测试。
新建Python文件:选中左侧个人目录下的workspace右键新增文件,并将文件名命名为
.py
文件开发调试代码并运行:编辑使用到已安装的工具类的Python代码,并运行代码。
调试代码运行成功后,即可进行下一步制作自定义镜像。
步骤四:个人开发环境生成自定义镜像
步骤五:使用镜像
镜像制作成功并发布后,即可在项目空间下,通过获取镜像环境来进行Python开发。
在数据开发页面左侧项目目录中单击按钮选择
创建Python节点,用来进行Python开发。代码开发完成后,单击右侧调试配置,配置相应的资源组,以及选择Python代码需要使用到的工具环境镜像。
单击按钮,对Python代码进行调试。
调试成功后,即可单击调度配置,进入调度策略页签内,为该Python节点配置正式调度时所使用的镜像。
说明该镜像与调试配置中的镜像为同一镜像。
完成调度配置后,即可对Python节点保存并发布。
后续步骤
持久化镜像:DataWorks支持将自定义镜像构建为持久化镜像,无需每次都重新部署镜像环境,每次运行任务节点时使用同一个镜像环境,不仅确保了运行环境的一致性,还有效节省了任务运行时间、计算成本和流量成本。详情可参见:构建持久化镜像。
场景示例
若用户有自己的Python程序,已完成了相应依赖的安装,并已打包成.tar.gz
,该压缩包需要在DataWorks中创建镜像使用的话。需要按照以下操作进行。
拖拽上传Python程序压缩包,并通过终端解压并查看包结构。
cat '解压后的Python项目名' /bin/pip
根据pip的第一行注释,可以查看到当前Python编译路径。
#创建查看到的Python编译路径。 mkdir -p '查看到的Python编译路径' # 将解压的文件夹移动到python当时编译的路径。 mv '解压后的Python项目名' /'查看到的Python编译路径' # 将python相关包替换为自己Python程序的。 for src in idle3 pydoc3 python3 python3-config pip3; do \ dst="$(echo "$src" | tr -d 3)"; \ [ -s "/usr/local/bin/$src" ]; \ [ ! -e "/usr/local/bin/$dst" ]; \ mv /usr/local/bin/$dst /usr/local/bin/${dst}_bak ln -svT "查看到的Python编译路径/bin/$src" "/usr/local/bin/$dst"; \ done
完成以上步骤,并在个人开发环境调试运行成功后,即可按照步骤四:个人开发环境生成自定义镜像,生成自定义镜像。