DataWorks的Lindorm Ray节点支持使用Ray分布式计算框架进行Python任务的开发和周期性调度。本文为您介绍使用Lindorm Ray节点进行任务开发的主要流程。
节点介绍
Lindorm计算引擎提供基于Ray分布式计算框架的计算服务,兼容开源Ray接口,支持Python编程模型,适用于分布式计算、机器学习、数据处理等场景。通过DataWorks的Lindorm Ray节点,在线编写Python代码并配置Ray提交命令,实现Ray作业的开发、调试和周期性调度。
使用限制
资源组限制:Lindorm Ray节点仅支持通过Serverless资源组运行。
语言限制:Lindorm Ray节点仅支持Python语言。
运行限制:不支持单行或代码块运行,仅支持整体提交运行。
准备工作
已创建Lindorm实例并绑定至DataWorks工作空间,详情请参见绑定Lindorm计算资源。
已在Lindorm控制台创建Ray资源组,详情请参见使用RAY资源组。
(可选,RAM账号需要)进行任务开发的RAM账号已被添加至对应工作空间中,并具有开发或空间管理员(权限较大,谨慎添加)角色权限,添加成员的操作详情请参见为工作空间添加空间成员。
说明如果您使用的是主账号,则忽略该添加操作。
新建Lindorm Ray节点
新建入口参考:创建Lindorm Ray节点。
开发Lindorm Ray节点
Lindorm Ray节点的开发包含两部分:在代码编辑区编写Python代码,并在Ray提交命令区配置作业提交命令。
调试Lindorm Ray节点
配置调试属性。
您可在节点右侧运行配置中配置计算资源、Lindorm资源组及资源组信息,具体参数信息如下。
参数名称
描述
计算资源
选择您所绑定的Lindorm计算资源。
Lindorm资源组
选择您在Lindorm控制台创建的Ray资源组。
资源组
选择已通过网络连通性测试的Serverless资源组。Lindorm Ray节点仅支持Serverless资源组。
脚本参数
在配置节点内容时,通过${参数名}的方式定义变量,需要在脚本参数处配置参数名、参数值信息,任务运行时会将它动态替换为真实的取值。详情请参见调度参数来源及其表达式。
调试运行节点。
执行节点任务,您需单击保存并运行节点任务。
图标唤起发布流程,通过该流程将任务发布至生产环境。项目目录下的节点只有在发布至生产环境后,才会进行周期性调度。