完成作业开发和部署后,您需要在作业运维页面启动作业至运行阶段。此外,作业在停止后需要恢复时,也需要启动作业。本文以SQL的流作业和批作业为例为您介绍如何启动作业。
前提条件
其他阿里云账号或RAM用户共同使用Flink全托管产品时,需要为阿里云账号或RAM用户授权,以进行作业启动等相关操作,详情请参见阿里云账号角色授权、RAM用户授权和作业操作账号授权。
使用限制
- 仅流作业支持填写启动选项。
- 仅实时计算引擎VVR4.0.11及以上版本支持State兼容性检测。
- 仅日志服务SLS和消息队列Kafka支持在界面上设置源表开始时间。作业启动界面指定的读取数据时间优先级高于作业DDL代码里设置的startTime。即如果您在作业DDL和作业启动界面都指定了读取数据时间,则作业启动界面指定的读取数据时间生效。说明
- 不是所有的Connector都支持startTime,详情请参见各Connector WITH参数是否包含startTime,例如日志服务SLS WITH参数。
- 只有全新启动作业并指定了startTime,startTime才生效。如果基于Checkpoint或Savepoint启动作业,即使指定了startTime,startTime也不会生效。
注意事项
在启动作业时,如果您选择从最新状态或指定状态启动作业时,系统会进行State兼容性检测。兼容性检测详情请参见Flink State兼容性参考。
操作步骤
- 进入作业启动界面。
- 在目标作业名称右侧,单击操作列中的启动。
- 填写启动选项信息。流作业的启动选项详情如下:
- 无状态启动:当您是新上线作业,可以选择无状态启动。此外,如果无法复用State,也可以无状态启动。选择无状态启动后,您可以选中指定源表开始时间并指定具体的时间信息。
- 有状态启动:您可以根据业务情况选择具体的策略。
策略 说明 从最新状态恢复 从快照或者系统检查点的最新状态进行恢复。如果您选择从最新状态启动作业时,系统会进行State兼容性检测。兼容性检测详情请参见Flink State兼容性参考。 从指定状态恢复 选择指定的快照,快照创建步骤详情请参见作业状态集管理。 允许忽略部分算子状态(AllowNonRestoredState) 默认情况下,Flink系统会尝试将整个快照与正在提交的作业匹配。作业的修改引起算子状态的变化,会出现任务不能恢复的情况。此时您可以打开此开关,Flink系统将跳过无法匹配的状态,让作业先正常启动起来。允许忽略部分算子状态详情请参见Allow None-Restored State。
- 单击启动。在作业运维页面,查看作业运行状态。
类别 状态 说明 过渡态 启动中 作业正在启动中,还没有完全启动。 稳定态 运行中 作业正在运行中。 说明 作业运行过程中,系统会对作业进行监测,根据监测结果对作业进行打分,用分数来表示作业的健康程度。如果作业的健康分不是100分,则代表作业有风险。此时,您可以单击健康分数,去查看具体的风险原因及修复建议,以使作业快速恢复正常。作业诊断功能详情请参见作业智能诊断。已停止 当您单击停止后,作业显示为已停止。 已完成 批作业或者有限流作业完成后,会显示为已完成。 错误态 已失败 作业运行失败。