在作业启动前,您需要配置作业部署信息。本文为您介绍如何配置作业部署信息。
前提条件
操作步骤
登录实时计算控制台。
单击目标工作空间操作列下的控制台。
在 页面,单击目标作业名称。
在部署详情页签,单击目标区域右侧的编辑。
说明因为SQL作业基础配置需要返回到
页面,才能编辑作业草稿并重新部署。所以在单击基础配置区域右侧的编辑后,您还需要在弹出的对话框中,单击确定。修改作业部署信息。
单击保存。
基础配置
作业类型 | 说明 |
SQL作业 | 包括SQL代码、引擎版本、附加依赖文件、备注和作业标签信息。参数含义详情请参见SQL作业开发。 说明 单击基础配置右侧的编辑后,需要返回到SQL开发页面编辑作业草稿并重启部署。如果您需要继续进行编辑,请单击确定。 |
JAR作业 | 包括引擎版本、JAR Uri、 Entry Point Class、 Entry Point Main Arguments、附加依赖文件、备注、Kerberos集群和作业标签。参数含义详情请参见部署作业。 |
Python作业 | 包括引擎版本、Python Uri、Entry Module、Entry Point Main Arguments、Python Libraries、Python Archives、 附加依赖文件、备注、Kerberos集群和作业标签。参数含义详情请参见部署作业。 |
运行参数配置
参数 | 说明 |
系统检查点间隔 | 定时执行系统检查点的时间间隔。如果不填写,将会关闭系统检查点。 |
系统检查点超时时间 | 默认值为10分钟,到达默认值后系统检查点将生成失败。 |
两次系统检查点间最短间隔 | 两次系统检查点之间的最短时间间隔,如果系统检查点最大并行度是1,则该配置确保两个系统检查点之间有一个最短时间间隔。 |
State数据过期时间 | 即TTL(Time-to-Live),状态信息的存活时间,单位为小时,默认值为36小时,即作业状态信息将在36小时后自动过期并清除。 重要 此处默认值根据云上最佳实践的经验值设置,与开源的默认值不同(开源默认值为0,表示状态信息永不过期)。 当数据首次进入系统并被处理后,它会存储在状态内存中。当下一次相同主键的数据到来时,系统会使用之前存储的状态数据进行计算,并更新其访问时间。这一过程是实时计算的核心,因为它依赖于数据的持续流动。如果数据在设定的TTL时间窗口内未被再次访问,它将被系统视为过期,并从状态存储中清除。 通过合理设置TTL的值,不仅可以维持计算的精确性,还能及时清理陈旧数据,有效减少状态内存的占用,进而降低系统内存负担,提升计算效率和系统稳定性。 |
Flink重启策略 | 在Flink作业中,任务失败与重启的机制依赖于作业的拓扑结构。即当多个任务(Task)在短时间内失败时,它们之间的连接关系会影响重启行为:
只有没配置重启策略的情况下,Flink才会根据系统检查点开启与否来决定是否要重启作业。如果配置了重启策略,则会按照配置的策略进行重启。该参数取值如下:
|
其他配置 | 在此设置其他Flink配置。例如 |
日志配置
参数 | 说明 |
日志归档 | 默认已开启日志归档功能。开启日志归档后,您可以在作业日志页面查看历史作业实例的日志,详情请参见查看历史作业实例日志。 说明
|
归档日志有效期 | 归档日志有效期默认为7天。 |
根日志级别 | 日志级别从低到高顺序如下:
|
类日志等级 | 填写日志名称和日志级别。 |
日志模板 | 可以选择为default系统模板或自定义模板。选择自定义模板时支持将日志输出到其他存储,详情请参见配置作业日志输出。 |
相关文档
支持设置算子TTL,更精准的控制各个算子的状态大小,节约大状态作业的使用资源,详情请参见算子状态生命周期(State TTL)提示
本文档配置的是单个作业的日志,如果您需要对整个项目空间下的作业的日志进行配置,请参见配置项目空间下所有作业日志输出。