本文为您介绍如何基于Alibaba Blink实时引擎创建BLINK_SQL任务。
前提条件
在开始执行操作前,请确认项目已开启实时引擎并已配置Alibaba Blink计算源。具体操作,请参见创建通用项目。
权限说明
仅支持超级管理员、项目管理员和开发者创建BLINK_SQL计算任务。
步骤一:新建BLINK_SQL任务
在Dataphin首页,单击顶部菜单栏研发。
按照下图操作指引,进入新建BLINK_SQL对话框。
在新建BLINK_SQL对话框,配置参数。
参数
说明
任务名称
名称的命名规则如下:
只能包含小写英文字母、数字、下划线(_)。
名称的长度范围为3~62个字符。
项目内的名称不支持重复。
名称仅支持以英文字母开头。
资源队列
选择该项目所绑定实时计算源中的资源队列。
引擎版本
选择当前资源队列所支持的版本。
存储目录
默认为代码管理,您也可以创建存储目录。
创建方式
支持空白新建和使用模板。
空白新建:创建普通空白的FLINK_SQL任务。
使用模板:基于实时计算任务模板快速新建任务。
描述
填写简单的描述,1000个字符以内。
步骤二:开发BLINK_SQL任务代码
在BLINK_SQL任务代码页面,编写任务的代码。
说明您可以单击页面右上方的按钮,系统自动调整SQL代码格式。
Dataphin支持原生DDL语句快速创建元表。当前Dataphin识别到原生
create table/create temporary table
语句时,您可以单击编辑器提示图标,快速创建元表。具体操作,请参见Flink_SQL任务开发方式。
单击页面左上方的预编译,校验代码任务的语法及权限问题。
说明预编译成功,在页面上方出现弹窗。
预编译失败,在页面上方出现弹窗,单击页面底部Console,查看预编译失败日志。
步骤三:配置BLINK_SQL任务
单击编辑器侧边栏配置。
在配置对话框中,配置BLINK_SQL任务实时模式和离线模式的相关配置信息。
说明Dataphin实时计算支持流批一体任务,使用统一的流批计算引擎,在一份代码上可同时配置流+批(实时模式+离线模式)的任务配置,基于同一份代码生成不同模式下的实例。开启批处理需在任务配置页面开启离线模式并进行资源、调度依赖等相关配置。
实时模式
资源配置(必选):配置任务对应的资源队列、引擎版本以及任务的并行度、Task Manager数量、Job Manager Memory和Task Manager Memory信息。配置说明,请参见配置Alibaba Blink实时模式资源。
时间参数:用于配置实时计算任务的运行时间偏移。配置说明,请参见实时模式时间参数配置。
Checkpoint配置:配置Flink SQL任务的Checkpoint,可有效的帮助当前Flink SQL任务运行意外崩溃后,重新运行程序时恢复到崩溃前的状态。配置说明,实时模式Checkpoint配置。
State配置:配置State中数据自动清理的周期。配置说明,实时模式State配置。
运行参数:可以通过配置运行参数,控制Flink应用程序的执行行为和性能。配置说明,请参见实时模式运行参数配置。
依赖文件:配置任务依赖的资源文件。配置说明,请参见实时模式依赖文件配置。
依赖关系:配置依赖关系可帮助排查调试时快速了解数据的上下游任务。配置说明,请参见实时模式依赖关系配置。
离线模式(Bate)
调度配置(必选):调度配置用于定义节点在生产环境的周期调度方式。您可以通过调度配置中调度属性,配置任务调度周期与生效日期等。配置说明,请参见离线模式调度配置。
资源配置(必选):配置任务对应的资源队列及引擎版本。配置说明,请参见配置Alibaba Blink离线模式资源。
运行参数:可以通过配置运行参数,控制Flink应用程序的执行行为和性能。配置说明,请参见离线模式运行参数配置。
依赖文件:配置Flink SQL任务依赖的资源文件。配置说明,请参见离线模式依赖文件配置。
依赖关系(必选):配置依赖关系可帮助排查调试时快速了解数据的上下游任务。离线模式依赖关系配置。
单击确定。
步骤四:调试BLINK_SQL任务代码(可选)
Dataphin支持调试已开发的BLINK_SQL代码。单击页面右上方的调试按钮,可以对代码任务采样数据并进行本地调试,保障代码任务的正确性。同时支持实时模式调试和离线模式调试。
当前仅支持单种模式调试,选择模式后请采样对应模式表数据进行调试。
实时模式调试:采样对应的实时物理数据,完成数据采样后将在Flink Stream模式下进行本地调试。具体操作,请参见实时模式调试。
离线模式调试:采取对应的离线物理表数据,完成数据采样后将在Flink Batch模式下进行本地调试。具体操作,请参见离线模式调试。
步骤五:提交BLINK_SQL任务
单击页面左上方的按钮,并在提交备注对话框中填写备注信息。
单击确定并提交。
说明如果项目的模式为Dev-Prod,则您需要发布Flink SQL任务至生产环境。具体操作,请参见管理发布任务。
后续步骤
在运维中心查看并运维BLINK_SQL任务,保证任务的正常运行。具体操作,请参见查看并管理实时任务。