Dataphin支持使用StarRocks作为Dataphin的离线计算引擎,为Dataphin项目提供处理离线计算任务的能力。本文为您介绍如何创建StarRocks计算源。
背景信息
StarRocks是一款高性能分析数据库,支持实时、多维和高度并发的数据分析。StarRocks具有高度可扩展性、可用性且易于维护。它在OLAP场景提供多种支持,例如实时分析、即席查询、数据湖分析等。更多详情可参考StarRocks官网。
操作步骤
请参见数仓规划入口,进入数仓规划页面。
在数仓规划页面,按照下图操作指引,进入新建计算引擎源页面。
在新建计算源页面,配置参数。
a. 配置计算引擎源基本信息。
参数
描述
计算源类型
选择计算源类型为StarRocks。
计算源名称
命名规则如下:
只能包含汉字、数字、字母、下划线(_)和中划线(-)。
长度不能超过64字符。
计算源描述
对计算源的简单描述。
b. 配置StarRocks连接信息。
参数
描述
JDBC URL
默认为管理中心->系统设置->计算设置所设置的JDBC URL,仅支持配置
database
和查询参数(连接参数)
。说明若需要修改JDBC URL,请参见设置Dataphin的计算引擎为StarRocks。
Load URL
FE(Front End)的Host和HTTP端口,格式为
fe_host:http_port,fe_host:http_port
。用户名、密码
请输入StarRocks的鉴权用户名和密码。
说明为保证任务的正常执行,请确保所填写的用户具备所需的数据权限。
任务资源组
StarRocks可通过资源组进行资源的隔离,并通过分类器将任务匹配到资源组。Datpahin支持为不同优先级的任务指定资源组名称,在任务运行时自动设置任务的资源组从而达到不同任务的资源分配和隔离。
不指定任务资源组:将使用StarRocks集群中所配置默认资源组执行提交的任务。
指定资源组:根据优先级填写对应的资源组名称。优先级支持最高、高、中、低、最低。
单击测试连接。
连接测试通过后,单击提交。
后续步骤
完成创建StarRocks计算源后,即可为项目绑定StarRocks计算源。具体操作,请参见创建通用项目。