当您需要在云原生多模数据库 Lindorm中高效管理计算引擎的资源时,本文档将指导您如何创建计算资源组,并对每个资源组进行配置,以实现资源隔离,优化资源分配,并确保作业按照预期性能运行。
前提条件
已开通计算引擎。如何开通,请参见开通与变配。
创建资源组
登录Lindorm管理控制台。
在页面左上角,选择实例所属的地域。
在实例列表页,单击目标实例ID或者目标实例所在行操作列的管理。
在实例详情页的配置信息区域,单击计算引擎操作列的资源组管理。
在资源组详情页中单击创建资源组,配置资源组名称、资源组类型、属性。
资源组名称
资源组的名字,仅支持小写字母和数字,且长度不超过63个字符。例如
cg0
。资源组类型
资源组类型
描述
OLAP
面向查询分析场景,适用于100 GB以下低时延查询场景,具备高并发查询响应能力。
ETL
面向数据湖或数据仓库生产场景,提供大规模数据集高吞吐计算能力,弹性计算资源池按需伸缩。
属性
说明属性参数类型为JSON格式。
参数
适用资源组类型
取值范围
描述
使用示例
WORKERS
OLAP
[4,1024]
作业工作节点数,每个节点规格为8核64 GB。默认值为
4
。{ "WORKERS": "4" }
MAX_CPU
ETL
[100,100000]
资源组CPU上限。
{ "MAX_CPU": "2000", "MAX_MEM": "16000G" }
MAX_MEM
[400G,1000000G]
资源组内存上限,单位为GB,无默认值。
说明配置属性
MAX_MEM
输入单位时缩写为G
,例如16000G
。DAILY_QUOTA
[0,1000000]
资源组每日消耗的能力单元CU(Capacity Unit)资源上限,单位为
CU*Hour
。默认值为0
,表示无限制。重要超出上限,作业会被强制立即删除(稳定性要求高的资源组不建议配置 DAILY_QUOTA)。
说明计算引擎开通后会自动创建一个名称为default的资源组,类型为ETL。
default资源组仅支持修改属性配置不支持删除和重启。
管理资源组
登录Lindorm管理控制台。在左上角选择实例所属的地域。在实例列表页,单击目标实例ID或者目标实例所在行操作列的管理。
在实例详情页的配置信息区域,单击计算引擎操作列的资源组管理。
可以在资源组详情页中编辑、删除或重启资源组。
说明编辑资源组配置后,需要重启资源组才能使配置生效。
使用资源组
以下介绍如何使用ETL资源组和OLAP资源组。
使用ETL资源组
ETL资源组可以根据不同访问方式配置参数compute-group指定资源组名称的方式使用。以下分别介绍几个主要应用场景中,通过参数配置ETL资源组。
访问方式 | 配置资源组 |
在配置管理作业时,在作业配置区域内Spark系统参数配置(configs)中添加参数,语法: | |
在发布周期性作业时,在Spark系统参数配置(conf)中添加参数,语法: | |
在Lindorm计算引擎的JDBC连接地址(endpoint)中添加参数指定计算资源组,语法: |
使用OLAP资源组
OLAP资源组可以通过Lindorm-cli或JDBC方式连接使用。以下介绍如何通过参数配置OLAP资源组。
Lindorm-cli
通过Lindorm-cli使用计算引擎前,请确保已安装Java环境,要求安装JDK 1.8及以上版本。
步骤一:安装Lindorm-cli
根据您的操作系统,下载对应的Lindorm-cli安装包。下载链接如下表所示。
操作系统
下载链接
Linux
Mac
Windows
Linux-arm64
解压Lindorm-cli压缩包。
以Linux操作系统为例,执行以下命令解压。
tar zxvf lindorm-cli-linux-latest.tar.gz
解压后
lindorm-cli-linux-latest
文件夹中为lindorm-cli.exe
文件。
步骤二:连接宽表引擎
步骤三:使用OLAP资源组
请根据您连接宽表引擎的方式,选择对应的使用方式。如果连接地址中添加了?_use_ldps_=true&compute-group=<OLAP资源组名称>
参数,则已指定了OLAP资源组,反之则未指定。
已指定OLAP资源组
SELECT * FROM <Catalog名称>.<目标数据库名>.<目标表名>;
说明支持的Catalog及其说明,请参见使用须知。
如果您使用默认数据库
default
,通过Lindorm-cli查询数据时需要为其添加反引号`
。例如:SELECT * FROM lindorm_columnar.`default`.test_table;
未指定OLAP资源组
您可以通过在查询语句中添加相关HINT参数,来指定需要使用的OLAP资源组。示例如下:
SELECT /*+ _use_ldps_(<OLAP资源组名称>), _columnar_index_ */ * FROM <目标数据库名>.<目标表名> LIMIT 50;
参数说明
HINT名称
HINT选项
描述
_use_ldps_
资源组名称
使用计算引擎查询,以及查询要使用的资源组名称。
_columnar_index_
无
是否使用列存索引。
说明不填写
_columnar_index_
时默认读写宽表引擎。示例
使用计算引擎的
test
资源组,查询宽表引擎数据库searchindex_db
中名为search_table
的表。SELECT /*+ _use_ldps_(test) */ * FROM searchindex_db.search_table LIMIT 50;
JDBC
通过JDBC连接计算引擎时,只需在连接宽表引擎的URL中指定参数_use_ldps_=true&compute-group=<OLAP资源组名称>
即可。通过JDBC连接宽表引擎,请参见基于SQL的应用开发。