Hologres不同的实例规格定义了不同的Core和内存资源,由于计算和存储分离架构,存储资源与实例规格不相关。本文将为您介绍实例的资源规格,您可以根据需要动态调整实例的规格,包括升配、降配,独立修改计算和存储资源。
基本概念
Hologres运行时的资源包括用于元数据管理的进程资源、用于查询服务的计算资源、用于优化数据写入的导入链路资源以及缓存服务。所有服务基于云原生容器技术,通过多个并行的容器计算节点实现高性能并行计算能力。
Hologres基于实例的资源规格提供默认的最大连接数和预分配的Shard数,这些参数是针对大多数场景,经过调校和优化的默认配置。其中,最大连接数不可修改,Shard数可通过创建新的Table Group调整。系统扩容或者缩容时,最大连接数同时调整,但扩缩容之前的DB默认Shard数不调整,需要手动修改,新建的DB其Shard数为对应规格的默认值。
在扩容后,更多的Core资源可以提供更好的查询并发能力,大多数使用场景不需要调整Shard数。当您需要更大的写入能力时,可以扩大Shard数,提高并发写入的吞吐量,但对于OLAP类型的查询,增大Shard数并不会明显改善查询性能,甚至会降低系统的并发吞吐,建议了解原理后再调整。同时,行存表由于天然的分布特性,Shard的个数越多,其读取性能会更高。
实例规格推荐
每个Shard负责着一部分数据的读写服务请求,在同一个Table Group里,每个表的一部分数据分发到同一个Shard上,这些表之间如果可以在Shard内关联,我们称之为Local Join,是效率更高的关联方法。如果数据不在同一个Shard内,则需要通过Redistribution算子,实现数据的Shuffle交换,会有更多的网络传输和调度开销。因此设计Shard时要充分考虑计算的过程是Shard间充分并行化,还是需要Shard间交换数据的场景。对于数据写入和更新场景,是可以Shard间并行化写入与更新,因此Shard更多,吞吐能力会更好;对于点查场景,如果每个查询都可以准确命中某个Shard,即实现Shard剪枝,那么Shard更多,并发能力更强;对于OLAP类型查询,因为需要多个Shard共同参与计算,因此不可避免会有数据交换的场景,过多的Shard将带来更多的节点间框架调度开销,并最终降低查询的并发能力。
在使用Hologres实例实践过程中存在数据量可预估,最适宜实例规格以及对应Shard数区间应该设置为多少的问题,由于最适宜实例规格和Shard数不仅和数据存储量有关,还和实际访问频率、实际数据访问量、计算负载的类型(点查、分析等)、写入吞吐、Table Group上表的个数等因素有关,该问题无法给出准确答案。您可参见下表中根据数据量估算的所需Shard数和实例规格的推荐数,选择适合您的参数配置。
下表根据数据量估算的所需Shard数和实例规格的推荐数不是唯一标准,小数据量的表也可以放在多的Shard Count之上,大数据量的表也可以放在单个Shard上。请您根据实际业务场景选择一个合适的Shard Count,既满足有较高的并发度,带来更高计算效率,又满足数据较集中,从而避免不必要的Shuffle开销。
数据总规模 | 推荐规格 | 推荐Shard数 | 使用说明 |
数据总规模 | 推荐规格 | 推荐Shard数 | 使用说明 |
4000万行以下 | 32Core以上 | 10~20 | 不适合压力测试,建议用于开发环境。 |
4000万行~4亿行 | 64Core以上 | 20~40 | 适合业务场景较为单一,没有混合负载场景。 |
4亿行~40亿行 | 128Core以上 | 40~80 | 写入查询能力较为均衡,建议生产系统默认起步配置。 |
40亿行~400亿行 | 256Core以上 | 80~240 | 建议考虑多个Table Group,按照不同业务属性的内聚性划分Table Group,或者按照数据量划分Table Group,不同Table Group设计不同的Shard,建表时明确指定所属Table Group。 |
400亿行~4000亿行 | 512Core以上 | 160~400 | 建议考虑多个Table Group,按照不同业务属性的内聚性划分Table Group,或者按照数据量划分Table Group,不同Table Group设计不同的Shard,建表时明确指定所属Table Group。仅对部分超大表划分较多Shard,普通表不建议Shard过多。 |
实例默认资源表
Hologres基于实例的资源规格提供默认的最大连接数和预分配的Shard数,默认规格配置如下表所示。
自2022年04月25日起,通用型实例支持512 CU至1024 CU之间的计算资源规格,如需更高规格,请提交工单。在升级更大资源规格前,请先将实例升级至V1.1.58或以上版本。
计算组型实例无需提交工单,即可灵活购买32 CU至8192 CU的任意规格。
每个实例规格包括了计算节点和Frontend接入节点,每16 CU对应一个计算节点。在512Core及以下规格中,默认计算节点数与Frontend节点数相同,在1600 CU及以上规格中,Frontend节点数保持100不变。
在规格扩容小于5倍时,不建议调整Shard。该默认规格适合绝大部分场景,考虑了写入和查询的平衡配置。
最大总连接数=单Frontend节点最大连接数*Frontend节点数,括号中为具体每个节点的规格,其中括号前部分为单接入节点最大连接数,后部分为总Frontend接入节点个数。
实例规格 | 计算节点数 | 默认Shard数 | 最大总连接数(适用于V2.1及以下版本) | 最大总连接数(适用于V2.2及以上版本) | Superuser预留总连接数(适用于V1.1及以上版本) |
实例规格 | 计算节点数 | 默认Shard数 | 最大总连接数(适用于V2.1及以下版本) | 最大总连接数(适用于V2.2及以上版本) | Superuser预留总连接数(适用于V1.1及以上版本) |
32 CU | 2 | 20 | 256(128*2) | 512(256*2) | 10(5*2) |
48~80 CU | 3~5 | 40 | 128*计算节点数 | 256*计算节点数 | 5*计算节点数 |
96~112 CU | 6~7 | 60 | 128*计算节点数 | 256*计算节点数 | 5*计算节点数 |
128~192 CU | 8~12 | 80 | 128*计算节点数 | 256*计算节点数 | 5*计算节点数 |
208~352 CU | 13~22 | 120 | 128*计算节点数 | 256*计算节点数 | 5*计算节点数 |
368~992 CU | 23~62 | 160 | 128*计算节点数 | 256*计算节点数 | 5*计算节点数 |
1008~1584 CU | 63~99 | 200 | 128*计算节点数 | 256*计算节点数 | 5*计算节点数 |
1600~2272 CU | 100~142 | 200 | 12800(128*100) | 25600(256*100) | 500(5*100) |
2288~4000 CU | 143~250 | 240 | 12800(128*100) | 25600(256*100) | 500(5*100) |
4016~8000 CU | 251~500 | 320 | 12800(128*100) | 25600(256*100) | 500(5*100) |
8016~8192 CU | 501~512 | 400 | 12800(128*100) | 25600(256*100) | 500(5*100) |
查看并管理实例默认连接数
Hologres支持您查看并管理实例默认连接数。
查看连接数。
当您创建实例并连接开发工具之后,可以执行如下语句进行查看,其中返回值是单个Frontend接入节点的最大连接数。
Hologres实例总的最大连接数=单Frontend节点最大连接数*Frontend节点数。
--查看单接入节点的最大连接数(实际连接在多个接入节点间均衡分配)。 show max_connections;
管理连接。
实例会为Superuser提供预留连接数,当连接数达到默认规格上限时,Superuser可以连接Hologres使用SQL命令查看空闲连接并进行释放,或者根据业务情况升配。查看空闲连接并进行释放连接的具体操作,请参见连接数。
查看并修改实例Shard数
在实例扩容后,大多数情况下不需要调整Shard数,更多的Core资源可以提供更好的查询并发能力。如果您需要更大的写入能力,可以通过扩大Shard数来提高并发写入的吞吐量。
同时,行存表由于天然的分布特性,更多的Shard读取性能会更高。如果因业务需求,需要查看以及修改实例的Shard数,请参见Table Group与Shard Count操作指南。
- 本页导读 (1)
- 基本概念
- 实例规格推荐
- 实例默认资源表
- 查看并管理实例默认连接数
- 查看并修改实例Shard数