ES Serverless应用提供检索通用型与日志分析型两种选型,均按照读写计算单元(CU)消耗及存储进行收费。1个CU可以简单理解为1核4GB内存的算力。与自购机器相比,您无需关注水位问题,CU可以100%消耗使用。由于两种选型在技术架构及场景设计上存在差异,其算力及单价也有所不同。您可以结合实际业务数据或参照本文提供的样例来评估用量。
CU上下限的作用
CU的上下限在两种不同选型下存在差异,具体说明如下:
检索通用型:
下限:决定了应用的初始资源分配及最低消费,目前2CU有特惠活动,欢迎您进行试用。
上限:决定了最大可承接的瞬时流量,但并不影响应用账单,费用仍将根据您的实际用量进行统计与扣除。
日志分析型:
下限:决定了应用的最低消费。默认为10CU,当用量不足10CU时,将按照读CU=5
与写CU=5
进行均摊,作为最低消耗。
上限:默认情况下没有使用上限,可根据需求直接使用。
上下限设置参考
日志分析型应用无需关注上下限的设置,而检索通用型可结合如下说明进行界定:
1、简单估算
如您的原服务基于ECS或本地机房自建,您可根据核数*CPU水位进行CU配额的估算。例如:原业务使用了6台4Core的机器,并以30%的水位运行,则在Serverless检索通用型下的CU配额估算为4*6*30%=7.2CU。那么建议设定下限为2CU,上限为8CU至10CU,且上限可适当放宽。
2、界定 CU 下限
创建应用时,可以将CU的上下限设置为2CU,以模拟日常业务请求和流量(非高峰流量)进行界定。如果出现请求报错,相关限制项将限流如下:
limited by {限制项}(xxxxxx_xxxxxxx) threshold:[{限流值}]
则请参考:
这些请求是否可分流均摊,例如,200qps的写入业务是否可以将并发度调整为100qps。
若调高CU下限后限流值未发生变化或者频繁触发限流值时控制台观察到CU资源消耗未达到CU下限值,则可提交工单咨询。
部分限流值在6CU以下为固定值,若不确定可将其配置为8CU以重新界定。
若无法调整请求的并发度且不希望请求受到限流,请继续提高CU值。
请确保客户端有请求重试机制。
3、界定CU上限
将CU的上下限设定为相同值,以模拟高峰期的业务请求及流量。如果流量在稳定状态下未出现限流现象,则可以认为该CU的上限满足业务需求。
若出现大量限制项限流如下:
limited by {限制项}(xxxxxx_xxxxxxx) threshold:[{限流值}]
则请参考:
若流量可控,建议降低瞬时高峰。例如,在某一时间点进行批量导入时,将一分钟内的10000qps请求调整为五分钟内的2000qps。
若请求对实时性要求不高,客户端应实施指数退避策略,以逐渐延长的间隔重试请求。
若大量触发限流值时控制台观察到计算资源消耗总和未达CU下限值一半时,则提单咨询。
若上述情况均无法满足需求,请进一步提高CU值。
CU上限不会对计费产生影响,因此建议适当提高配置,以留出流量增长的空间。
4、瞬时高峰说明
ES Serverless弹性应用持续监控资源利用率(包括CPU、内存、网络等)和响应延迟等关键指标。当这些指标超出最优水平时,将按比例预置额外的容量,以应对当前和预期的需求,并为意外峰值情况维护缓冲区。在扩展容量的过程中,可能会出现工作负载突然大幅增加,导致系统无法立即响应扩展需求的情况,此外,集群的弹性扩展至CU上限规格也需要一定的时间。
若每天的瞬时高峰可预见触发时间,且经过测试的弹性时间无法满足实时性要求,可以提单请值班同事设置定时弹性能力。该功能将帮助在特定时间段内提前预留弹性资源。
若出现不可预估的瞬时高峰且无法接受限流重试的情况,则应将CU下限调整至该高峰期间不限流时的CU值。
5、其他关联限流说明
在测试过程中,如遇到其他类型的限流提示,且部分配置不受CU配额影响,则可参照相关文档直接在控制台申请调整。详情请参见应用配额与服务限制。
修改上下限操作步骤
前往控制台应用管理页面,单击配额管理,如何前往控制台,详情请参见Serverless快速入门。
搜索要修改的配额,单击修改配额。
在修改配额页面,输入修改内容、申请理由、联系方式,单击确定。
- 本页导读 (1)
- CU上下限的作用
- 检索通用型:
- 日志分析型:
- 上下限设置参考
- 1、简单估算
- 2、界定 CU 下限
- 3、界定CU上限
- 4、瞬时高峰说明
- 5、其他关联限流说明
- 修改上下限操作步骤