调整配额

为确保业务稳定运行,检索增强型应用(8.17版)对相关资源及其使用设置了默认的限制配额。若默认配额不满足您的业务需要,您可申请对相应配额进行调整,以优化资源利用率并保障服务的稳定性,避免因资源不足或配置不合理影响业务正常运行。

前提条件

创建检索增强型应用(8.17版)

进入应用详情页

  1. 登录Elasticsearch Serverless控制台,在顶部菜单栏切换至目标地域。

  2. 在左侧导航栏单击应用管理,单击已创建的应用名称,进入应用详情页。

    在该页面,您可按需调整计费配额调整服务配额及存储容量

调整计费配额

调整固定CU配额

创建应用时,您需为应用配置固定CU配额,用于应对常规负载,确保业务流量处理能力的稳定性。若使用一段时间后,配置的固定CU配额不满足您的需要,可在应用详情页的计费配额区域,单击修改,按照界面指引修改固定CU配额。

说明
  • 固定CU配额支持修改为2CU/s4CU/s6CU/s8CU/s10CU/s16CU/s24CU/s等规格,您可参考CU选配介绍按需修改。

  • 修改为10CU/s16CU/s24CU/s规格,需按照界面指引提交申请,待审批通过后方可生效。申请提交后,可进入申请历史页签查看申请详情及审批状态。审批时长为1~2个工作日,紧急变更请提交工单联系技术支持人员处理。

调整向量数据内存占用配额

应用中向量数据的内存占用配额,默认与固定CU配额相同,若该配额不符合您的业务需要,可在应用详情页的计费配额区域,单击修改,按照界面指引修改。

说明
  • 系统提供的内存占用默认额度不收取费用,超出默认值部分,将按照实际用量进行收费

  • 内存占用配额最大可调高至固定CU配额的4倍。若业务所需的内存占用额度超出配额上限,建议调高固定CU配额,以获取更大的内存使用量。

调整服务配额及存储容量

进入应用详情页,单击左侧导航栏的服务配额,即可按需调整相关配额及索引存储容量。配额及存储容量的调整均需提交申请,提交后,您可在申请历史页签查看申请详情、审批状态等信息。

调整服务配额

配额总览页签,您可通过名称搜索,或通过类别(例如,查询、写入)查找目标配额项,单击修改配额,即可按需调整该配额项的运行值。配额调整后,需单击提交修改,按照界面指引提交修改申请。

说明

示例调整max_storage_per_cu的配额,操作如下。

image

调整索引存储容量

存储容量页签,您可通过名称搜索目标索引,按需更改索引数据占用的磁盘上限索引内向量数据占用的内存上限。修改后,可进入申请历史页签查看申请详情及审批状态

  • 索引数据占用磁盘上限:表示单个索引允许占用的最大磁盘存储空间,单位为GB。当索引数据量达到此阈值时,系统可能触发告警、停止写入或自动清理旧数据,防止该索引无限制增长导致磁盘耗尽,影响应用稳定性。

  • 索引内向量数据占用内存上限:表示向量数据在内存中占用的最大空间,单位为GB。超出此限制可能导致性能下降或内存溢出,防止向量搜索占用过多内存,影响应用功能。

    按照向量数据占用内存的计算方式1024数据使用int8量化,1GB内存约支持100w的文档数量(即Doc数量)。如您有更大的文档数量需求,可使用bbq量化,该方式1GB内存约支持520w的文档数量。

说明
  • 创建索引后,默认索引数据占用的磁盘上限为20GB,索引内向量数据占用的内存上限为1GB。默认值为保障应用稳定运行的最低值,若该值不满足您的业务需要,您可按需调大。

  • 索引名称为您自主命名,不同应用的索引名称存在差异,请以实际使用为准。

  • 审批时长为1~2个工作日,紧急变更请提交工单联系技术支持人员处理。

示例修改test-alias-index-1746523280索引占用的磁盘上限,操作如下。

image

查看申请及审批详情

申请历史页签,您可查看所有配额及存储容量调整的申请记录,包括申请类型、申请时间、生效时间、审批状态、申请内容等信息。image

  • 单击操作列的撤销,可取消当前变更申请。

  • 单击申请项,可查看当前申请的具体变更内容。

  • 审批通过后(即申请状态为已完成),相应变更将自动生效。

附录:服务配额项列表

检索增强型应用(8.17版)支持的服务配额项如下。

说明

支持表示可更改配额取值;不支持表示不可更改配额取值。

配额项

描述

默认值

取值是否可更改

alias_quota

别名总数上限,单位为个。

500

支持

default_app_dense_vector_mem_limit

所有索引向量内容总共占用内存用量的上限,单位为GB。

5

支持

default_index_dense_vector_mem_limit

单个索引向量内容所占用内存用量的上限,单位为GB。

1

支持

index.mapping.depth.limit

JSON嵌套的最大深度,单位为个。

[1 - 20]

支持

index.mapping.field_name_length.limit

字段名的长度限制。

[1 - 100]

支持

index.mapping.nested_fields.limit

单个索引中Nested字段的数量上限。

[1 - 50]

支持

index.mapping.nested_objects.limit

单个文档中最多嵌套子文档的个数。

[1 - 100]

支持

index.mapping.total_fields.limit

单个索引的字段总数,单位为个。

[1 - 2500]

支持

index.max_adjacency_matrix_filters

单个索引中邻接矩阵过滤器数量的最大值。

[0 - 100]

支持

index.max_docvalue_fields_search

Docvalue_Field的数量上限。

[1 - 100]

支持

index.max_inner_result_window

内部子查询可返回的最大结果数。

[1 - 100]

支持

index.max_ngram_diff

最大Ngram距离。

[0 - 1]

支持

index.max_refresh_listeners

最大并发等待数。

[0 - 20]

支持

index.max_regex_length

最大正则长度。

[0 - 50]

支持

index.max_rescore_window

精排最大结果数。

[1 - 10000]

支持

index.max_result_window

查询最大结果数。

[1 - 100000]

支持

index.max_script_fields

Script Field的数量上限。

[1 - 32]

支持

index.max_shingle_diff

最大Shingle距离。

[0 - 3]

支持

index.max_terms_count

单次查询的最大Term数。

[0 - 1024]

支持

index_quota

索引总数上限,单位为个。

500

支持

max_concurrent_delete_by_query

Delete_By_Query最大并行数量。

3

支持

max_concurrent_reindex

Reindex最大并行数量。

3

支持

max_concurrent_update_by_query

Update_By_Query最大并行数量。

3

支持

max_cu_per_search

单次查询的最大CU消耗,单位为个。

20

不支持

max_cu_per_shard

单次查询中单分片的最大CU消耗,单位为个。

2

不支持

max_doc_size

单文档大小,单位为MB。

5

支持

max_index_create_and_delete_qps

索引创建和删除QPS,单位为次/30

30

支持

max_index_metadata_update_qps

索引元数据更新QPS,单位为次/10

50

支持

max_index_template_num

索引模板数量上限,单位为个。

50

支持

max_pipeline_num

Pipeline数量上限,单位为个。

100

支持

max_prefix_length

前缀查询中允许的前缀字符串的最大长度。

[0 - 50]

支持

max_refresh_qps

Refresh速率,单位为次/秒

20

支持

max_search_throughput

最大查询吞吐,单位为MB/s

200

支持

max_storage_per_cu

CU对应的最大存储比例。

重要

调大该比例会影响查询和写入性能,请谨慎操作。

40

支持

max_storage_per_shard

单个分片的存储用量上限,单位为GB。

20

支持

max_timeout_per_request

单次查询的最大耗时,单位为秒。

30

不支持

max_wildcard_length

通配符查询中允许的通配符字符串最大长度。

[0 - 50]

支持

max_write_size_per_request

单次写入请求的大小,单位为MB。

10

支持

search.max_buckets

单次聚合Bucket上限。

10000

支持

search.max_keep_alive

搜索的最长保持时间,单位为秒。

900

支持

shard_quota

分片总数上限,单位为个。

3000

支持