为确保业务稳定运行,检索增强型应用(8.17版)对相关资源及其使用设置了默认的限制配额。若默认配额不满足您的业务需要,您可申请对相应配额进行调整,以优化资源利用率并保障服务的稳定性,避免因资源不足或配置不合理影响业务正常运行。
前提条件
进入应用详情页
登录Elasticsearch Serverless控制台,在顶部菜单栏切换至目标地域。
在左侧导航栏单击应用管理,单击已创建的应用名称,进入应用详情页。
在该页面,您可按需调整计费配额、调整服务配额及存储容量。
调整计费配额
调整固定CU配额
创建应用时,您需为应用配置固定CU配额,用于应对常规负载,确保业务流量处理能力的稳定性。若使用一段时间后,配置的固定CU配额不满足您的需要,可在应用详情页的计费配额区域,单击修改,按照界面指引修改固定CU配额。
固定CU配额支持修改为
2CU/s
、4CU/s
、6CU/s
、8CU/s
、10CU/s
、16CU/s
、24CU/s
等规格,您可参考CU选配介绍按需修改。修改为
10CU/s
、16CU/s
、24CU/s
规格,需按照界面指引提交申请,待审批通过后方可生效。申请提交后,可进入申请历史页签查看申请详情及审批状态。审批时长为1~2
个工作日,紧急变更请提交工单联系技术支持人员处理。
调整向量数据内存占用配额
应用中向量数据的内存占用配额,默认与固定CU配额相同,若该配额不符合您的业务需要,可在应用详情页的计费配额区域,单击修改,按照界面指引修改。
调整服务配额及存储容量
进入应用详情页,单击左侧导航栏的服务配额,即可按需调整相关配额及索引存储容量。配额及存储容量的调整均需提交申请,提交后,您可在申请历史页签查看申请详情、审批状态等信息。
调整服务配额
在配额总览页签,您可通过名称搜索,或通过类别(例如,查询、写入)查找目标配额项,单击修改配额,即可按需调整该配额项的运行值。配额调整后,需单击提交修改,按照界面指引提交修改申请。
当前仅支持通过提交申请修改配额,请根据实际业务需求申请资源。申请提交后,可进入申请历史页签查看申请详情及审批状态。
审批时长为
1~2
个工作日,紧急变更请提交工单联系技术支持人员处理。检索增强型应用(8.17版)支持的配额项,请参见附录:服务配额项列表。
示例调整max_storage_per_cu
的配额,操作如下。
调整索引存储容量
在存储容量页签,您可通过名称搜索目标索引,按需更改索引数据占用的磁盘上限或索引内向量数据占用的内存上限。修改后,可进入申请历史页签查看申请详情及审批状态。
索引数据占用磁盘上限:表示单个索引允许占用的最大磁盘存储空间,单位为GB。当索引数据量达到此阈值时,系统可能触发告警、停止写入或自动清理旧数据,防止该索引无限制增长导致磁盘耗尽,影响应用稳定性。
索引内向量数据占用内存上限:表示向量数据在内存中占用的最大空间,单位为GB。超出此限制可能导致性能下降或内存溢出,防止向量搜索占用过多内存,影响应用功能。
按照向量数据占用内存的计算方式,
1024维
数据使用int8
量化,1GB
内存约支持100w
的文档数量(即Doc数量)。如您有更大的文档数量需求,可使用bbq
量化,该方式1GB
内存约支持520w
的文档数量。
创建索引后,默认索引数据占用的磁盘上限为
20GB
,索引内向量数据占用的内存上限为1GB
。默认值为保障应用稳定运行的最低值,若该值不满足您的业务需要,您可按需调大。索引名称为您自主命名,不同应用的索引名称存在差异,请以实际使用为准。
审批时长为
1~2
个工作日,紧急变更请提交工单联系技术支持人员处理。
示例修改test-alias-index-1746523280
索引占用的磁盘上限,操作如下。
查看申请及审批详情
在申请历史页签,您可查看所有配额及存储容量调整的申请记录,包括申请类型、申请时间、生效时间、审批状态、申请内容等信息。
单击操作列的撤销,可取消当前变更申请。
单击申请项,可查看当前申请的具体变更内容。
审批通过后(即申请状态为已完成),相应变更将自动生效。
附录:服务配额项列表
检索增强型应用(8.17版)支持的服务配额项如下。
表示可更改配额取值;
表示不可更改配额取值。
配额项 | 描述 | 默认值 | 取值是否可更改 |
alias_quota | 别名总数上限,单位为个。 | 500 | |
default_app_dense_vector_mem_limit | 所有索引向量内容总共占用内存用量的上限,单位为GB。 | 5 | |
default_index_dense_vector_mem_limit | 单个索引向量内容所占用内存用量的上限,单位为GB。 | 1 | |
index.mapping.depth.limit | JSON嵌套的最大深度,单位为个。 | [1 - 20] | |
index.mapping.field_name_length.limit | 字段名的长度限制。 | [1 - 100] | |
index.mapping.nested_fields.limit | 单个索引中Nested字段的数量上限。 | [1 - 50] | |
index.mapping.nested_objects.limit | 单个文档中最多嵌套子文档的个数。 | [1 - 100] | |
index.mapping.total_fields.limit | 单个索引的字段总数,单位为个。 | [1 - 2500] | |
index.max_adjacency_matrix_filters | 单个索引中邻接矩阵过滤器数量的最大值。 | [0 - 100] | |
index.max_docvalue_fields_search | Docvalue_Field的数量上限。 | [1 - 100] | |
index.max_inner_result_window | 内部子查询可返回的最大结果数。 | [1 - 100] | |
index.max_ngram_diff | 最大Ngram距离。 | [0 - 1] | |
index.max_refresh_listeners | 最大并发等待数。 | [0 - 20] | |
index.max_regex_length | 最大正则长度。 | [0 - 50] | |
index.max_rescore_window | 精排最大结果数。 | [1 - 10000] | |
index.max_result_window | 查询最大结果数。 | [1 - 100000] | |
index.max_script_fields | Script Field的数量上限。 | [1 - 32] | |
index.max_shingle_diff | 最大Shingle距离。 | [0 - 3] | |
index.max_terms_count | 单次查询的最大Term数。 | [0 - 1024] | |
index_quota | 索引总数上限,单位为个。 | 500 | |
max_concurrent_delete_by_query | Delete_By_Query最大并行数量。 | 3 | |
max_concurrent_reindex | Reindex最大并行数量。 | 3 | |
max_concurrent_update_by_query | Update_By_Query最大并行数量。 | 3 | |
max_cu_per_search | 单次查询的最大CU消耗,单位为个。 | 20 | |
max_cu_per_shard | 单次查询中单分片的最大CU消耗,单位为个。 | 2 | |
max_doc_size | 单文档大小,单位为MB。 | 5 | |
max_index_create_and_delete_qps | 索引创建和删除QPS,单位为 | 30 | |
max_index_metadata_update_qps | 索引元数据更新QPS,单位为 | 50 | |
max_index_template_num | 索引模板数量上限,单位为个。 | 50 | |
max_pipeline_num | Pipeline数量上限,单位为个。 | 100 | |
max_prefix_length | 前缀查询中允许的前缀字符串的最大长度。 | [0 - 50] | |
max_refresh_qps | Refresh速率,单位为 | 20 | |
max_search_throughput | 最大查询吞吐,单位为 | 200 | |
max_storage_per_cu | 每CU对应的最大存储比例。 重要 调大该比例会影响查询和写入性能,请谨慎操作。 | 40 | |
max_storage_per_shard | 单个分片的存储用量上限,单位为GB。 | 20 | |
max_timeout_per_request | 单次查询的最大耗时,单位为秒。 | 30 | |
max_wildcard_length | 通配符查询中允许的通配符字符串最大长度。 | [0 - 50] | |
max_write_size_per_request | 单次写入请求的大小,单位为MB。 | 10 | |
search.max_buckets | 单次聚合Bucket上限。 | 10000 | |
search.max_keep_alive | 搜索的最长保持时间,单位为秒。 | 900 | |
shard_quota | 分片总数上限,单位为个。 | 3000 |