Milvus使用限制与配额

更新时间:

向量检索Milvus在相关配额上存在一定的限制,建议您在实际使用之前了解相应的限制,以确保能够满足您的业务需求。本文为您介绍Milvus的相关配额限制。

限制说明

用户与角色

分类

最大数量

描述

用户

100

每个实例中最多可容纳100个用户。

角色

20

每个实例中最多可以创建20个自定义角色。

如果超过配额,将会出现以下错误提示:

  • 用户数量超限

    unable to add user because the number of users has reached the limit
  • 角色数量超限

    unable to create role because the number of roles has reached the limit

CU

分类

限制

描述

入门版

16

入门版实例为单节点,最大为16 vCPU。

标准版

无限制

标准版实例无限制。

容量

分类

限制

入门版

8 GB可以容纳150万个768维向量。

标准版

  • 性能型CU:每8 GB可以容纳150万个768维向量。

  • 容量型CU:每8 GB可以容纳500万个768维向量。

客户端可能报错如下:

  • 内存

    deny to write, reason: memory quota exhausted, please allocate more resources, req: /milvus.proto.milvus.MilvusService/Insert
  • 磁盘

    deny to write, reason: disk quota exhausted, please allocate more resources, req: /milvus.proto.milvus.MilvusService/Insert

Database

分类

限制

描述

入门版

1

入门版实例最多可创建1Database

标准版

1024

标准版实例最多可创建1024Database

如果超过配额,系统将会返回以下错误提示。

exceeded the limit number of database[limit=1024]

Replica

分类

限制

描述

入门版

1

入门版实例为单节点,Replica最大为1。

标准版

Query Node节点数

标准版实例开启高可用默认2,否则默认为1。

如果超过配额,系统将会返回以下错误提示。

call query coordinator LoadCollection: failed to spawn replica for collection: resource group node not enough[rg=__default_resource_group][currentNodeNum=2][expectedNodeNum=3]

CollectionPartition

分类

限制

描述

入门版

  • 65536Collection

  • 65536Partition

每个QueryNode计算单元(CU)支持创建最多1,024个集合(Collection)或4,096个分区(Partition)。

标准版

如果超过配额,系统将会返回以下错误提示:

  • Collection:exceeded the limit number of collections[dbName=my_database_2][limit=2048]

  • Partition:partition number (1024) exceeds max configuration (1024), collection: customized_setup_1failed checking constraint: sum_collections(parition*shard) exceeding the max general capacity:: general capacity exceeded[newGeneralSize=8193][generalCapacity=8192]

兼容Milvus v2.4.x的实例

根据您的实例使用的CU数量的不同,Milvus v2.4.x对每个实例中的CollectionPartition的创建数量有如下限制。

  • 单个Collection的限制:每个Collection的数量上限应该在256和实例的CU数量之积与16,384间取最小值。

    公式为min(256 × CU数量, 16384)

  • 实例级别的限制:

    • Collection数量上限:实例中最多可以创建的Collection数量为以下两者的较小值。

      公式为min(256 × CU数量, 16384)

    • Partition总数量上限:实例中所有CollectionPartition总数量为以下两者的较小值。

      公式为min(1024 × CU数量, 65536) 。

  • 上述两个限制需同时满足,即实例中的CollectionPartition总数量均不得超过各自的上限。

兼容Milvus v2.5.x的实例

根据您的实例使用的CU数量的不同,Milvus v2.5.x对每个实例中的CollectionPartition的创建数量有如下限制。

  • 单个Collection的限制:每个Collection的数量上限应该在1,024和实例的CU数量之积与16,384间取最小值。

    公式为min(1024 × CU数量, 16384)

  • 实例级别的限制:

    • Collection数量上限:实例中最多可以创建的Collection数量为以下两者的较小值。

      公式为min(1024 × CU数量, 16384)

    • Partition总数量上限:实例中所有CollectionPartition总数量为以下两者的较小值。

      公式为min(4096 × CU数量, 65536) 。

  • 上述两个限制需同时满足,即实例中的CollectionPartition总数量均不得超过各自的上限。

Shard数量上限

分类

限制

描述

入门版

2

入门版Shard数量上限为2。

标准版

16

标准版Shard数量上限为16。

Shard数量超过配额时,系统将会返回以下错误提示。

maximum shards's number should be limited to 16

速率限制

实例中的CollectionPartition操作(包括创建、加载、释放、删除)还具有速率限制。

操作类型

限制

描述

Collection操作

20 QPS

每个实例每秒最多允许20次请求。

Partition操作

20 QPS

每个实例每秒最多允许20次请求。

数据操作

以下为实例中常见数据操作的速率限制。

Insert

  • Insert单个请求大小

    分类

    限制

    描述

    入门版

    64 MB

    单次Insert请求的数据量不得超过64 MB。

    标准版

    64 MB

    单次Insert请求的数据量不得超过64 MB。

    如果单次请求的数据量超过限制,会触发以下错误。

    grpc._channel._InactiveRpcError: <_InactiveRpcError of RPC that terminated with:
    	status = StatusCode.RESOURCE_EXHAUSTED
    	details = "grpc: received message larger than max (92658962 vs. 67108864)"
    	debug_error_string = "UNKNOWN:Error received from peer ipv4:121.43.**.**:19530 {grpc_message:"grpc: received message larger than max (92658962 vs. 67108864)", grpc_status:8, created_time:"2025-08-02T13:23:05.22648+08:00"}"
    >
  • Insert吞吐限制

    分类

    限制

    描述

    入门版

    10 MB/s

    最大支持每秒10 MB的数据插入吞吐量。

    标准版

    64 MB/s

    最大支持每秒64 MB的数据插入吞吐量。

Upsert

每个Upsert请求/响应的速率限制如下表所示。

分类

限制

描述

入门版

10 MB/s

每秒最多允许10 MB的数据更新吞吐量。

标准版

64 MB/s

每秒最多允许64 MB的数据更新吞吐量。

Flush

每个实例的Flush请求速率上限为0.1 QPS(每秒0.1次)。不建议您进行手动调整。

分类

限制

描述

入门版

0.1 QPS

每秒最多允许0.1Flush请求。

标准版

0.1 QPS

每秒最多允许0.1Flush请求。

Delete Entity

每个实例的删除请求速率限制如下表所示。

分类

限制

描述

入门版

0.5 MB/s

每秒最多允许删除0.5 MB的数据量。

标准版

0.5 MB/s

每秒最多允许删除0.5 MB的数据量。

Search

  • 查询向量(nq)

    分类

    限制

    描述

    入门版

    10

    每个搜索请求最多允许携带10个查询向量。

    标准版

    16384

    每个搜索请求最多允许携带16,384个查询向量。

    如果nq超过配额,将会出现以下错误提示。

    nq [3000] is invalid, nq (number of search vector per search request) should be in range [1, 10], but got 3000
  • Entity数量(topK)

    分类

    限制

    描述

    入门版

    1024

    每个搜索响应最多允许返回1024Entity。

    标准版

    16384

    每个搜索响应最多允许返回16,384Entity。

    如果topK超过配额,将会出现以下错误提示。

    topk [1025] is invalid, it should be in range [1, 1024], but got 1025