Milvus使用限制与配额
向量检索Milvus版在相关配额上存在一定的限制,建议您在实际使用之前了解相应的限制,以确保能够满足您的业务需求。本文为您介绍Milvus的相关配额限制。
限制说明
用户与角色
分类 | 最大数量 | 描述 |
用户 | 100 | 每个实例中最多可容纳100个用户。 |
角色 | 20 | 每个实例中最多可以创建20个自定义角色。 |
如果超过配额,将会出现以下错误提示:
用户数量超限
unable to add user because the number of users has reached the limit
角色数量超限
unable to create role because the number of roles has reached the limit
CU
分类 | 限制 | 描述 |
入门版 | 16 | 入门版实例为单节点,最大为16 vCPU。 |
标准版 | 无限制 | 标准版实例无限制。 |
容量
分类 | 限制 |
入门版 | 8 GB可以容纳150万个768维向量。 |
标准版 |
|
客户端可能报错如下:
内存
deny to write, reason: memory quota exhausted, please allocate more resources, req: /milvus.proto.milvus.MilvusService/Insert
磁盘
deny to write, reason: disk quota exhausted, please allocate more resources, req: /milvus.proto.milvus.MilvusService/Insert
Database
分类 | 限制 | 描述 |
入门版 | 1 | 入门版实例最多可创建1个Database。 |
标准版 | 1024 | 标准版实例最多可创建1024个Database。 |
如果超过配额,系统将会返回以下错误提示。
exceeded the limit number of database[limit=1024]
Replica
分类 | 限制 | 描述 |
入门版 | 1 | 入门版实例为单节点,Replica最大为1。 |
标准版 | Query Node节点数 | 标准版实例开启高可用默认2,否则默认为1。 |
如果超过配额,系统将会返回以下错误提示。
call query coordinator LoadCollection: failed to spawn replica for collection: resource group node not enough[rg=__default_resource_group][currentNodeNum=2][expectedNodeNum=3]
Collection和Partition
分类 | 限制 | 描述 |
入门版 |
| 每个QueryNode计算单元(CU)支持创建最多1,024个集合(Collection)或4,096个分区(Partition)。 |
标准版 |
如果超过配额,系统将会返回以下错误提示:
Collection:
exceeded the limit number of collections[dbName=my_database_2][limit=2048]
。Partition:
partition number (1024) exceeds max configuration (1024), collection: customized_setup_1
或failed checking constraint: sum_collections(parition*shard) exceeding the max general capacity:: general capacity exceeded[newGeneralSize=8193][generalCapacity=8192]
。
兼容Milvus v2.4.x的实例
根据您的实例使用的CU数量的不同,Milvus v2.4.x对每个实例中的Collection和Partition的创建数量有如下限制。
单个Collection的限制:每个Collection的数量上限应该在256和实例的CU数量之积与16,384间取最小值。
公式为
min(256 × CU数量, 16384)
。实例级别的限制:
Collection数量上限:实例中最多可以创建的Collection数量为以下两者的较小值。
公式为
min(256 × CU数量, 16384)
。Partition总数量上限:实例中所有Collection的Partition总数量为以下两者的较小值。
公式为
min(1024 × CU数量, 65536)
。
上述两个限制需同时满足,即实例中的Collection和Partition总数量均不得超过各自的上限。
兼容Milvus v2.5.x的实例
根据您的实例使用的CU数量的不同,Milvus v2.5.x对每个实例中的Collection和Partition的创建数量有如下限制。
单个Collection的限制:每个Collection的数量上限应该在1,024和实例的CU数量之积与16,384间取最小值。
公式为
min(1024 × CU数量, 16384)
。实例级别的限制:
Collection数量上限:实例中最多可以创建的Collection数量为以下两者的较小值。
公式为
min(1024 × CU数量, 16384)
。Partition总数量上限:实例中所有Collection的Partition总数量为以下两者的较小值。
公式为
min(4096 × CU数量, 65536)
。
上述两个限制需同时满足,即实例中的Collection和Partition总数量均不得超过各自的上限。
Shard数量上限
分类 | 限制 | 描述 |
入门版 | 2 | 入门版Shard数量上限为2。 |
标准版 | 16 | 标准版Shard数量上限为16。 |
当Shard数量超过配额时,系统将会返回以下错误提示。
maximum shards's number should be limited to 16
速率限制
实例中的Collection和Partition操作(包括创建、加载、释放、删除)还具有速率限制。
操作类型 | 限制 | 描述 |
Collection操作 | 20 QPS | 每个实例每秒最多允许20次请求。 |
Partition操作 | 20 QPS | 每个实例每秒最多允许20次请求。 |
数据操作
以下为实例中常见数据操作的速率限制。
Insert
Insert单个请求大小
分类
限制
描述
入门版
64 MB
单次Insert请求的数据量不得超过64 MB。
标准版
64 MB
单次Insert请求的数据量不得超过64 MB。
如果单次请求的数据量超过限制,会触发以下错误。
grpc._channel._InactiveRpcError: <_InactiveRpcError of RPC that terminated with: status = StatusCode.RESOURCE_EXHAUSTED details = "grpc: received message larger than max (92658962 vs. 67108864)" debug_error_string = "UNKNOWN:Error received from peer ipv4:121.43.**.**:19530 {grpc_message:"grpc: received message larger than max (92658962 vs. 67108864)", grpc_status:8, created_time:"2025-08-02T13:23:05.22648+08:00"}" >
Insert吞吐限制
分类
限制
描述
入门版
10 MB/s
最大支持每秒10 MB的数据插入吞吐量。
标准版
64 MB/s
最大支持每秒64 MB的数据插入吞吐量。
Upsert
每个Upsert请求/响应的速率限制如下表所示。
分类 | 限制 | 描述 |
入门版 | 10 MB/s | 每秒最多允许10 MB的数据更新吞吐量。 |
标准版 | 64 MB/s | 每秒最多允许64 MB的数据更新吞吐量。 |
Flush
每个实例的Flush请求速率上限为0.1 QPS(每秒0.1次)。不建议您进行手动调整。
分类 | 限制 | 描述 |
入门版 | 0.1 QPS | 每秒最多允许0.1次Flush请求。 |
标准版 | 0.1 QPS | 每秒最多允许0.1次Flush请求。 |
Delete Entity
每个实例的删除请求速率限制如下表所示。
分类 | 限制 | 描述 |
入门版 | 0.5 MB/s | 每秒最多允许删除0.5 MB的数据量。 |
标准版 | 0.5 MB/s | 每秒最多允许删除0.5 MB的数据量。 |
Search
查询向量(nq)
分类
限制
描述
入门版
10
每个搜索请求最多允许携带10个查询向量。
标准版
16384
每个搜索请求最多允许携带16,384个查询向量。
如果nq超过配额,将会出现以下错误提示。
nq [3000] is invalid, nq (number of search vector per search request) should be in range [1, 10], but got 3000
Entity数量(topK)
分类
限制
描述
入门版
1024
每个搜索响应最多允许返回1024个Entity。
标准版
16384
每个搜索响应最多允许返回16,384个Entity。
如果topK超过配额,将会出现以下错误提示。
topk [1025] is invalid, it should be in range [1, 1024], but got 1025