查看监控指标
本文为您介绍向量检索Milvus版与开源Milvus的常用指标。
阿里云Milvus指标
您可以在向量检索Milvus版目标实例的监控告警页签查看。
集群概览
资源
参数
描述
统计维度
搜索资源水位(QueryNode)
Milvus的QueryNode内存使用水位。
当QueryNode的内存使用率超过70%时,建议扩容。
Pod维度
写入资源水位(DataNode/IndexNode)
Milvus的DataNode和IndexNode CPU使用水位。
当CPU使用率超过90%时,建议扩容。
Pod维度
数据
参数
描述
统计维度
Collection数量
当前Milvus集群中创建的Collection总数,用于评估集群规模和元数据管理开销。
集群维度
Entity数量
每个Collection中存储的Entity总数,用于监控数据规模和性能瓶颈。
Collection维度
监控报表
Proxy
图表名称
图表说明
统计维度
Search Vector Count Rate
每秒处理的向量搜索请求数量,反映搜索服务的吞吐量。
Pod维度 + 所有Pod总和
Insert Vector Count Rate
每秒处理的向量插入请求数量,反映数据写入的吞吐量。
Pod维度
Search Latency
处理搜索请求的P99和平均延迟,衡量搜索服务的稳定性。
Pod维度 + 请求类型(搜索/查询)
Mutation Latency
处理突变操作(如插入、删除)的P99和平均延迟,衡量数据写入性能。
Pod维度 + 请求类型
Success Request Rate
每秒成功处理的请求数量,反映服务可用性。
Pod维度 + 函数类型(搜索/插入等)
Faild Request Rate
每秒失败的请求数量,用于定位异常或瓶颈。
Pod维度 + 函数类型
Query Node
图表名称
图表说明
统计维度
Search Request Rate
每秒处理的搜索请求数量,反映搜索任务的负载。
Pod维度 + 请求类型(搜索/查询) + 状态
Search Request Latency
处理搜索请求的 P99 和平均延迟,衡量搜索性能稳定性。
Pod维度 + 请求类型
Queryable Entity Num
已加载的可查询/可搜索的实体数量,反映数据可用性。
Collection维度 + 所有Pod总和
Segment Loaded Num
当前加载的Segment数量,Segment是数据分片的最小单元。
Pod维度 + Segment状态(加载/未加载)
Data Node
图表名称
图表说明
统计维度
Msg Rows Consumed Rate
每秒处理的消息行数(仅插入/删除),反映数据写入吞吐量。
Pod维度 + 消息类型(插入/删除)
Flush Data Size Rate
每秒刷写到磁盘的数据量(仅插入/删除),反映持久化效率。
Pod维度 + 消息类型
Compaction Latency
执行Segment合并任务的P99和平均延迟,衡量存储优化效率。
Pod维度 + 所有Pod总和
Query Coord
图表名称
图表说明
统计维度
Collection Loaded Num
当前由QueryCoord管理的已加载Collection总数,反映数据服务的活跃度。
所有Pod总和
Root Coord
图表名称
图表说明
统计维度
DDL Request Rate
每秒处理的DDL操作数量,反映元数据管理负载。
DDL状态 + 函数名(CreateCollection/DescribeCollection等)
DDL Request Latency
处理DDL请求的P99和平均延迟,衡量元数据操作的稳定性。
DDL函数名维度
ID Alloc Rate
每秒分配的唯一ID数量,反映数据写入的并发能力。
集群维度
Index Node
图表名称
图表说明
统计维度
Build Index Latency
构建向量索引的P99和平均延迟,衡量索引生成效率。
Pod维度
开源指标
组件 | 指标 | 指标说明 |
Proxy | milvus_proxy_search_vectors_count | 累计处理的向量搜索请求总量,反映系统查询负载。 |
milvus_proxy_insert_vectors_count | 累计处理的向量插入数量,用于评估数据写入吞吐量 | |
milvus_proxy_sq_latency | 搜索和查询请求的延迟。 | |
milvus_proxy_mutation_latency | 数据变更操作的延迟,衡量写入性能。 | |
milvus_proxy_req_count | 所有类型接收请求的数量。 | |
milvus_proxy_cache_hit_count | 每次缓存读取操作的命中和失败率的统计。 | |
Query Node | milvus_querynode_sq_req_count | 搜索和查询请求的累计数量。 |
milvus_querynode_sq_req_latency | 查询节点的查询请求延迟。 | |
milvus_querynode_entity_num | 每个查询节点上可查询和可搜索的实体数量。 | |
milvus_querynode_segment_num | 每个查询节点加载的Segment数量。 | |
Data Node | milvus_datanode_msg_rows_count | 数据节点消费的流消息的行数,目前数据节点统计的流消息仅包括插入和删除消息,用于评估数据吞吐量。 |
milvus_datanode_flushed_data_size | 每个刷写消息的大小,目前数据节点统计的流消息仅包括插入和删除消息,反映每次刷写操作涉及的数据量,单位通常为字节。 | |
milvus_datanode_unflushed_segment_num | 每个数据节点上创建的未刷写Segment的数量。统计尚未持久化的Segment数量,过多可能导致内存压力。 | |
milvus_datanode_compaction_latency | 每个数据节点执行合并任务所花费的时间。 | |
Query Coord | milvus_querycoord_collection_num | 当前被Milvus加载的集合数量。 |
Root Coord | milvus_rootcoord_ddl_req_count | 所有DDL请求的累计数量(包括CreateCollection、DescribeCollection等)。用于评估元数据管理负载。 |
milvus_rootcoord_ddl_req_latency | 所有类型DDL请求的延迟。反映DDL操作的响应时间,单位为毫秒。 | |
milvus_rootcoord_id_alloc_count | Root Coord分配的ID的累计数量。 | |
Index Node | milvus_indexnode_build_index_latency | 构建索引所花费的时间。 |