查看监控指标

更新时间:

本文为您介绍向量检索Milvus与开源Milvus的常用指标。

阿里云Milvus指标

您可以在向量检索Milvus目标实例的监控告警页签查看。

集群概览

  • 资源

    参数

    描述

    统计维度

    搜索资源水位(QueryNode)

    MilvusQueryNode内存使用水位。

    QueryNode的内存使用率超过70%时,建议扩容。

    Pod维度

    写入资源水位(DataNode/IndexNode)

    MilvusDataNodeIndexNode CPU使用水位。

    CPU使用率超过90%时,建议扩容。

    Pod维度

  • 数据

    参数

    描述

    统计维度

    Collection数量

    当前Milvus集群中创建的Collection总数,用于评估集群规模和元数据管理开销。

    集群维度

    Entity数量

    每个Collection中存储的Entity总数,用于监控数据规模和性能瓶颈。

    Collection维度

监控报表

  • Proxy

    图表名称

    图表说明

    统计维度

    Search Vector Count Rate

    每秒处理的向量搜索请求数量,反映搜索服务的吞吐量。

    Pod维度 + 所有Pod总和

    Insert Vector Count Rate

    每秒处理的向量插入请求数量,反映数据写入的吞吐量。

    Pod维度

    Search Latency

    处理搜索请求的P99和平均延迟,衡量搜索服务的稳定性。

    Pod维度 + 请求类型(搜索/查询)

    Mutation Latency

    处理突变操作(如插入、删除)的P99和平均延迟,衡量数据写入性能。

    Pod维度 + 请求类型

    Success Request Rate

    每秒成功处理的请求数量,反映服务可用性。

    Pod维度 + 函数类型(搜索/插入等)

    Faild Request Rate

    每秒失败的请求数量,用于定位异常或瓶颈。

    Pod维度 + 函数类型

  • Query Node

    图表名称

    图表说明

    统计维度

    Search Request Rate

    每秒处理的搜索请求数量,反映搜索任务的负载。

    Pod维度 + 请求类型(搜索/查询) + 状态

    Search Request Latency

    处理搜索请求的 P99 和平均延迟,衡量搜索性能稳定性。

    Pod维度 + 请求类型

    Queryable Entity Num

    已加载的可查询/可搜索的实体数量,反映数据可用性。

    Collection维度 + 所有Pod总和

    Segment Loaded Num

    当前加载的Segment数量,Segment是数据分片的最小单元。

    Pod维度 + Segment状态(加载/未加载)

  • Data Node

    图表名称

    图表说明

    统计维度

    Msg Rows Consumed Rate

    每秒处理的消息行数(仅插入/删除),反映数据写入吞吐量。

    Pod维度 + 消息类型(插入/删除)

    Flush Data Size Rate

    每秒刷写到磁盘的数据量(仅插入/删除),反映持久化效率。

    Pod维度 + 消息类型

    Compaction Latency

    执行Segment合并任务的P99和平均延迟,衡量存储优化效率。

    Pod维度 + 所有Pod总和

  • Query Coord

    图表名称

    图表说明

    统计维度

    Collection Loaded Num

    当前由QueryCoord管理的已加载Collection总数,反映数据服务的活跃度。

    所有Pod总和

  • Root Coord

    图表名称

    图表说明

    统计维度

    DDL Request Rate

    每秒处理的DDL操作数量,反映元数据管理负载。

    DDL状态 + 函数名(CreateCollection/DescribeCollection等)

    DDL Request Latency

    处理DDL请求的P99和平均延迟,衡量元数据操作的稳定性。

    DDL函数名维度

    ID Alloc Rate

    每秒分配的唯一ID数量,反映数据写入的并发能力。

    集群维度

  • Index Node

    图表名称

    图表说明

    统计维度

    Build Index Latency

    构建向量索引的P99和平均延迟,衡量索引生成效率。

    Pod维度

开源指标

组件

指标

指标说明

Proxy

milvus_proxy_search_vectors_count

累计处理的向量搜索请求总量,反映系统查询负载。

milvus_proxy_insert_vectors_count

累计处理的向量插入数量,用于评估数据写入吞吐量

milvus_proxy_sq_latency

搜索和查询请求的延迟。

milvus_proxy_mutation_latency

数据变更操作的延迟,衡量写入性能。

milvus_proxy_req_count

所有类型接收请求的数量。

milvus_proxy_cache_hit_count

每次缓存读取操作的命中和失败率的统计。

Query Node

milvus_querynode_sq_req_count

搜索和查询请求的累计数量。

milvus_querynode_sq_req_latency

查询节点的查询请求延迟。

milvus_querynode_entity_num

每个查询节点上可查询和可搜索的实体数量。

milvus_querynode_segment_num

每个查询节点加载的Segment数量。

Data Node

milvus_datanode_msg_rows_count

数据节点消费的流消息的行数,目前数据节点统计的流消息仅包括插入和删除消息,用于评估数据吞吐量

milvus_datanode_flushed_data_size

每个刷写消息的大小,目前数据节点统计的流消息仅包括插入和删除消息,反映每次刷写操作涉及的数据量,单位通常为字节。

milvus_datanode_unflushed_segment_num

每个数据节点上创建的未刷写Segment的数量。统计尚未持久化的Segment数量,过多可能导致内存压力。

milvus_datanode_compaction_latency

每个数据节点执行合并任务所花费的时间。

Query Coord

milvus_querycoord_collection_num

当前被Milvus加载的集合数量。

Root Coord

milvus_rootcoord_ddl_req_count

所有DDL请求的累计数量(包括CreateCollection、DescribeCollection等)。用于评估元数据管理负载。

milvus_rootcoord_ddl_req_latency

所有类型DDL请求的延迟。反映DDL操作的响应时间,单位为毫秒。

milvus_rootcoord_id_alloc_count

Root Coord分配的ID的累计数量。

Index Node

milvus_indexnode_build_index_latency

构建索引所花费的时间。