配置监控告警
阿里云Milvus提供了告警设置功能,通过对重要的监控指标设置报警规则,可以实时了解实例的运行状况,及时处理潜在风险,保障实例稳定运行。
背景信息
阿里云Milvus的监控报警是通过阿里云云监控产品实现的。通过云监控,您可以设置监控项,在触发监控项报警规则时,通知报警联系组中的所有联系人。您也可以维护报警监控项对应的报警联系人组,以便发生报警时,能及时通知到相关联系人。更多信息,请参见什么是云监控。
前提条件
已创建Milvus实例,详情请参见快速创建Milvus实例。
开启一键告警
进入阿里云Milvus页面。
登录阿里云Milvus控制台。
在左侧导航栏,单击Milvus实例。
在顶部菜单栏处,根据实际情况选择地域。
在Milvus实例页面,单击实例名称。
单击监控告警页签。
单击告警设置。
在告警设置页面,打开一键告警开关。
默认规则如下表所示。
规则名称
监控项
指标采样周期
报警规则
SystemDefault_acs_milvus_ProcessResidentMemoryUtilization
内存使用率
60秒
连续5个周期平均值 >= 80%,则发出告警。
SystemDefault_acs_milvus_ProcessCPUUtilization
CPU使用率
60秒
连续5个周期平均值 >= 90%,则发出告警。
创建报警规则
进入告警设置页面。
登录阿里云Milvus控制台。
在左侧导航栏,单击Milvus实例。
在顶部菜单栏处,根据实际情况选择地域。
在Milvus实例页面,单击实例名称。
单击监控告警页签。
在告警设置页面,单击报警规则设置。
在报警规则页面,单击创建报警规则。
在创建报警规则面板,产品选择向量检索服务Milvus版,资源范围选择全部资源,设置相应的参数,单击确认。
以创建向量检索服务Milvus版的报警规则,详情请参见创建报警规则。
管理报警规则
在告警设置页面,单击报警规则设置,跳转到云监控的报警规则页面,您可以对当前的报警规则执行修改、删除和禁用等操作,详情请参见管理报警规则。