配置监控告警

更新时间:

阿里云Milvus提供了告警设置功能,通过对重要的监控指标设置报警规则,可以实时了解实例的运行状况,及时处理潜在风险,保障实例稳定运行。

背景信息

阿里云Milvus的监控报警是通过阿里云云监控产品实现的。通过云监控,您可以设置监控项,在触发监控项报警规则时,通知报警联系组中的所有联系人。您也可以维护报警监控项对应的报警联系人组,以便发生报警时,能及时通知到相关联系人。更多信息,请参见什么是云监控

前提条件

已创建Milvus实例,详情请参见快速创建Milvus实例

开启一键告警

  1. 进入阿里云Milvus页面。

    1. 登录阿里云Milvus控制台

    2. 在左侧导航栏,单击Milvus实例

    3. 在顶部菜单栏处,根据实际情况选择地域。

  2. Milvus实例页面,单击实例名称。

  3. 单击监控告警页签。

  4. 单击告警设置

  5. 告警设置页面,打开一键告警开关。

    image

    默认规则如下表所示。

    规则名称

    监控项

    指标采样周期

    报警规则

    SystemDefault_acs_milvus_ProcessResidentMemoryUtilization

    内存使用率

    60秒

    连续5个周期平均值 >= 80%,则发出告警。

    SystemDefault_acs_milvus_ProcessCPUUtilization

    CPU使用率

    60秒

    连续5个周期平均值 >= 90%,则发出告警。

创建报警规则

  1. 进入告警设置页面。

    1. 登录阿里云Milvus控制台

    2. 在左侧导航栏,单击Milvus实例

    3. 在顶部菜单栏处,根据实际情况选择地域。

    4. Milvus实例页面,单击实例名称。

    5. 单击监控告警页签。

  2. 告警设置页面,单击报警规则设置

  3. 报警规则页面,单击创建报警规则

  4. 创建报警规则面板,产品选择向量检索服务Milvus版资源范围选择全部资源,设置相应的参数,单击确认

    以创建向量检索服务Milvus版的报警规则,详情请参见创建报警规则

    image

管理报警规则

告警设置页面,单击报警规则设置,跳转到云监控的报警规则页面,您可以对当前的报警规则执行修改、删除和禁用等操作,详情请参见管理报警规则