配置监控告警

更新时间:2024-08-21 05:10:13

阿里云Milvus提供了告警设置功能,通过对重要的监控指标设置报警规则,可以实时了解实例的运行状况,及时处理潜在风险,保障实例稳定运行。

背景信息

阿里云Milvus的监控报警是通过阿里云云监控产品实现的。通过云监控,您可以设置监控项,在触发监控项报警规则时,通知报警联系组中的所有联系人。您也可以维护报警监控项对应的报警联系人组,以便发生报警时,能及时通知到相关联系人。更多信息,请参见什么是云监控

前提条件

已创建Milvus实例,详情请参见快速创建Milvus实例

开启一键告警

  1. 进入阿里云Milvus页面。

    1. 登录阿里云Milvus控制台

    2. 在左侧导航栏,单击Milvus实例

    3. 在顶部菜单栏处,根据实际情况选择地域。

  2. Milvus实例页面,单击实例名称。

  3. 单击监控告警页签。

  4. 单击告警设置

  5. 告警设置页面,打开一键告警开关。

    image

    默认规则如下表所示。

    规则名称

    监控项

    指标采样周期

    报警规则

    规则名称

    监控项

    指标采样周期

    报警规则

    SystemDefault_acs_milvus_ProcessResidentMemoryUtilization

    内存使用率

    60

    连续5个周期平均值 >= 80%,则发出告警。

    SystemDefault_acs_milvus_ProcessCPUUtilization

    CPU使用率

    60

    连续5个周期平均值 >= 90%,则发出告警。

创建报警规则

  1. 进入告警设置页面。

    1. 登录阿里云Milvus控制台

    2. 在左侧导航栏,单击Milvus实例

    3. 在顶部菜单栏处,根据实际情况选择地域。

    4. Milvus实例页面,单击实例名称。

    5. 单击监控告警页签。

  2. 告警设置页面,单击报警规则设置

  3. 报警规则页面,单击创建报警规则

  4. 创建报警规则面板,产品选择向量检索服务Milvus资源范围选择全部资源,设置相应的参数,单击确认

    以创建向量检索服务Milvus版的报警规则,详情请参见创建报警规则

    image

管理报警规则

告警设置页面,单击报警规则设置,跳转到云监控的报警规则页面,您可以对当前的报警规则执行修改、删除和禁用等操作,详情请参见管理报警规则

  • 本页导读
  • 背景信息
  • 前提条件
  • 开启一键告警
  • 创建报警规则
  • 管理报警规则
AI助理

点击开启售前

在线咨询服务

你好,我是AI助理

可以解答问题、推荐解决方案等