本文介绍如何使用SmartMetrics,包括创建预测任务、查询指标和配置告警。
功能入口
- 登录Grafana服务控制台,在左侧导航栏单击工作区管理。
- 在工作区管理页面,单击目标工作区右侧的访问地址url链接进入Grafana。
说明 如果需要登录Grafana,可以使用Grafana的Admin账号和创建工作区时设置的密码登录Grafana,或单击Sign in with Alibaba Cloud直接使用当前购买工作区的阿里云账号登录Grafana。
创建动态阈值任务
- 在Grafana左侧导航栏选择。
- 在Datasource右侧下拉框选择合适的数据源。
- 在Metrics browser区域选择所需要动态监控的指标。
说明 SmartMetrics目前只支持添加一条指标的任务,因此需要明确指标中的Label Value, 或者通过算子(如Sum、Count),实现单个指标的查询。
- 单击Metrics browser,然后在Select a metric区域选择具体的指标。
- 在Select labels to search in区域选择具体维度,然后在Select (multiple) values for your labels区域选择对应维度下的选项。
- 单击Use query生成对应的查询语句。
- 选择完成后,单击Run Query,查询到对应的指标曲线。
- 设定合适的模型参数,建议使用默认即可。
说明 灵敏度:低灵敏度表示预测出来的上下边界之间的距离比较大,高灵敏度则表示上下边界之间的距离比较小。对波动性较强的指标,建议配置低灵敏度。
- 输入预测名称和描述内容。
重要
- 预测名称不可以和已有的预测名称重复。
- 预测名称会成为当前动态阈值任务的名称,也是后续查询指标的名称。
- 单击创建预测,完成创建。
查看指标
- 在Grafana左侧导航栏选择。
说明 新预测任务创建后,任务立即启动, 完成数据拉取、计算、存储等任务,该过程需要等待1~2分钟左右。
- 根据预测名称找到预测任务,然后单击查看大盘,查看具体的指标和对应上下边界情况。
大盘提供了原始指标时间序列数据和对应的上下边界组合成的正常区域。指标值在边界之内的则可以理解为算法判定的正常,超出上下边界的则可以理解为算法判定的异常。

SmartMetrics会对指标的正常变化范围做出预测,生成未来一段时间的上下边界,并自动写入Prometheus。但Prometheus不会提前显示未来数据,而是根据实际时间自动获取对应数据,实时显示在大盘上。
- 单击面板名称,然后单击Edit。
当前指标和上下边界统一保存在
cloud_product_prometheus_cn-hangzhou_aiops_userId组合成的数据源中。指标名称即为创建任务时的名称,对应的
label: smart_metric
取值为actual(原始指标)、upper(上边界指标)、 lower(下边界指标)。
例如:如果您想单独查看上边界,则只需要在对应的cloud_product_prometheus_cn-hangzhou_aiops_userId数据源中,编辑指标为名称{smart_metric="upper"}
,在本例中即为test{smart_metric="upper"}
。

异常检测
在Edit页面的Query页签的D区域预置了超出上边界的查询语句。
您可以根据需求选择对应的指标查询语句。
- 超出上边界:
test{smart_metric="actual"} > ignoring (smart_metric) test{smart_metric="upper"}
- 超出下边界:
test{smart_metric="actual"} < ignoring (smart_metric) test{smart_metric="lower"}
- 超出上/下边界:
test{smart_metric="actual"} > ignoring (smart_metric) test{smart_metric="upper"} or test{smart_metric="actual"} < ignoring (smart_metric) test{smart_metric="lower"}
- 超出上边界阈值比例20%:
test{smart_metric="actual"} > ignoring (smart_metric) test{smart_metric="upper"} *1.2
任务管理
对于不需要的动态阈值检测任务,您可以在页面单击右侧
图标进行删除。