云监控(CloudMonitor)是一项针对阿里云资源和互联网应用进行监控的服务。您可以接入云监控服务通过设置报警规则对转码作业进行监控。本文为您介绍媒体处理中设置报警规则的操作步骤。
设置报警规则(接入云监控)
背景信息
您可以使用媒体处理云监控服务获取系统性能、用量两方面的监控数据指标。您还可以使用自定义报警服务,监控服务稳定性、分析使用情况,及时发现以及诊断相关问题。如需了解基本概念或进行报警联系人和报警联系组的配置,请参见概览和创建报警联系人或报警联系人组。
监控指标
指标名称 | 单位 | 指标描述 | 统计维度 | 时间粒度 |
请求成功率 | % | MPS服务的系统可用性衡量指标。计算公式:1 - 服务端错误请求(返回状态码为5xx)占总请求的百分比。 | 用户层级 | 5分钟 |
提交截图任务数 | 次数 | MPS服务端接收到的截图任务请求数。 | 管道层级 | 1分钟 |
转码时长 | 分钟 | MPS服务端接收并处理成功的输出视频时长。 | 管道层级 | 1分钟 |
提交转码任务数 | 次数 | MPS服务端接收到的转码任务请求数。 | 管道层级 | 1分钟 |
操作步骤
登录媒体处理控制台。
在左侧导航栏,选择
。单击设置报警规则,进入报警规则页面。
首次进入时,会弹出云监控服务关联角色弹窗,单击确定。如已关联,请忽略。
单击创建报警规则。
设置关联资源。
参数
说明
产品
在下拉列表中选择媒体处理产品。
资源范围
报警规则作用的资源范围。取值:
全部资源:报警规则作用于指定云产品的全部资源上,对于新加入的资源生效。
应用分组:报警规则作用于指定云产品的指定应用分组内的全部资源上,对于新加入的资源生效。
实例:报警规则作用于指定云产品的指定资源上。
规则描述
报警规则的主体。当监控数据满足报警条件时,触发报警规则。规则描述的设置方法如下:
单击添加规则。
在添加规则描述面板,设置规则名称、监控指标类型、监控指标、阈值、报警级别和报警方式等。
单击确定。
说明关于如何设置复杂的报警条件,请参见报警规则表达式说明。
通道沉默周期
报警通知的间隔时长。报警发生后如果未恢复正常,可以重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。
某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。
例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。
生效时间
报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。
报警联系人组
发送报警的联系人组。
应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系人组。
报警回调
公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调。
说明单击高级设置,可设置该参数。
当您需要测试报警回调地址的连通性时,可以执行以下操作。
单击回调地址正后方的测试。
在WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。
说明您还可以设置Webhook的回调模板类型和语言,再次单击测试,获取对应的测试结果详情。
单击关闭。
弹性伸缩
如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域、弹性伸缩组和弹性伸缩规则。
说明单击高级设置,可设置该参数。
日志服务
如果您打开日志服务开关,当报警发生时,会将报警信息写入日志服务的日志库。您需要设置日志服务的地域、ProjectName和Logstore。
关于如何创建Project和Logstore,请参见快速入门。
说明单击高级设置,可设置该参数。
轻量消息队列(原 MNS)-Topic
如果您打开轻量消息队列(原MNS) -Topic开关,当报警发生时,会将报警信息写入轻量消息队列(原MNS)的主题。您需要设置轻量消息队列(原MNS)的地域和主题。
关于如何创建主题,请参见创建主题。
说明单击高级设置,可设置该参数。
无数据处理方法
无监控数据时报警的处理方式。取值:
不做任何处理(默认值)
发送无数据报警
视为恢复
说明单击高级设置,可设置该参数。
标签
报警规则的标签。包括标签名称和标签值。
单击确认,完成报警规则创建。
管理报警规则
登录云监控控制台。
在左侧导航栏选择
,查看、修改、启用、禁用和删除对应的报警规则。