通过创建用户体验监控告警规则,您可以制定针对特定用户体验问题的告警规则。当规则被触发时,系统会以您指定的通知方式向告警联系人或钉群发送告警信息,以提醒您采取必要的解决措施。
使用场景
Web & H5应用:可以使用此功能来监测Web & H5的性能,包含:LCP(Largest Contentful Paint)最大内容渲染耗时、FID(First Input Delay)首次交互延迟耗时、以及CLS(Cumulativ Layout Shift)累计布局等核心指标,当核心指标出现异常时,系统会立即发出告警,帮助开发人员快速定位和解决问题,从而提升用户使用体验;
App应用:可以使用此功能来监测移动端App的性能(包含iOS和Android应用),支持资源加载、API调用、异常崩溃、卡顿等核心性能指标,自动上报异常堆栈、Crash日志等帮助快速定位和复现问题,提升用户使用体验;
示例:
某应用App发布新版本后,应用卡顿次数明显上升,此时通过提前配置的卡顿次数告警,通过区间检测发现异常,及时发现问题并修复,从而避免影响更多用户。
前提条件
已接入用户体验监控,具体操作,请参见接入应用。
配置阈值检测
登录ARMS控制台。
在左侧导航栏中选择
,然后单击创建告警规则。在创建告警规则页面自定义告警名称,并选择告警检测类型为阈值检测。
在告警对象区域根据需求选择对应的告警应用、指标类型和筛选条件。
参数
说明
告警应用
选择需要创建告警的应用。可以选择多个应用或全部应用。
新建应用时自动在此告警规则中追加
是否将之后接入的应用自动接入当前告警规则。
指标类型
选择需要检测的指标类型。更多信息,请参见RUM告警规则指标说明。
说明不同的指标类型,告警规则的条件字段和筛选条件不同。
筛选条件
针对指标进行进一步的筛选过滤以缩短监控范围。
告警指标的维度:
遍历:匹配当前维度下所有告警。
=/!=:精准匹配或排除,支持配置多个值。
包含/不包含:模糊匹配或排查,支持配置多个值。
说明如果您希望告警通知中提示某个维度的信息,则需要选取对应的筛选条件,否则在指标查询结果中,对应维度将会被聚合。
在告警规则区域设置以下参数。
参数
说明
告警触发模式
单条件:满足下述的规则就会触发告警。
多条件:选择告警触发规则。
同时满足下述规则:需满足所有告警条件才会触发告警。
满足下述一条规则:满足任意一条告警条件就会触发告警。
告警条件
根据所选的指标类型,配置告警触发条件。
触发周期:选择告警触发的周期,例如:最近5分钟。
告警指标:选择对应的指标。
触发条件:支持大于等于、小于等于、环比上升/下降%、与上小时同比上升/下降%、与昨日同比上升/下降%等。
说明您可以在告警通知中,评估当前告警条件阈值配置是否合理,并查看过去一段时间内是否触发了告警阈值。更多信息,请参见查看告警详情。
告警等级
系统内置了4种告警等级,您可以根据告警级别配置不同的通知策略。
例如:P1级别电话告警,P2及以下级别钉群通知。
P1:critical
P2:error
P3:warning
P4:page
填入P4建议阈值
可以根据阈值与指标的对比图调节阈值。当该规则对多个应用生效时,可以单击应用右侧图标,对不同应用生成不同的建议阈值。
ARMS通过智能算法根据指标历史水位为您推荐建议阈值。更多信息,请参见建议阈值说明。
告警数预测
查看选定时间段内指标预计超出阈值的次数,单击具体的告警数值,可以查询历史时间点触发告警的指标数值。
每一次新建或修改告警规则时,都推荐您使用告警数预测功能,该功能通过算法对历史数据进行分析,对选定时间段内进行告警数预测,方便您调整阈值。更多信息,请参见告警数预测功能说明。
设置通知策略和高级告警设置。
参数
说明
通知策略
不指定通知规则:告警被触发时不会发送告警,仅当通知策略的匹配规则被触发时才会发送告警。
指定通知规则发送告警:告警被触发时,ARMS通过指定通知策略的通知方式发送告警信息。您可以选择已有的通知策略,也可以新建一个通知策略。更多信息,请参见通知策略。
高级告警设置
无数据情况
用于无数据、复合指标和环比同比等异常数据的修复。当告警指标没有达到设置的条件时,告警数据修复为0、1或不触发告警。
更多详细信息,请参见告警管理名词解释。
设置完成后单击保存。
查看告警详情
收到告警通知后,您可以在告警通知群或ARMS控制台的 页面查看告警详情。
以下几种场景,告警详情暂时无法关联到RUM明细数据。
告警条件中使用了聚合型指标的,例如:异常数量、资源数量、卡顿次数等,暂不支持跳转查看详情。
告警条件中使用了同比、环比等触发条件时,例如:环比上升/下降%、与上小时同比上升/下降%、与昨日同比上升/下降%等,暂不支持跳转查看详情。
告警通知群
在告警通知群中收到告警通知后,您可以直接在告警通知群中查看并管理告警。更多信息,请参见在告警通知群中处理告警。
单击详情链接,可以进入用户体验监控的数据探索页面,查看触发告警的原始数据。
告警事件历史
在告警事件历史页面,单击目标事件名称,可以在弹出的面板中查看事件详情。更多信息,请参见查看告警事件历史。
单击事件地址链接,可以进入用户体验监控的数据探索页面,查看触发告警的原始数据。
建议阈值说明
建议阈值功能可以根据您选择的应用、接口和告警指标,通过智能算法对该指标的历史数据进行分析,为您推荐较为合理的静态阈值。该功能还支持实时生成指标和阈值的对比图,方便您调节阈值。
应用场景
当您发现经常收到某条告警,但是系统又没有发生任何故障时,可能是因为当前的阈值设置得不够合理,或者是该阈值不适合某些应用或接口。这种场景下,您可以使用建议阈值功能,对告警规则的阈值进行调整,或对部分应用、接口的阈值进行调整,ARMS会自动根据历史数据为您推荐合理的新阈值。
当您需要对大量应用、接口的某一指标配置告警,但是不同应用,不同接口适合的告警阈值又不同时,可以使用建议阈值功能。您无需手动为每一个应用/接口设置告警阈值,建议阈值功能通过智能算法可以帮您快速完成设置。
实现原理
当您单击填入P4建议阈值后,ARMS就会自动拉取每个应用、每个接口对应指标的历史3天数据,然后通过N-sigma算法计算每个指标历史3天的均值和方差。具体来说,假设您的业务没有发生明显变化,因此可以假设指标服从一个正态分布,那么,指标偏离期望3倍标准差的概率很小。基于这个原理,根据历史3天该指标的平均水位与波动情况,即可给出一个建议阈值。
告警等级中,P4表示最不严重的告警,这个建议阈值仅表示指标有些许异常,您可以根据P4建议阈值,设置P1、P2、P3等更严重的告警阈值。
告警数预测功能说明
告警数预测功能通过算法对历史数据进行分析,从而实现在选定时间段内对告警数进行预测,并展示历史告警发生的时刻。帮助您设置告警静态阈值或调整区间检测的告警灵敏度。
告警数预测原理
ARMS会根据指标历史24h数据,计算指标会超出每个阈值的次数来预测在该设定下告警的数量。并且,ARMS提供了指标详细信息,您可以看到指标实际值超出阈值的具体时间。您可以根据这些信息调整阈值,以适配实际业务需求。