质量指标监控

更新时间:
复制为 MD 格式

数据中心提供了应用维度的质量数据查询功能,包括视频卡顿率音频卡顿率400ms延时达标率等指标,并支持频道分析、单通通话分析与远端订阅质量分析,可帮助您快速了解实时音视频的质量情况。

功能概述

质量观测功能提供应用级数据监控与分析看板,用于评估线上音视频服务质量、验证新版本稳定性或定位共性卡顿问题,为服务优化提供数据支撑。

适用场景

  • 开发调试:SDK 集成后,验证音视频推流和播放质量是否符合预期。

  • 版本验证:在新版本发布前后,对比关键质量指标,评估版本稳定性。

  • 问题定位:当收到关于卡顿、连接失败的普遍反馈时,用于初步的趋势排查和问题定界。

  • 趋势监控:在业务运营过程中,长期跟踪应用整体的质量健康度。

前提条件

使用实时音视频的质量服务之前,您需要作如下准备:

  • 需要集成阿里云直播推流SDK互动版ARTC SDK

  • 请确保阿里云直播推流SDK的日志上报功能已开启,正常情况下,阿里云直播推流SDK的日志上报功能为默认开启的。

操作步骤

  1. 登录视频直播控制台

  2. 在左侧导航栏选择直播+ > 实时音视频 > 质量观测,进入实时音视频质量监控页面。

    image

    说明

    选择指定实时音视频应用ID,查看质量数据。每5分钟一个数据点,代表该5分钟内的平均值。您可以在视频直播控制台的直播+ > 实时音视频 > 应用管理 页面查看应用ID及其应用名称。

全局概览

全局概览提供实时音视频应用的主要质量数据。支持按以下维度筛选:

  • 终端类型:Native、Web,默认 Native。

  • 系统:全部系统、Android 系统、iOS 系统(仅 Native 端生效)。

  • 时间范围:支持查询近 1 小时至近 3 日内的自定义时段数据,默认展示近 1 小时的数据。

说明

  • 400ms延时达标率 仅支持查询 2025 年 2 月 1 日之后的数据。

  • 每 5 分钟一个数据点,代表该 5 分钟内的平均值;鼠标移入指标可显示时间与数值。

全局概览指标定义如下:

指标

定义

5秒加入频道成功率

用户尝试加入频道到成功加入频道用时不超过 5 秒的比例。

首帧耗时

从 subscribe 请求到首帧组帧完成的耗时,单位:毫秒。

400ms延时达标率

(单位时间内视频延时达标时长 / 单位时间内视频总用量)× 100%。从发送端开始发送,经网络传输到达接收端的延时(不包含 jitter buffer 延迟)小于 400ms,记为一次达标。

音频卡顿率

(单位时间内音频卡顿总时长 / 单位时间内音频总用量)× 100%。

视频卡顿率

(单位时间内视频卡顿总时长 / 单位时间内视频总用量)× 100%。

在线人数

峰值在线用户数:指定时间区间的峰值并发用户数,统计方式为该时间范围同时在线的UserID最大值。
活跃总用户数:指定时间区间的用户总数,统计方式为该时间范围的UserID去重累加值。

在线频道数

峰值在线频道数:指定时间区间的峰值并发频道数,统计方式为该时间范围同时在线的ChannelID最大值。
活跃总频道数:指定时间区间的频道总数,统计方式为该时间范围的ChannelID去重累加值。

频道分析

在质量观测页面进入频道分析后,可从频道维度查看实时排行、历史指标排行和通话记录。频道分析包含三个子页签:实时通话排行频道指标排行通话列表

支持按以下维度筛选:

  • 应用:默认选中第一个应用。

  • 终端类型:Native、Web,默认 Native。

实时通话排行

实时通话排行展示当前在线频道在近 30 秒内的质量排行,便于快速发现异常频道。

  1. 在频道分析下选择实时通话排行页签。

  2. 页面顶部提供快速定位入口,点击在线人数5s加入频道成功率首帧耗时400ms延时达标率音频卡顿率视频卡顿率可跳转到对应指标的排行区域。

  3. 各排行表格展示最多 20 个频道,列表包含频道 ID、开始时间及该指标相关字段。点击某一行的通话分析可进入该通通话的通话分析页面。

说明
  • 在线用户:当前该通话的实时在线用户数。

  • 活跃用户:该通话参与用户总数,按 UserID 去重统计。

  • 排行含义:在线人数按从高到低;5s加入频道成功率400ms延时达标率按从低到高(表现较差的在前);首帧耗时音频卡顿率视频卡顿率按从高到低(表现较差的在前)。

频道指标排行

频道指标排行按选定时间范围统计频道粒度的指标平均值,用于查看历史一段时间内的频道质量排行。

  1. 在频道分析下选择频道指标排行页签。

  2. 选择时间范围,默认近 1 小时,支持自定义;最大筛选跨度 1 天、最大查询范围 30 天,最小统计粒度 5 分钟。

  3. 页面展示 5s加入频道成功率首帧耗时400ms延时达标率音频卡顿率视频卡顿率等指标的频道排行,排序规则与实时通话排行一致。本页仅做查看,无跳转操作。

通话列表

通话列表按时间范围列出与筛选条件有交集的通话记录,便于按频道或时间进入单通通话分析。

  1. 在频道分析下选择通话列表页签。

  2. 选择应用时间(默认今天,支持自定义,最大跨度与范围均为 30 天);在 channelId 输入框中输入频道 ID 可精确筛选某一频道。

  3. 点击某一行的通话分析进入该通通话的通话分析页面。

说明
  • 活跃用户(人):该通话中参与用户数,同一用户多次进出只计一人。

  • 峰值在线用户(人):该通话从开始到结束(或到当前时刻)的最大同时在线人数

通话分析

实时通话排行通话列表中点击某一行的通话分析后,进入该通通话的详情分析页,包含质量概览指标排行用户列表三部分。

质量概览

质量概览展示该通通话在选定时间段内的整体质量趋势。

  1. 选择终端类型(Native / Web,默认 Native)。

  2. 通过时间轴选择要查看的时段:时间轴按通话起止时间展示,查询区间固定为1小时: 

    • 若通话已结束,默认显示结束前最近1小时; 

    • 若未结束,默认显示从开始起的1小时; 

    • 总时长不足1小时则不可拖动调整。

  3. 图表以 30 秒为粒度展示以下指标:在线人数5s加入频道成功率首帧耗时音频卡顿率视频卡顿率400ms延时达标率。指标定义与全局概览一致,参见上文全局概览中的指标表。

指标排行

指标排行展示该通通话内各用户的质量指标排行,便于定位质量较差的用户。

  1. 页面提供 400ms延时达标率下行丢包率上行丢包率音频卡顿率视频卡顿率等指标的排行列表;点击顶部快速定位可跳转到对应指标区域。

  2. 各排行列表展示入会时间、离会时间及该指标数值;400ms延时达标率展示表现较差的 50 名用户(达标率最低),丢包率与卡顿率展示表现较差的 50 名或 20 名用户(数值最高)。

  3. 点击某一行的 查看详情 可进入该用户的用户详情页面。

说明

上行/下行丢包率:(单位时间内丢失的数据包 / 单位时间内数据包总量)× 100%。

用户列表

用户列表展示该通通话内的全部用户及其状态,支持按用户 ID 或发布者筛选,并可进入单用户详情或远端订阅质量。

  1. 用户列表区域,可按 UserId 输入框精确查询某一用户;按 发布 UserId 输入框可查询“曾订阅过该发布者”的用户列表。

  2. 订阅用户数:表示该用户发布的流被订阅的总人数(UID 去重);点击该数字可自动填入“发布 UserId”查询订阅人数列表。

  3. 操作:点击查看详情进入该用户的通话详情页;对于有发布行为的用户,会显示远端订阅质量按钮,点击后进入用户详情页的远端订阅质量

说明

列表排序优先级:在线用户在前、离线在后;同状态下发布用户在前、订阅在后;再按入会时间倒序。

用户详情(原单点排障)

从通话分析的指标排行用户列表中点击查看详情远端订阅质量进入后,即为单用户的详情页,用于查看该用户的发布质量、订阅质量及(若有)远端订阅质量。

用户详情页包含以下 Tab:

Tab 名称

说明

发布质量

原推流质量。展示推流数据、阿里云节点接收数据、上行丢包率。上行丢包率由原“终端负载和网络”移入本 Tab。

订阅质量

原拉流质量。展示阿里云发送给该用户的数据,以及下行丢包率统计图。

远端订阅质量

仅对有发布操作的用户显示。展示远端用户订阅该用户发布流时的综合质量,数据粒度 30 秒;时间轴可拖动,跨度 1 小时。指标包括订阅人数、首帧耗时音频卡顿率视频卡顿率、400ms 延时达标率,定义与全局概览一致。

终端负载和网络

展示终端 CPU、内存等;上行丢包率已移入发布质量。Web 端无 CPU/内存数据时不展示对应图表。

事件流水

记录频道内所有系统和用户事件包括:加入房间、开始发布、重新发布、订阅流等事件。