传统直播以单向内容传播为主,观众参与度和商业转化率较低。阿里云实时音视频(ApsaraVideo Real-time Communication)通过语音聊天、视频连麦、游戏互动等功能,让观众从观看者变为参与者,增强用户连接。本文将为您介绍实时音视频的产品架构、应用场景及功能特性。
产品架构
阿里云实时音视频ARTC凭借其先进的技术架构和优化算法,为开发者和企业提供了高效、稳定且易于使用的SDK和API接口,支持包括但不限于iOS、Android、Web及Windows等平台的无缝集成。此外,您还可以通过与阿里云其他产品的联动,进一步扩展更多业务场景。
应用场景
支持最多50人同时上麦,延时低于300ms,提供变声、混响、美声等多种声音玩法。如果您需要保障语音内容合规,我们还提供了内容审核服务及第三方对接能力,帮助您快速上线完整方案。更多详情,请参见语聊房、K歌房、实时音视频通话。
语聊房 | K歌房 | 实时音视频 |
适用于主播与观众连麦、主播PK互动以及多人连麦等玩法。支持端到端延时低于300ms,并实现观众上下麦平滑切换。此外,该功能可与阿里云标准直播和超低延时直播无缝联动,支持10万+观众并发观看。更多详情,请参见直播连麦。
主播&观众连麦 | 主播和主播PK |
帮助企业快速构建AI音视频通话应用。用户通过简单的白屏化操作,即可在10分钟内搭建专属AI智能体,并通过视频云网络与终端用户实时交互。更多详情,请参见AI实时互动概览。
语音通话 | 数字人通话 | 视觉理解通话 |
功能特性
功能 | 功能说明 | 常见应用场景 | 计费说明 |
功能 | 功能说明 | 常见应用场景 | 计费说明 |
视频通话 | 两人或多人视频通话,支持最低480P、720P、1080P高清画质。 | 1对1视频、多人视频会议、视频客服、实时音视频通话等。 | |
语音通话 | 两人或多人语音通话。 | 1对1语音通话、多人语音通话、语音聊天、实时音视频通话等。 | |
视频互动 | 支持480P、720P、1080P等分辨率的多人视频互动,端到端延时300ms内 。 | 超低延时直播、主播跨房间PK等。 | |
语音互动 | 支持48KHz高音质语音互动。 | ||
云端录制 | 支持将音视频流录制至OSS或VOD。 | 存档、合规审查等。 | |
云端转码 | 确保音视频内容能够流畅、高质量地在各种环境中传输与播放。 | 录制格式转换。 | |
混流转推 | 支持将多路流按照一定规则进行混流,并支持转推至阿里云直播或第三方。 | 多画面直播、大型多方会议、多教师协同授课等。 | |
语音审核 | 支持无缝对接阿里云语音审核,或手动对接第三方审核。 | 业务安全检查,内容合规等。 | |
视频审核 | 支持无缝对接阿里云视频审核,或手动对接第三方审核。 | 业务安全检查,内容合规等。 | |
视频美颜 | 提供多种版本的美颜特效。 | 视频通话、互动直播、在线课堂等。 | |
混响 | 支持走廊、教堂、录音棚、地下室、音乐厅等多种混响效果。 | 语音通话、视频通话、语聊房、K 歌房等。 | 免费 |
变声 | 支持电音、老人、大叔、萝莉等多种变声效果。 | K 歌房、语聊房等。 | |
智能降噪 | 在高保真还原人声前提下,智能消除周边噪音、抑制突发噪音、消除多设备啸叫。 | 语音通话、多人会议等。 | |
低延时耳返 | 在音频采集、处理与播放过程中,将用户实时发出的声音经过极短的延迟后,通过耳机(或其他音频输出设备)反馈给用户。 | 互动直播、K 歌房、录音房等。 | |
音频3A | 即AEC(回声消除)、ANS(自动噪声抑制)、AGC(自动增益控制)。 | 含语音场景。 | |
屏幕分享 | 将电脑桌面、窗口或指定区域共享给其他用户,并支持与摄像头画面同时显示。 | 在线课堂、远程协助等。 | |
空间音效 | 通过特定音频技术,模拟声音在三维空间中的传播效果,为用户营造出具有空间感、方位感和沉浸感的音频体验。 | K歌房、语聊房等。 | |
自定义音视频输入 | 支持用户输入外部音视频流数据。 | 自定义美颜、自定义音效等。 |
核心优势
全球范围内高质量服务:RTC、直播、点播节点在全球实现 3200 + 节点覆盖,设有 10 大媒体中心,分别位于北京、深圳、上海、青岛、新加坡、德国、印度、印度尼西亚、沙特,同时拥有 3 大混流 / 转推中心,地处上海、新加坡以及沙特(利雅得),保证您在全球范围内服务的高可用。
安全合规:全球通话合规资质完整与隐私保护标准认证完整。
多样化产品融合:联动ECS、OSS、安全、直播、点播、数字人、AI等产品形成一站式解决方案。
易于集成
相关概念
本部分介绍使用阿里云实时音视频的相关概念 。
概念 | 说明 |
概念 | 说明 |
SDKAppID | 阿里云实时音视频通过不同的应用(通过SDKAppID表示)管理客户业务。通常您需要为不同的业务创建独立SDKAppID,并通过SDKAppID实现业务和配置隔离。 |
ChannelID | 频道(通过ChannelID表示)是阿里云实时音视频定义的音视频空间,同一个频道内的用户可以彼此进行音视频交互。阿里云也针对部分特定场景提供了跨频道用户间的音视频交互能力。 |
UserID | UserID是用户在实时音视频中的唯一用户标识,在同一个应用里UserID具有全局唯一性。 |
Token | Token是阿里云设计的一种安全保护签名,目的是为了阻止恶意攻击者盗用您的云服务使用权。您需要在相应SDK的登录函数中提供SdkAppID、UserID、房间ID、TimeStamp和Token信息 |
发布 | 发布指用户将本地的音视频数据上传到阿里云服务端的操作,对应推流。 |
订阅 | 订阅指用户将阿里云服务端的音视频拉取到本地的操作,对应拉流。 |
Role | 在实时音视频里有主播角色和观众角色,主播角色既可以发布音视频流,也可以订阅音视频流。观众角色仅支持订阅音视频流。用户可以在通话过程中切换角色。 |
混流转推 | 通过混流转推您可以将指定的多路音视频流进行混流布局、音视频编码参数设置等,并将处理完的流转推至阿里云视频直播或第三方直播平台。 当您将流转推至阿里云视频直播后,您可以基于视频直播产品开展转码、录制、直播观看等业务。 |
- 本页导读 (1)
- 产品架构
- 应用场景
- 功能特性
- 核心优势
- 相关概念