实时音视频简介

更新时间:2025-03-27 02:47:59

传统直播以单向内容传播为主,观众参与度和商业转化率较低。阿里云实时音视频(ApsaraVideo Real-time Communication)通过语音聊天、视频连麦、游戏互动等功能,让观众从观看者变为参与者,增强用户连接。本文将为您介绍实时音视频的产品架构、应用场景及功能特性。

产品架构

阿里云实时音视频ARTC凭借其先进的技术架构和优化算法,为开发者和企业提供了高效、稳定且易于使用的SDKAPI接口,支持包括但不限于iOS、Android、WebWindows等平台的无缝集成。此外,您还可以通过与阿里云其他产品的联动,进一步扩展更多业务场景。

image

应用场景

社交语聊
直播连麦
AI实时互动

支持最多50人同时上麦,延时低于300ms,提供变声、混响、美声等多种声音玩法。如果您需要保障语音内容合规,我们还提供了内容审核服务及第三方对接能力,帮助您快速上线完整方案。更多详情,请参见语聊房K歌房实时音视频通话

语聊房

image

K歌房

image.png

实时音视频

双人通话.png

适用于主播与观众连麦、主播PK互动以及多人连麦等玩法。支持端到端延时低于300ms,并实现观众上下麦平滑切换。此外,该功能可与阿里云标准直播和超低延时直播无缝联动,支持10万+观众并发观看。更多详情,请参见直播连麦

主播&观众连麦

image

主播和主播PK

image

帮助企业快速构建AI音视频通话应用。用户通过简单的白屏化操作,即可在10分钟内搭建专属AI智能体,并通过视频云网络与终端用户实时交互。更多详情,请参见AI实时互动概览

语音通话

lQDPJxfI6jx3dVXNC6zNBaCwBmqQRhnIAYIHiTmemZYXAA_1440_2988

数字人通话

lQDPJwMuwU90JFXNC6zNBaCwNbn8uKeIjbgHiTmd5-WQAA_1440_2988

视觉理解通话

lQDPJwpRBT4ppFXNC6zNBaCwzODP1_m-L7MHiTmc7Nh_AA_1440_2988

功能特性

功能

功能说明

常见应用场景

计费说明

功能

功能说明

常见应用场景

计费说明

视频通话

两人或多人视频通话,支持最低480P、720P、1080P高清画质。

11视频、多人视频会议、视频客服、实时音视频通话等。

实时音视频费用

语音通话

两人或多人语音通话。

11语音通话、多人语音通话、语音聊天、实时音视频通话等。

视频互动

支持480P、720P、1080P等分辨率的多人视频互动,端到端延时300ms内 。

超低延时直播、主播跨房间PK等。

语音互动

支持48KHz高音质语音互动。

语聊房K歌房直播连麦等。

云端录制

支持将音视频流录制至OSSVOD。

存档、合规审查等。

录制费用

云端转码

确保音视频内容能够流畅、高质量地在各种环境中传输与播放。

录制格式转换。

转码费用

混流转推

支持将多路流按照一定规则进行混流,并支持转推至阿里云直播或第三方。

多画面直播、大型多方会议、多教师协同授课等。

转推费用

语音审核

支持无缝对接阿里云语音审核,或手动对接第三方审核。

业务安全检查,内容合规等。

智能审核费用

视频审核

支持无缝对接阿里云视频审核,或手动对接第三方审核。

业务安全检查,内容合规等。

视频美颜

提供多种版本的美颜特效。

视频通话、互动直播、在线课堂等。

美颜特效费用

混响

支持走廊、教堂、录音棚、地下室、音乐厅等多种混响效果。

语音通话、视频通话、语聊房、K 歌房等。

免费

变声

支持电音、老人、大叔、萝莉等多种变声效果。

K 歌房、语聊房等。

智能降噪

在高保真还原人声前提下,智能消除周边噪音、抑制突发噪音、消除多设备啸叫。

语音通话、多人会议等。

低延时耳返

在音频采集、处理与播放过程中,将用户实时发出的声音经过极短的延迟后,通过耳机(或其他音频输出设备)反馈给用户。

互动直播、K 歌房、录音房等。

音频3A

AEC(回声消除)、ANS(自动噪声抑制)、AGC(自动增益控制)。

含语音场景。

屏幕分享

将电脑桌面、窗口或指定区域共享给其他用户,并支持与摄像头画面同时显示。

在线课堂、远程协助等。

空间音效

通过特定音频技术,模拟声音在三维空间中的传播效果,为用户营造出具有空间感、方位感和沉浸感的音频体验。

K歌房、语聊房等。

自定义音视频输入

支持用户输入外部音视频流数据。

自定义美颜、自定义音效等。

核心优势

  • 全球范围内高质量服务:RTC、直播、点播节点在全球实现 3200 + 节点覆盖,设有 10 大媒体中心,分别位于北京、深圳、上海、青岛、新加坡、德国、印度、印度尼西亚、沙特,同时拥有 3 大混流 / 转推中心,地处上海、新加坡以及沙特(利雅得),保证您在全球范围内服务的高可用。

  • 安全合规:全球通话合规资质完整与隐私保护标准认证完整。

  • 多样化产品融合:联动ECS、OSS、安全、直播、点播、数字人、AI等产品形成一站式解决方案。

  • 易于集成

    • UI的集成:提供开源界面示例代码、UI组件,简化开发流程。详细内容,请参见互动直播场景

    • 场景化API集成:将底层原子API接口从业务场景视角进行封装,简化开发难度。详细内容,请参见开发参考

    • 多场景实践提供:涵盖1V1通话、直播连麦、语聊房、KTV等场景。详细内容,请参见场景实践

相关概念

本部分介绍使用阿里云实时音视频的相关概念 。

概念

说明

概念

说明

SDKAppID

阿里云实时音视频通过不同的应用(通过SDKAppID表示)管理客户业务。通常您需要为不同的业务创建独立SDKAppID,并通过SDKAppID实现业务和配置隔离。

ChannelID

频道(通过ChannelID表示)是阿里云实时音视频定义的音视频空间,同一个频道内的用户可以彼此进行音视频交互。阿里云也针对部分特定场景提供了跨频道用户间的音视频交互能力。

UserID

UserID是用户在实时音视频中的唯一用户标识,在同一个应用里UserID具有全局唯一性。

Token

Token是阿里云设计的一种安全保护签名,目的是为了阻止恶意攻击者盗用您的云服务使用权。您需要在相应SDK的登录函数中提供SdkAppIDUserID房间IDTimeStampToken信息

发布

发布指用户将本地的音视频数据上传到阿里云服务端的操作,对应推流

订阅

订阅指用户将阿里云服务端的音视频拉取到本地的操作,对应拉流

Role

在实时音视频里有主播角色观众角色主播角色既可以发布音视频流,也可以订阅音视频流。观众角色仅支持订阅音视频流。用户可以在通话过程中切换角色。

混流转推

通过混流转推您可以将指定的多路音视频流进行混流布局、音视频编码参数设置等,并将处理完的流转推至阿里云视频直播或第三方直播平台。

当您将流转推至阿里云视频直播后,您可以基于视频直播产品开展转码、录制、直播观看等业务。

  • 本页导读 (1)
  • 产品架构
  • 应用场景
  • 功能特性
  • 核心优势
  • 相关概念
AI助理

点击开启售前

在线咨询服务

你好,我是AI助理

可以解答问题、推荐解决方案等