阿里云首页 智能语音交互

功能特性

本文为您介绍智能语音交互的各项功能及其对应场景、支持的语音格式和调用方式。

功能服务参数表

服务

时效性

功能

适用场景

支持的语音格式

支持调用方式

免费调用量

购买

一句话识别

实时

识别一分钟内的短语音。

APP语音搜索、语音电话客服、对话聊天、控制口令等场景。

PCM(无压缩的PCM或WAV文件)、OPUS

Java/C++/Android/iOS

最大2个并发

可单独购买

实时语音识别

实时

识别长时间的语音数据流。

会议演讲、视频直播等长时间不间断语音场景。

PCM(无压缩的PCM或WAV文件)

Java/C++/Android/iOS

最大2个并发

可单独购买

语音合成

实时

合成长度不超过300个字符(UTF-8编码)的文本内容。

需要人工合成音的场景。

PCM、WAV、MP3

Java/C++/Android/iOS

最大2个并发

可单独购买

录音文件识别

非实时

录音文件上传后(文件大小不超过512 MB),针对免费用户,可在24小时内完成识别并返回识别文本;针对付费用户,可在6小时内完成识别并返回识别文本。

说明

一次性上传大规模数据(半小时内上传超过500小时时长的录音)的除外,如果您有大规模数据转写需求,可与售前专家联系。

非实时识别场景。

支持单轨/双轨的WAV、MP3、M4A、WMA、AAC、OGG、AMR、FLAC

Java/C++/GO/.NET/Node.js/PHP/Python

每个自然日最多识别2小时时长的录音文件

可单独购买

录音文件识别极速版

实时

识别文件大小不超过100 MB,30分钟以内时长的音频,转写完成时间不超过10秒。

短视频编辑工具、 电台和报社字幕内容。

AAC、MP3、OPUS、WAV

HTTP POST/Android/iOS

暂不支持免费试用

可单独购买

长文本语音合成

非实时

将超长文本(千字或万字)合成为语音二进制数据。

阅读小说、文章等场景。

PCM、WAV、MP3

JAVA/C++/RESTful API

暂不支持免费试用

可单独购买

离线语音合成

实时

无网状态下,离线进行本地的语音合成。

语音播报、新闻小说、有声阅读、无障碍播报。

PCM、WAV、MP3

iOS/Android

联系售前可申请3个设备授权

可单独购买

设备端语音交互SDK

实时

远场信号处理、语音唤醒、人声检测、在线语音识别以及在线语音合成。

智能音箱、儿童教育故事机、语音IoT家电等需要远近场语音交互的智能硬件设备端。

PCM、WAV

Android/iOS/Linux/RTOS

10个免费设备授权

可单独购买

注意

  • 除录音文件识别和录音文件识别极速版以外的其他识别服务只支持单声道(mono)语音数据。

  • 识别服务只支持8000Hz/16000Hz采样率、16bit采样位数的音频。

语音识别语种模型

采样率(Hz)

正式版/Beta版

中文普通话

方言

外语

16K

正式版

普通话(兼容部分口音)

湖北话、四川话、粤语、山西话、陕西话、东北话、天津话、甘肃话、贵州话、山东话、苏州话、浙江话、上海话

英文、日语、阿拉伯语、哈萨克语、俄语、印尼语、越南语、泰语

Beta版

河南话、云南话、江西话、广西话、宁夏话、湖南话、维语、闽南语

西班牙、韩语、法语、菲利宾语、印地语、德语、意大利语、马来语

8K

正式版

普通话(兼容部分口音)

粤语、四川话

英语

Beta版

河南话、湖北话、维语、广西话

语音合成模型

名称

voice参数值

类型

适用场景

支持语言

支持采样率(Hz)

支持时间戳(字级别音素边界)接口

声音品质

小云

xiaoyun

标准女声

通用场景

中文及中英文混合场景

8K/16K

lite版

小刚

xiaogang

标准男声

通用场景

中文及中英文混合场景

8K/16K

lite版

若兮

ruoxi

温柔女声

通用场景

中文及中英文混合场景

8K/16K/24K

标准版

思琪

siqi

温柔女声

通用场景

中文及中英文混合场景

8K/16K/24K

标准版

思佳

sijia

标准女声

通用场景

中文及中英文混合场景

8K/16K/24K

标准版

思诚

sicheng

标准男声

通用场景

中文及中英文混合场景

8K/16K/24K

标准版

艾琪

aiqi

温柔女声

通用场景

中文及中英文混合场景

8K/16K

标准版

艾佳

aijia

标准女声

通用场景

中文及中英文混合场景

8K/16K

标准版

艾诚

aicheng

标准男声

通用场景

中文及中英文混合场景

8K/16K

标准版

艾达

aida

标准男声

通用场景

中文及中英文混合场景

8K/16K

标准版

宁儿

ninger

标准女声

通用场景

纯中文场景

8K/16K/24K

标准版

瑞琳

ruilin

标准女声

通用场景

纯中文场景

8K/16K/24K

标准版

思悦

siyue

温柔女声

客服场景

中文及中英文混合场景

8K/16K/24K

标准版

艾雅

aiya

严厉女声

客服场景

中文及中英文混合场景

8K/16K

标准版

艾夏

aixia

亲和女声

客服场景

中文及中英文混合场景

8K/16K

标准版

艾美

aimei

甜美女声

客服场景

中文及中英文混合场景

8K/16K

标准版

艾雨

aiyu

自然女声

客服场景

中文及中英文混合场景

8K/16K

标准版

艾悦

aiyue

温柔女声

客服场景

中文及中英文混合场景

8K/16K

标准版

艾婧

aijing

严厉女声

客服场景

中文及中英文混合场景

8K/16K

标准版

小美

xiaomei

甜美女声

客服场景

中文及中英文混合场景

8K/16K/24K

标准版

艾娜

aina

浙普女声

客服场景

纯中文场景

8K/16K

标准版

伊娜

yina

浙普女声

客服场景

纯中文场景

8K/16K/24K

标准版

思婧

sijing

严厉女声

客服场景

纯中文场景

8K/16K/24K

标准版

思彤

sitong

儿童音

童声场景

纯中文场景

8K/16K/24K

标准版

小北

xiaobei

萝莉女声

童声场景

纯中文场景

8K/16K/24K

标准版

艾彤

aitong

儿童音

童声场景

纯中文场景

8K/16K

标准版

艾薇

aiwei

萝莉女声

童声场景

纯中文场景

8K/16K

标准版

艾宝

aibao

萝莉女声

童声场景

纯中文场景

8K/16K

标准版

Harry

harry

英音男声

英文场景

英文场景

8K/16K

标准版

Abby

abby

美音女声

英文场景

英文场景

8K/16K

标准版

Andy

andy

美音男声

英文场景

英文场景

8K/16K

标准版

Eric

eric

英音男声

英文场景

英文场景

8K/16K

标准版

Emily

emily

英音女声

英文场景

英文场景

8K/16K

标准版

Luna

luna

英音女声

英文场景

英文场景

8K/16K

标准版

Luca

luca

英音男声

英文场景

英文场景

8K/16K

标准版

Wendy

wendy

英音女声

英文场景

英文场景

8K/16K/24K

标准版

William

william

英音男声

英文场景

英文场景

8K/16K/24K

标准版

Olivia

olivia

英音女声

英文场景

英文场景

8K/16K/24K

标准版

姗姗

shanshan

粤语女声

方言场景

标准粤文(简体)及粤英文混合场景

8K/16K/24K

标准版

小玥

chuangirl

四川话女声

方言场景

中文及中英文混合场景

8K/16K

标准版

Lydia

lydia

英中双语女声

英文场景

英文及英中文混合场景

8K/16K

标准版

艾硕

aishuo

自然男声

客服场景

中文及中英文混合场景

8K/16K

标准版

青青

qingqing

台湾话女声

方言场景

中文场景

8K/16K

标准版

翠姐

cuijie

东北话女声

方言场景

中文场景

8K/16K

标准版

小泽

xiaoze

湖南重口音男声

方言场景

中文场景

8K/16K

标准版

智香

tomoka

日语女声

多语种场景

日文场景

8K/16K

标准版

智也

tomoya

日语男声

多语种场景

日文场景

8K/16K

标准版

Annie

annie

美语女声

英文场景

英文场景

8K/16K

标准版

佳佳

jiajia

粤语女声

方言场景

标准粤文(简体)及粤英文混合场景

8K/16K

标准版

Indah

indah

印尼语女声

多语种场景

纯印尼语场景

8K/16K

标准版

桃子

taozi

粤语女声

方言场景

支持标准粤文(简体)及粤英文混合场景

8K/16K

标准版

柜姐

guijie

亲切女声

通用场景

支持中文及中英文混合场景

8K/16K

标准版

Stella

stella

知性女声

通用场景

支持中文及中英文混合场景

8K/16K

标准版

Stanley

stanley

沉稳男声

通用场景

支持中文及中英文混合场景

8K/16K

标准版

Kenny

kenny

沉稳男声

通用场景

支持中文及中英文混合场景

8K/16K

标准版

Rosa

rosa

自然女声

通用场景

支持中文及中英文混合场景

8K/16K

标准版

Farah

farah

马来语女声

多语种场景

仅支持纯马来语场景

8K/16K

标准版

马树

mashu

儿童剧男声

通用场景

支持中文及中英文混合场景

8K/16K

标准版

小仙

xiaoxian

亲切女声

直播场景

支持中文及中英文混合场景

8K/16K

标准版

悦儿

yuer

儿童剧女声

通用场景

仅支持纯中文场景

8K/16K

标准版

猫小美

maoxiaomei

活力女声

直播场景

支持中文及中英文混合场景

8K/16K

标准版

艾飞

aifei

激昂解说

直播场景

支持中文及中英文混合场景

8K/16K

标准版

亚群

yaqun

卖场广播

直播场景

支持中文及中英文混合场景

8K/16K

标准版

巧薇

qiaowei

卖场广播

直播场景

支持中文及中英文混合场景

8K/16K

标准版

大虎

dahu

东北话男声

方言场景

支持中文及中英文混合场景

8K/16K

标准版

ava

ava

美语女声

英文场景

仅支持纯英文场景

8K/16K

标准版

艾伦

ailun

悬疑解说

直播场景

支持中文及中英文混合场景

8K/16K

标准版

杰力豆

jielidou

治愈童声

童声场景

仅支持纯中文场景

8K/16K

标准版

老铁

laotie

东北老铁

直播场景

仅支持纯中文场景

8K/16K

标准版

老妹

laomei

吆喝女声

直播场景

仅支持纯中文场景

8K/16K

标准版

艾侃

aikan

天津话男声

方言场景

仅支持纯中文场景

8K/16K

标准版