SDK和API概览

更新时间:
复制 MD 格式

阿里云智能语音交互SDK提供RESTful API、移动端、服务端、微信小程序以及WebSocket等多种接入方式,可帮助您更方便、快捷、灵活地将语音识别或语音合成功能集成到您的服务当中。

SDK接入

类型

接入方式

服务能力

RESTful API

RESTful API

一句话识别录音文件识别录音文件识别闲时版语音合成长文本语音合成

移动端

移动端iOS SDK

一句话识别实时语音识别录音文件识别极速版语音合成

移动端Android SDK

一句话识别实时语音识别录音文件识别极速版语音合成

移动端鸿蒙Next SDK

一句话识别实时语音识别录音文件识别极速版语音合成长文本语音合成

离线移动端iOS SDK

离线语音合成

离线移动端Android SDK

离线语音合成

服务端

Java SDK

一句话识别实时语音识别录音文件识别录音文件识别闲时版语音合成长文本语音合成声音事件检测说话人识别性别识别语种识别

Python SDK

一句话识别实时语音识别录音文件识别录音文件识别闲时版语音合成

C++ SDK

一句话识别实时语音识别语音合成

Go SDK

一句话识别实时语音识别语音合成

Node.js SDK 

一句话识别实时语音识别语音合成

小程序

微信小程序

一句话识别实时语音识别语音合成

WebSocket

WebSocket

实时语音识别

说明

部分服务仅支持商用版,不提供免费试用,包括:长文本语音合成、录音文件识别(闲时版)、录音文件识别(极速版)、流式文本语音合成(CosyVoice大模型)和语音对话VoiceChat。使用免费试用版调用这些服务时,将返回错误码40000010(Gateway:FREE_TRIAL_EXPIRED)。详情请参见计费项