欢迎开启智能语音交互之旅!
阿里云智能语音交互将为您提供如下服务:
实时语音识别服务:对长时间的语音数据流进行识别,适用于会议演讲、视频直播等长时间不间断识别的场景。
一句话识别服务:对一分钟内的短语音进行识别,适用于对话聊天,控制口令等较短的语音识别场景。
录音文件识别服务:对上传的音频文件进行识别,适用于非实时识别场景。
语音合成服务:将文本转化为接近真人的语音服务,包含男女童音、多语言/方言。适用于智能客服、电话外呼等虚拟对话场景。
长文本语音合成服务:将超长文本(十万字)合成为接近真人的语音服务,包含男女童音、多语言/方言(且拥有音频重复使用权)。适用于文学伴读、新闻阅读等场景。
自学习服务:使用自学习服务提供的训练热词和定制语言模型功能,提升识别效果。
个性化人声定制服务:设备获取用户录制的少量语音,系统逐条检测录音质量后上传音频,自动化训练个性化人声模型。
设备端语音交互NUI SDK:为您提供在智能音箱、语音IoT家电等需要远近场语音交互的智能硬件设备端的语音解决方案。
快速入门文档及产品应用视频,介绍使用智能语音服务需要的步骤,帮助您快速开通服务、创建测试项目和调用语音服务。
快速入门文档:
产品应用视频:
在文档使用中是否遇到以下问题
更多建议
匿名提交