全部产品

从这里开始

本章节问您介绍智能语音交互概要和快速入门内容。

快速入门

阿里云智能语音交互将为您提供如下服务:

  • 语音识别产品:语音识别产品使用介绍

    • 实时语音识别服务:对长时间的语音数据流进行识别,适用于会议演讲、视频直播等长时间不间断识别的场景。

    • 一句话识别服务对一分钟内的短语音进行识别,适用于对话聊天,控制口令等较短的语音识别场景。

    • 录音文件识别服务:对上传的音频文件进行识别,适用于非实时识别场景。

  • 语音合成产品:语音合成产品使用介绍

    • 语音合成服务:将文本转化为接近真人的语音服务,包含男女童音、多语言/方言。适用于智能客服、电话外呼等虚拟对话场景。

    • 长文本语音合成服务:将超长文本(十万字)合成为接近真人的语音服务,包含男女童音、多语言/方言(且拥有音频重复使用权)。适用于文学伴读、新闻阅读等场景。

    • 离线语音合成:在弱网或无网状态下,通过设备本地的语音合成模型,将文本转换成自然流畅的语音。

  • 自学习平台:自学习平台使用介绍

    • 自学习服务:使用自学习服务提供的训练热词和定制语言模型功能,提升识别效果。

  • 个性化人声定制服务:设备获取用户录制的少量语音,系统逐条检测录音质量后上传音频,自动化训练个性化人声模型。

  • 设备端语音交互NUI SDK:为您提供在智能音箱、语音IoT家电等需要远近场语音交互的智能硬件设备端的语音解决方案。

快速入门文档

快速入门文档介绍使用智能语音服务需要的步骤,帮助您快速开通服务、创建测试项目和调用语音服务。

快速入门文档:

  1. 开通服务

  2. 创建项目

  3. 运行SDK