从这里开始

智能语音交互产品基于语音识别、语音合成、自然语言理解等技术,实现“能听、会说、懂你”式的智能人机交互体验,适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。本文为您介绍智能语音交互产品功能和功能体验等内容。

说明

更多产品咨询问题,可搜钉钉群号44949861入群咨询专家。

入门流程

快速入门文档介绍使用智能语音服务需要的步骤,帮助您快速开通服务、创建测试项目和调用语音服务。

快速入门

准备账号

  1. 注册阿里云账号。

    阿里云账号作为阿里云系统识别的资源消费账户,有阿里云所有产品和管理权限。具体操作,请参见注册阿里云账号

  2. 个人实名认证。

    为了确保您可以正常使用阿里云产品和服务,您需要完成个人实名认证。具体操作,请参见个人实名认证

  3. (可选)创建并授权RAM用户。

    当您的企业存在多用户协同访问资源的场景时,可以创建RAM用户,使用RAM可以按需为用户分配最小权限,避免多用户共享阿里云账号密码或访问密钥,从而降低企业的安全风险。具体操作,请参见创建RAM用户。关于RAM用户的更多信息,请参见什么是访问控制

    如果使用RAM用户调用智能语音交互产品,请前往控制台为RAM用户授予AliyunNLSFullAccess权限。具体操作,请参见为RAM用户授权RAM授权

创建AccessKey

在调用阿里云API时您需要使用AccessKey完成身份验证。AccessKey包括AccessKey ID和AccessKey Secret,需要一起使用。具体如下:

  • AccessKey ID:用于标识用户。

  • AccessKey Secret:用于验证用户的密钥。AccessKey Secret必须保密。

创建阿里云账号的AccessKey

登录RAM访问控制台,使用阿里云账号创建AccessKey。具体操作,请参见创建AccessKey使用阿里云账号创建ak

创建RAM用户的AccessKey

使用阿里云账号登录RAM访问控制台,为RAM用户创建AccessKey。具体操作,请参见创建AccessKey

说明

RAM用户的AccessKey Secret只在创建时显示,不支持查看,请妥善保管。

使用ram账号创建ak

开通服务

如果您是第一次使用智能语音交互产品,推荐您使用阿里云账号开通智能语音交互服务。

进入智能语音交互产品首页,单击开通并购买,然后在产品开通页面,选择服务类型并选中服务协议,单击立即开通,即可开通智能语音交互服务。

类型

说明

免费试用版

默认全部试用,长文本语音合成、录音文件识别(闲时版)和录音文件识别(极速版)无试用版。

新开通服务的用户可免费试用3个月,支持2路并发(即同时最大2个任务)或每日2小时的录音文件识别额度。

商用版

选择某个或多个语音服务为商用,开通后按量计费,根据实际使用量从您的阿里云账户余额中扣费。更多信息,请参见计费说明

开通立即开通

管理项目

登录智能语音交互控制台,创建项目生成Appkey,根据您的使用场景,选择配置项目所需的语音识别和语音合成模型,具体操作,请参见管理项目

一个项目对应一个Appkey,代表智能语音服务的一个业务场景,Appkey在智能语音交互能力体验时是不可或缺的参数值。若您有多个业务场景,并且场景中使用的词汇或者语言不同,您需要创建多个项目,配置不同的热词和语言模型。

管理项目

获取Token

访问令牌( Token)是调用智能语音交互服务的服务鉴权凭证。

Token在不同项目间、不同进程间、不同线程间都可以共用,需要注意Token有效期为24小时,过期前必须提前重新获取Token,建议每天重新获取。为了安全起见,建议您在服务端集成Token SDK,客户端从服务端获取Token。

获取Token方式

建议使用场景

通过控制台获取Token

仅供测试使用,在控制台获取Token。

通过SDK获取Token

正式环境使用,通过传入AccessKey ID和AccessKey Secret,在SDK通过代码定期自动获取Token。

通过OpenAPI获取Token

若对应的编程语言缺少SDK,或者需要控制依赖组件,可以通过OpenAPI获取Token。

集成开发

根据以上几步获取到账号对应的AccessKey IDAccessKey Secret服务鉴权Token、以及项目Appkey,必须确保这几项数值归属同一阿里云账号或同一RAM用户。

您可以根据以上信息,通过命令行等方式快速体验语音产品能力,具体操作,请参见运行示例。也可以通过SDK和API概览详细了解在各类平台如何将语音识别语音合成功能集成到您的服务当中。

集成运行

说明

运行示例

基于使用阿里云主账号且从控制台获取测试Token来体验产品。

主要通过控制台、curl命令行、postman、以及JavaSDK等方式快速体验智能语音交互能力。

SDK和API概览

RESTful API、移动端、服务端、微信小程序以及WebSocket等多种接入方式。

阿里云首页 智能语音交互 相关技术圈