智能语音交互产品基于语音识别、语音合成、自然语言理解等技术,实现“能听、会说、懂你”式的智能人机交互体验,适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。本文为您介绍如何使用智能语音交互,帮助您快速了解其使用流程和具体操作。
入门流程
快速入门文档介绍使用智能语音服务需要的步骤,帮助您快速开通服务、创建测试项目和调用语音服务。
步骤1:准备账号
注册阿里云账号。
阿里云账号作为阿里云系统识别的资源消费账户,有阿里云所有产品和管理权限。具体操作,请参见注册阿里云账号。
个人实名认证。
为了确保您可以正常使用阿里云产品和服务,您需要完成个人实名认证。具体操作,请参见个人实名认证。
(可选)创建并授权RAM用户。
当您的企业存在多用户协同访问资源的场景时,可以创建RAM用户,使用RAM可以按需为用户分配最小权限,避免多用户共享阿里云账号密码或访问密钥,从而降低企业的安全风险。具体操作,请参见创建RAM用户。关于RAM用户的更多信息,请参见什么是访问控制。
如果使用RAM用户调用智能语音交互产品,请前往控制台为RAM用户授予AliyunNLSFullAccess权限。具体操作,请参见为RAM用户授权。
说明创建RAM用户时,请设置登录密码,否则无法单独登录RAM账号。
步骤2:创建AccessKey
在调用阿里云API时您需要使用AccessKey完成身份验证,AccessKey包括AccessKey ID和AccessKey Secret,具体说明如下:
AccessKey ID:用于标识用户。
AccessKey Secret:用于验证用户的密钥。AccessKey Secret必须保密。
创建阿里云账号的AccessKey
登录RAM访问控制台,使用阿里云账号创建AccessKey。具体操作,请参见创建AccessKey。
创建RAM用户的AccessKey
使用阿里云账号登录RAM访问控制台,为RAM用户创建AccessKey。具体操作,请参见创建AccessKey。
RAM用户的AccessKey Secret只在创建时显示,不支持查看,请妥善保管。
步骤3:开通服务
如果您是第一次使用智能语音交互,推荐您使用阿里云账号开通智能语音交互服务。
进入智能语音交互产品首页,单击开通并购买,然后在产品开通页面,选择服务类型并选中服务协议,单击立即开通,即可开通智能语音交互服务。
类型 | 说明 |
免费试用版 | 默认全部试用。长文本语音合成、录音文件识别(闲时版)和录音文件识别(极速版)无试用版。 新开通服务的用户可免费试用3个月,支持2路并发(即同时最大2个任务)或每日2小时的录音文件识别额度。 重要 新用户试用期3个月内,每隔24小时可免费识别2小时时长的文件转写服务。免费额度用完后,间隔24小时后可继续试用。 |
商用版 | 选择某个或多个语音服务为商用,开通后按量计费,根据实际使用量从您的阿里云账户余额中扣费。更多信息,请参见计费说明。 |
步骤4:管理项目
步骤5:获取Token
访问令牌( Token)是调用智能语音交互服务的服务鉴权凭证。
Token在不同项目间、不同进程间、不同线程间都可以共用,Token有效期根据服务端返回为准,过期前必须提前重新获取Token,建议每天重新获取。为了安全起见,建议您在服务端集成Token SDK,客户端从服务端获取Token。
获取Token方式 | 建议使用场景 |
仅供测试使用,在控制台获取Token。 | |
正式环境使用,通过传入AccessKey ID和AccessKey Secret,在SDK通过代码定期自动获取Token。 | |
若对应的编程语言缺少SDK,或者需要控制依赖组件,可以通过OpenAPI获取Token。 |
步骤6:集成开发
根据以上几步获取到账号对应的AccessKey ID、AccessKey Secret、服务鉴权Token、以及项目Appkey,必须确保这几项数值归属于同一阿里云账号或同一RAM用户。
您可以根据以上信息,通过命令行等方式快速体验智能语音交互产品能力,具体操作,请参见运行示例。也可以通过SDK和API概览详细了解在各类平台如何将语音识别或语音合成功能集成到您的服务当中。
集成运行 | 说明 |
基于使用阿里云主账号且从控制台获取测试Token来体验产品。 主要通过控制台、curl命令行、postman、以及Java SDK等方式快速体验智能语音交互能力。 | |
RESTful API、移动端、服务端、微信小程序以及WebSocket等多种接入方式。 |