智能语音交互产品基于语音识别、语音合成、自然语言理解等技术,实现“能听、会说、懂你”式的智能人机交互体验,适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。本文为您介绍如何使用智能语音交互,帮助您快速了解其使用流程和具体操作。
步骤1:准备账号
-
注册阿里云账号。
阿里云账号作为阿里云系统识别的资源消费账户,有阿里云所有产品和管理权限。具体操作,请参见注册阿里云账号。
-
个人实名认证。
为了确保您可以正常使用阿里云产品和服务,您需要完成个人实名认证。具体操作,请参见个人实名认证。
-
(可选)创建并授权RAM用户。
当您的企业存在多用户协同访问资源的场景时,可以创建RAM用户,使用RAM可以按需为用户分配最小权限,避免多用户共享阿里云账号密码或访问密钥,从而降低企业的安全风险。具体操作,请参见创建RAM用户。关于RAM用户的更多信息,请参见什么是访问控制。
如果使用RAM用户调用智能语音交互产品,请前往控制台为RAM用户授予AliyunNLSFullAccess权限。具体操作,请参见管理RAM用户的权限。
在选择权限页面,单击系统策略页签,搜索NLS,找到并选中AliyunNLSFullAccess。
说明创建RAM用户时,请设置登录密码,否则无法单独登录RAM账号。
步骤2:创建AccessKey
在调用阿里云API时您需要使用AccessKey完成身份验证,AccessKey包括AccessKey ID和AccessKey Secret,具体说明如下:
-
AccessKey ID:用于标识用户。
-
AccessKey Secret:用于验证用户的密钥。AccessKey Secret必须保密。
创建阿里云账号的AccessKey
登录RAM访问控制台,使用阿里云账号创建AccessKey。具体操作,请参见创建AccessKey。
创建RAM用户的AccessKey
使用阿里云账号登录RAM访问控制台,为RAM用户创建AccessKey。具体操作,请参见创建AccessKey。
RAM用户的AccessKey Secret仅在创建时显示,创建后将无法查看。请在创建时进行备份(比如保存到本地),以便您后续查看其内容。
在左侧导航栏选择身份管理 > 用户,单击目标用户登录名称进入详情页,在认证管理页签的用户 AccessKey 区域单击创建 AccessKey。
步骤3:开通服务
如果您是第一次使用智能语音交互,推荐您使用阿里云账号开通智能语音交互服务。
进入智能语音交互产品首页,单击开通并购买,然后在产品开通页面,选择服务类型并选中服务协议,单击立即开通,即可开通智能语音交互服务。
|
类型 |
说明 |
|
免费试用版 |
默认全部试用(部分服务除外,详见下方说明)。 新开通服务的用户可免费试用3个月,支持2路并发(即同时最大2个任务)或每日2小时的录音文件识别额度。 重要
新用户试用期3个月内,每隔24小时可免费识别2小时时长的文件转写服务。免费额度用完后,间隔24小时后可继续试用。 |
|
商用版 |
选择某个或多个语音服务为商用,开通后按量计费,根据实际使用量从您的阿里云账户余额中扣费。更多信息,请参见计费方式。 |
选择服务版本后,单击立即开通。
步骤4:管理项目
步骤5:获取Token
访问令牌( Token)是调用智能语音交互服务的服务鉴权凭证。
快速入门推荐:如果您是首次体验,建议使用通过控制台获取临时Token方式,操作最简单,适合快速测试。正式环境请使用SDK内置Token获取功能。
Token有有效期(通常24小时),过期后需要重新获取。正式环境建议通过SDK自动管理Token的获取和刷新。
|
获取Token方式 |
建议使用场景 |
|
仅供测试使用,在控制台获取Token。 |
|
|
正式环境使用,通过传入AccessKey ID和AccessKey Secret,在SDK通过代码定期自动获取Token。 |
|
|
若对应的编程语言缺少SDK,或者需要控制依赖组件,可以通过OpenAPI获取Token。 |
步骤6:集成开发
请确保Appkey、AccessKey和Token归属于同一阿里云账号(或同一RAM用户),否则调用会报错。
完成以上步骤后,请根据您的使用场景,选择最适合的入门方式:
|
入门方式 |
适合人群 |
说明 |
|
开发者 |
通过curl命令、Postman或SDK快速体验语音识别和语音合成。推荐新手从"一句话识别 curl 示例"开始,只需一条命令即可完成首次调用。 |
|
|
非开发者 |
通过控制台界面直接体验语音识别和语音合成,无需编写任何代码。 |
如需了解更多接入方式(RESTful API、移动端、WebSocket等),请参见SDK和API概览。
常见问题
-
调用服务时报错
Gateway:FREE_TRIAL_EXPIRED(错误码40000010)怎么办?此错误有两种常见原因:
原因一:免费试用期已过期。智能语音交互的免费试用期为3个月,到期后所有试用版服务均无法调用。请登录智能语音交互控制台的服务管理与开通页面,检查试用版状态。如已过期,请将所需服务升级为商用版。
原因二:调用了仅支持商用版的服务。即使在试用期内,长文本语音合成、录音文件识别(闲时版/极速版)、流式文本语音合成(CosyVoice大模型语音合成)、语音对话VoiceChat等服务也不支持免费试用,必须开通商用版才能使用。
-
哪些服务支持免费试用?
支持免费试用的服务包括:录音文件识别、实时语音识别、一句话识别、语音合成、说话人识别、声音事件检测、性别识别和语种识别。试用期为3个月,支持2路并发。详情请参见计费项。
-
如何将试用版升级为商用版?
登录智能语音交互控制台,在服务管理与开通页面,单击对应服务右侧的升级为商用版。开通后为按量计费模式,也可购买资源包进一步降低成本。具体操作,请参见服务升级与购买。