从这里开始

更新时间:
复制 MD 格式

智能语音交互产品基于语音识别、语音合成、自然语言理解等技术,实现“能听、会说、懂你”式的智能人机交互体验,适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。本文为您介绍如何使用智能语音交互,帮助您快速了解其使用流程和具体操作。

image

步骤1:准备账号

  1. 注册阿里云账号。

    阿里云账号作为阿里云系统识别的资源消费账户,有阿里云所有产品和管理权限。具体操作,请参见注册阿里云账号

  2. 个人实名认证。

    为了确保您可以正常使用阿里云产品和服务,您需要完成个人实名认证。具体操作,请参见个人实名认证

  3. (可选)创建并授权RAM用户。

    当您的企业存在多用户协同访问资源的场景时,可以创建RAM用户,使用RAM可以按需为用户分配最小权限,避免多用户共享阿里云账号密码或访问密钥,从而降低企业的安全风险。具体操作,请参见创建RAM用户。关于RAM用户的更多信息,请参见什么是访问控制

    如果使用RAM用户调用智能语音交互产品,请前往控制台RAM用户授予AliyunNLSFullAccess权限。具体操作,请参见管理RAM用户的权限

    选择权限页面,单击系统策略页签,搜索NLS,找到并选中AliyunNLSFullAccess

    说明

    创建RAM用户时,请设置登录密码,否则无法单独登录RAM账号。

步骤2:创建AccessKey

在调用阿里云API时您需要使用AccessKey完成身份验证,AccessKey包括AccessKey IDAccessKey Secret,具体说明如下:

  • AccessKey ID:用于标识用户。

  • AccessKey Secret:用于验证用户的密钥。AccessKey Secret必须保密。

创建阿里云账号的AccessKey

登录RAM访问控制台,使用阿里云账号创建AccessKey。具体操作,请参见创建AccessKey

创建RAM用户的AccessKey

使用阿里云账号登录RAM访问控制台,为RAM用户创建AccessKey。具体操作,请参见创建AccessKey

重要

RAM用户的AccessKey Secret仅在创建时显示,创建后将无法查看。请在创建时进行备份(比如保存到本地),以便您后续查看其内容。

在左侧导航栏选择身份管理 > 用户,单击目标用户登录名称进入详情页,在认证管理页签的用户 AccessKey 区域单击创建 AccessKey

步骤3:开通服务

如果您是第一次使用智能语音交互,推荐您使用阿里云账号开通智能语音交互服务。

进入智能语音交互产品首页,单击开通并购买,然后在产品开通页面,选择服务类型并选中服务协议,单击立即开通,即可开通智能语音交互服务。

类型

说明

免费试用版

默认全部试用(部分服务除外,详见下方说明)。

新开通服务的用户可免费试用3个月,支持2路并发(即同时最大2个任务)或每日2小时的录音文件识别额度。

重要

新用户试用期3个月内,每隔24小时可免费识别2小时时长的文件转写服务。免费额度用完后,间隔24小时后可继续试用。

商用版

选择某个或多个语音服务为商用,开通后按量计费,根据实际使用量从您的阿里云账户余额中扣费。更多信息,请参见计费方式

重要

调用服务时返回错误码40000010Gateway:FREE_TRIAL_EXPIRED),通常由以下两种原因导致:

原因一:试用期已过期。免费试用期为3个月,过期后所有服务(包括一句话识别、实时语音识别、语音合成等)均无法继续使用,需升级为商用版。

原因二:调用了商用版专属服务。以下服务不提供免费试用,即使在试用期内也需开通商用版后使用:

  • 长文本语音合成

  • 录音文件识别(闲时版)

  • 录音文件识别(极速版)

  • 流式文本语音合成(CosyVoice大模型)

  • 语音对话VoiceChat

解决方法:请在服务管理与开通页面,确认服务状态,将所需服务升级为商用版。详细的版本对比,请参见计费项

选择服务版本后,单击立即开通

步骤4:管理项目

登录智能语音交互控制台,创建项目生成对应的Appkey。具体操作,请参见管理项目

步骤5:获取Token

访问令牌( Token)是调用智能语音交互服务的服务鉴权凭证。

说明

快速入门推荐:如果您是首次体验,建议使用通过控制台获取临时Token方式,操作最简单,适合快速测试。正式环境请使用SDK内置Token获取功能。

Token有有效期(通常24小时),过期后需要重新获取。正式环境建议通过SDK自动管理Token的获取和刷新。

获取Token方式

建议使用场景

通过控制台获取Token

仅供测试使用,在控制台获取Token。

通过SDK获取Token

正式环境使用,通过传入AccessKey IDAccessKey Secret,在SDK通过代码定期自动获取Token。

通过OpenAPI获取Token

若对应的编程语言缺少SDK,或者需要控制依赖组件,可以通过OpenAPI获取Token。

步骤6:集成开发

重要

请确保Appkey、AccessKeyToken归属于同一阿里云账号(或同一RAM用户),否则调用会报错。

完成以上步骤后,请根据您的使用场景,选择最适合的入门方式:

入门方式

适合人群

说明

运行示例

开发者

通过curl命令、PostmanSDK快速体验语音识别和语音合成。推荐新手从"一句话识别 curl 示例"开始,只需一条命令即可完成首次调用。

非开发者使用指南

非开发者

通过控制台界面直接体验语音识别和语音合成,无需编写任何代码。

如需了解更多接入方式(RESTful API、移动端、WebSocket等),请参见SDKAPI概览

常见问题

  • 调用服务时报错Gateway:FREE_TRIAL_EXPIRED(错误码40000010)怎么办?

    此错误有两种常见原因:

    原因一:免费试用期已过期。智能语音交互的免费试用期为3个月,到期后所有试用版服务均无法调用。请登录智能语音交互控制台服务管理与开通页面,检查试用版状态。如已过期,请将所需服务升级为商用版。

    原因二:调用了仅支持商用版的服务。即使在试用期内,长文本语音合成、录音文件识别(闲时版/极速版)、流式文本语音合成(CosyVoice大模型语音合成)、语音对话VoiceChat等服务也不支持免费试用,必须开通商用版才能使用。

    具体操作,请参见服务升级与购买。更多错误码信息,请参见错误码查询

  • 哪些服务支持免费试用?

    支持免费试用的服务包括:录音文件识别、实时语音识别、一句话识别、语音合成、说话人识别、声音事件检测、性别识别和语种识别。试用期为3个月,支持2路并发。详情请参见计费项

  • 如何将试用版升级为商用版?

    登录智能语音交互控制台,在服务管理与开通页面,单击对应服务右侧的升级为商用版。开通后为按量计费模式,也可购买资源包进一步降低成本。具体操作,请参见服务升级与购买