个性化人声定制服务可以帮助您通过少量的录音,训练得到自己的声音模型,快速“克隆”个性化的声音,进而使用该声音讲故事、播报天气、读小说、导航播报等。本文介绍如何通过控制台界面定制个性化人声。

使用方式

当前有如下两种个性化人声定制方案:
操作方式适用用户场景使用文档
通过控制台界面定制任何用户30 Min快速体验效果,操作简单。控制台界面定制使用方式
通过OpenAPI定制开发者批量定制个性化音色,通过API来调用,后续也将通过云服务接口使用语音合成。通过OpenAPI定制

计费方式

计费分为个性化人声定制声音个数、语音合成字数两部分收费。
表 1. 定制音色
定制规格规格数量标准价格(元)备注
个性化人声定制10个免费每个账号提供10个免费个性化人声定制声音。
个性化人声定制超过10个60元/个购买入口:登录阿里云智能语音交互控制台,在左侧导航栏,选择个性化人声定制 > 定制声音,单击立即购买
表 2. 使用音色
使用阶段使用方式使用服务标准价格备注
新开通智能语音交互3个月所有方式语音合成免费
已过3个月试用期控制台界面使用【语音合成】商用版3.5元/千次开通商用服务后,可购买资源包进行抵扣,按照梯度计费。更多内容,请参见计费说明
API&SDK接口使用【语音合成】商用版3.5元/千次开通商用服务后,可购买资源包进行抵扣,按照梯度计费。更多内容,请参见计费说明

具体调用文档,详见各个服务的接口说明

【实时长文本语音合成】3元/万字
【异步长文本语音合成】接口服务3元/万字

如有疑问,请添加钉钉群23050005920咨询技术专家。

控制台界面定制使用方式

免费定制

  1. 登录智能语音交互控制台
  2. 在左侧导航栏,选择自学习平台 > 个性化人声定制
  3. 个性化人声定制页面,单击免费定制个性化人声定制
  4. 温馨提示对话框,阅读协议并勾选请认真阅读《个性化人声定制服务协议》,单击确定,开始试用温馨提示

使用手机扫描二维码,定制个性化人声

  1. 个性化人声定制页面,单击定制声音。使用手机扫描二维码,进入人声定制页面。定制声音
    说明 若您是首次定制个性化人声定制,单击免费定制。使用手机扫描二维码,进入人声定制页面。
  2. 个性化人声定制工具页面,单击免费定制或者定制声音,使用手机扫描二维码,进入人声定制页面。
  3. 账号登录页面,请输入您的阿里云账号,单击登录账号登录
  4. 在产品介绍页面,阅读并勾选我已阅读并同意《个性化人声定制服务协议》,单击开始克隆产品介绍
  5. 声音命令页面,设置声音ID选择性别选择使用场景,单击开始录制声音命名
  6. 录制进行中页面,单击点击开始按钮,在安静的环境下,请有感情的进行朗读录制语音。6
    若您读错或者周围噪音过高时,会提示您需要重新录制。3
  7. 录制完成后,单击确认提交,系统会自动进行声音训练。4
    提交成功。提交成功
  8. 训练成功后,您可以在手机端和控制台中试听合成效果。
    • 手机端试听界面。试听效果
    • 控制台试听界面。声音详情
      警告
      • 您需要先选择项目,才能试听(根据此项目来计算调用数量)。
      • 定制的个性化声音模型会与项目绑定,若删除该项目会导致对应的个性化声音模型无法调用,请您谨慎使用删除项目操作。
      试用期过后,使用方式见下表。
      使用声音合成文本的方式需要开通服务开通位置开通方法文本转语音方式
      控制台界面长期使用4语音合成登录阿里云智能语音交互控制台,选择服务管理与开通 > 语音合成,单击升级商用版语音合成区域,选择商用,商用后为付费使用服务。6界面操作,下载音频。3
      控制台界面试用2新开通服务的3个月内,无需开通,免费试听。免费试听免费试听

通过代码调用控制台中定制的音色

  1. 定制完成后,推荐您使用语音合成接口调用该声音。更多内容,请参见语音合成-接口说明
  2. 调用定制声音需要在语音合成页面,将个性化人声的模型调用ID填入voice中,同时还需要您增加定制参数enable_ptts,示例代码如下。
    synthesizer.setVoice("${模型调用ID}");
    synthesizer.addCustomedParam("enable_ptts", true);
    1
  3. 您也可以通过【实时/异步长文本语音合成】来调用,方法与上述步骤一致。更多接口文档,请参见长文本语音合成
语音合成SDK或API调用语音合成登录阿里云智能语音交互控制台,选择服务管理与开通 > 语音合成,单击升级商用版语音合成区域,选择商用,商用后为付费使用服务。6若您单次合成内容小于等于300字,请选择短文本语音合成,控制台界面使用文字转语音,仅支持单次300字以内合成。更多接口内容,请参见接口说明
长文本语音合成SDK调用长文本语音合成登录阿里云智能语音交互控制台,选择服务管理与开通 > 长文本语音合成,单击升级商用版长文本语音合成区域,选择商用,商用后为付费使用服务。7若您合成内容大于300字,选择长文本语音合成,仅支持SDK或API接口使用。更多实时长文本语音合成接口内容,请参见接口说明
异步长文本语音合成API调用更多异步长文本语音合成接口内容,请参见接口说明